検索におけるコツ

最近になって検索サイトでは「検索しても情報が出てこない現象」が急増しています。

いわゆる「ググってもカス」と呼ばれるクソ現象です。(原因については後述)

 

このページではN121MTがどう検索しているかのコツをメモとして書いておきます。

もしかすると誰かのヒントになればなということで。

 

ちなみにこのページは「ゲームの攻略情報」だとか「急を要さない検索ワード」がメインです。

一応ページの下に急を要するワードに対応しそうなツール等を紹介していますので、その手段を取るのも有りです。


サイトの優先順位を考える

ひとまず検索ワードの効率化よりも、まずはどこの情報を見るかがポイントになります。

よって、以下のような優先順位を勝手につけています。

  • 公式サイト(会社とか病院とか政府とか)
  • Wikipedia
  • QiitaやGitHub等のエンジニア系サービス
  • ニコニコ大百科やピクシブ大辞典など
  • Seesaaやatwiki等の個人Wiki(Fandom等も含)
  • 明らかに個人で運営しているサイト
  • ブログ
  • 5chのスレなどの掲示板
  • TwitterなどのSNS

ゲームの攻略等であれば、まずは公式サイトやそのゲームのまとめWikiを見るのが先決。

HTMLやJAVA等の技術系であれば、Qiitaなどのエンジニア系サービスを優先的に見る。

何か情報等の概略を見たかったらWikipedia等の助けを借りる。

そんな感じで検索結果のサイトを選んでいます。

 

死語になってしまったとされる「ネットサーフィン」ではないんですが、どこの波(サイト)に乗るかはその人の技量(見抜き力?)に依存します。

かつて巨大掲示板を管理していた名言の「うそはうそであると見抜ける人でないと難しい」は、こうしたことも関係しています。

 

遊び全開でやるなら優先度を逆にしてみたり、個人サイトばっかり漁るのも良いでしょう。

本来の「ネットサーフィン」の正しい意味はこれであり、一度やると何か分かるかもしれません。

(ただしセキュリティ対策はしっかりしておかないとウィルス踏んで終わりもあるので要注意!)

検索ワードを変えてみる

現在のGoogle等では、話し言葉でも検索できるようになりました。

特に「Ok Google」の音声認識では入力上助詞が付きやすいので、あえて助詞を付けたほうが良い結果が出る場合もあります。

 

より効率的に行うには、単語ごとにわけるのがベストな時代もありました。

「N121MT ぬいぐるみ レースゲーマー」のように検索対象関連する単語を入れる。

技術系で効果を発揮し、サンプルのページやソースなどにすぐたどり着けます。

(「Javascript click button」とかで検索すると、HTMLのbuttonタグを押したら実行するJavaScriptのコードにたどり着くとかよくあります)

現在も有効な手段ではありますが、それよりも文章で聞いた方が早いことは増えています。

あと、後述するワードサラダなどの問題でこの戦略が通用しない場合もありますし。

 

また、単語について更に抽出したい場合は「"」(ダブルクオーテーション)をつけて検索もします。

長い単語だと複数の単語と判定して分割するので、強制的に1単語とするには「"」を付ける必要もあります。

最近は長大語を優先する傾向も無くはないですが、念の為に行うことが多いです。

国の選択

技術系とかになると日本語だけでなく、英語や中国語のサイトが出てくることもしばしばあります。

もちろん日本語を選択したいところですが、検索対象によっては英語のほうが豊富になる場合もあります。

逆に日本語は「いかがでしたか?」と結局理解できない記事にたどり着くなんてことも。

(というか近年は機械翻訳による悪質なオートキュレーションサイトが増えてるような……)

 

ただ英語や中国語についても、なるべく公式のサイトを使用する必要があります。

Visual BasicならMicrosoft、OracleならOracle、PythonならPython。

説明書を読めと同じノリで、公式のマニュアルからスタートするのが一番安全です。

それこそ野良サイトとかになると、いきなりウィルスに感染なんてことも考えられますので。


別のツールもあるよ

Google検索が使い物にならないということで、使い物にしようとするツール独自の検索エンジンを開発する人も居ます。

もしかすると以下の検索エンジンの方が強いこともあるので、試す価値はあると思います。

2022年2月19日に公開されたGoogle検索の支援ツールです。

ツールとしては「Google検索」に検索オプションをつけた検索を行うというものです。

 

プリセットには「学校や病院などの公的機関のみ」「国内論文のみ」「pdfのみ」などが選択できます。

論文やしっかりと落とし込まれた情報はpdfとして出力されていることが多いようです。

このため病気や育児などの医療関係のページでは非常に有効とされています。

 

検索ボタンを押したあとはGoogle検索の結果がそのまま表示されます。

なのでより拡張検索をしたい場合は、そのページからオプションを追加したり削除したりすることも可能です。

(もちろんそれらのオプションやワード追加等は検索力が試されてしまいますが……)

 

近年はCMS(コンテンツマネジメントシステム)の乗っ取りで正しいドメインでも余計なページが作られているパターンもあります。

この場合、例え「ac.jp」や「go.jp」と付いていても無関係に貫通するので要注意です。

また不正な方法でac.jp系を取得する悪質なページにも対応しきれない弱点もあります。

2016年頃に公開された検索エンジンを利用したフィルターツールです。

上記のまとも検索と同様に検索オプションを付けたGoogle検索の結果をページ内に表示するツールとなっています。

 

まとも検索とは異なるプリセットが存在していたり、またGoogle以外の検索エンジンを利用することも出来ます。

こちらは商品レビュー、仕事や論文の調べ物、観光地・グルメ検索で有効とされているようです。

Chrome系のブラウザでは「ノイズレスサーチ+」というアドオンも存在しています。

 

こちらもまとも検索と同様に、CMSの乗っ取りには対応しておりません。

リスクの観点ではむしろこっちの方が高いかもしれません。

(というよりCMSレベルで乗っ取られた場合はこれらのツールでも限界と言えます)

2019年11月26日に公開された、これも検索エンジンを利用した検索ツールです。

こちらは上記のまとも検索等とは違って、事前にSiteフィルターを仕込んで検索するものとなっています。

プリセット等はありませんが、攻略サイトで企業系を除外しているのでゲーム攻略の検索で有効とされているようです。

 

CMSの乗っ取りは企業系などの大手サイトを狙うのが旨味があるため、ある程度は強いと考えてよいでしょう。

とはいえ個人サイトのCMS乗っ取りも当然あるので、それには対応しきれません。

またフィルターは拒否リスト方式なので、新進気鋭のサイトにも対応しきれない弱点もあります。

2017年に公開された独自の検索サイトです。

Googleなどの既存の検索サイトを利用するノイズレスサーチやまとも検索と違って、完全に独自の検索サイトとなっています。

(エンジンやサーバは「Fess」というオープンソースの検索サーバを基盤にしているようです)

 

検索結果は大手新聞社や政府などのサイトを許可リスト方式に登録し、それを優先的に表示するようになっています。

このため悪質なまとめやキュレーションなどのサイトは後ろの方に出てくるとのことです。

許可リスト方式なので、不正に取得したサイトも出ないようになっています。

 

流石に許可されたサイトのCMSが乗っ取られると無効とはなる弱点もあります。

ただリスト内のサイトはすぐには更新されないのである程度の強さもあるようです。

 

ちなみにこれと近いノリとしては、老舗の『Yahoo!きっず』が該当しています。

ただ『Yahoo!きっず』は子供向けの機能が搭載されまくっているので、一般的な検索では『知禅』の方が分があります。


かつてのサイトはどうするか

基本的に「現存しているサイト」のほとんどが検索サイトの結果に表示されます。

既に存在していない検索避け結果から除外されると表示されないということになります。

  • 既に存在していない

特にジオシティーズやインフォシークの終了によって情報が消えたのはかなり痛いです。

インターネットの情報が永久にあるというのは「単なる机上の空論」だったと言えます。

 

有名なサービスであれば有志によるアーカイブサイトもいくつか存在しています。

しかしアーカイブサイトも無限に続くわけでもないので、この問題から逃れるのは難しいです。

そのサイトにも無い場合、『Wayback Machine』などしか方法がないという状況になります。

  • 検索避けや除外されている場合

検索避け等を設定したサイトだと、Robots.txtでアーカイブも保存しない設定もあります。

設定を行うと『Wayback Machine』などもアーカイブを保存しないようになります。

 

こうなった場合、Twitter等の集合知現実世界にあるアナログな手段を検討すべきです。

 

また、この検索サイトから単に除外されている場合、別の検索サイトから使うのも有効です。

(Googleが大手だとしてもGoogle八分の問題で表示されないことがあるようです)

意外と「Yahoo!でGoogleする」とかで見つかるとかもあります。


そもそもの要因

そもそも「ググってもカス」になる要因って、以下に集約されているような気がします。

  1. Google側がカスになった(「Google八分」に限らず、Google自身が見つけられなくなった)
  2. Googleから先がカスになった(いわゆるワードサラダなどで最後の「いかがでしたか?」)
  3. Googleのユーザがカスだった(マップ等における口コミが役に立たないとか)

このサイトを持っておいてその言い草は無いだろ感はありますが、

Googleなどの検索サイト側の見極め能力が劣化したのは否めない気がします。

確かに全方位に目は向けていますが、最初に出てきたものが無用なサイトとか、よくあります。

(人によっては2番目だったりとかページ2を選ぶ人とかもいました)

 

そして問題なのが「まともそうに見えて実は悪質なまとめサイト」の存在でしょう。

単なるパクリサイトだったりとか、有用そうに見えてガチ無用だったとか。

マルウェアなども無ければ悪意もないけど、病気とかで必死に治療法とかを探してギャグやネタ的な対策を示されても笑えません。

嫌なら見るな、という言葉もあるんですが、今の状況でそうも言ってられないのもまた事実です。

しかもCMSの乗っ取りでまともなサイトなのに余計なページを作られて要らぬ不評も買うという。

ちょっと可哀想な気もします。

 

口コミについても、むしろ無い方が良いんじゃないかって思っているぐらいです。

特に病院とかの「医療関係の施設」に口コミなんて必要なのか感があります。

それこそ「行けばわかるさ、行かないと不明」だし、緊急時って評判関係なく駆け込むはずですし。

非常事態にGoogle検索する暇があるならおとなしくスマホで緊急通話せよと思いますが)