Web検索エンジン (Web search engine)

検索サービス

検索エンジン サービス API
Google (各国のGoogle) Googleのサービス Google API
Yahoo! JAPAN Yahoo!のサービス Yahoo! API
Bing Bingのサービス Bing API
Яндекс (ロシア語) Yandexのサービス Yandex API
Yandex (英語)
百度 (中国語) Baiduのサービス  
Baidu (日本語)
Cốc Cốc (ベトナム語)    

さまざまな事業者により検索サービスが提供されていますが、他社の検索エンジンを利用して提供されるものもあります。Based on - List of search engines - Wikipedia

実際にどの検索エンジンを用いているかは、User-Agentをタイトルで返すページ、たとえば「useragentstring.com」をキーワードに検索することで推測できます。

検索サイトのクエリ ストリングの仕様

匿名検索エンジン (Anonymous Search Engine)

利用者の情報を記録しないことを標榜している検索エンジンもあります。これらはSSLによる暗号化通信を利用しているため通信内容は保護されますが、本当に情報を記録していないかは不明です。

このうちStartpageは、検索結果のページへのアクセスをStartpageのサーバを経由して行えます。これにより閲覧するWebサイトに対しても、匿名性を保てるとしています。「匿名ネットサーフィン」うたうStartpageプロキシサービスが公開 - ITmedia ニュース (2010/01/29)

検索エンジンのシェア

ディレクトリ型 検索サービス

ディレクトリ型の検索サービスでは、同類のウェブサイトが階層構造で管理されており、特定分野の情報を探しやすくなっています。またそのデータベースは人手によって管理されているため、外部からの機械的な情報操作の影響を受けにくいものとなっています。

List of web directories - Wikipedia

検索サービスの限界

深層Web (Deep Web / Invisible Web / Hidden Web)

検索エンジンがインデックスできない情報は検索結果に現れることはなく、それらは深層Webなどと呼称されます。ディープWebとは|インビジブルWeb|深層Web|deep web - IT用語辞典 e-Words

検閲

Googleは2010/03/22、中国での検索サービスにおける検閲の撤廃を表明しました。ASCII.jp:Google、中国の検索検閲撤廃、香港経由で継続 渡辺隆広 (2010/03/23)

このこと自体は利用者の利益となることですが、検索サービスは政府の求めに応じて検閲を行うことがあるという事実には注意が必要です。

リアルタイム検索

おもにTwitterやFacebookなどのSNSを対象にする検索サービスです。

SNSが提供する検索サービス

特定のSNSに限定して検索するならば、そのSNSによって提供される検索サービスが利用できます。

画像検索

類似画像検索

類似画像検索とは、画像をキーにして画像を検索するサービスです。

動画検索

Video search engine - Wikipedia

音声検索

Audio search engine - Wikipedia

検索エンジンの仕組み

  • クローラー (Webクローラ / 検索ロボット)
  • インデクサ
  • 検索サーバ

Webクローラ (検索ロボット)

Webクローラとは、検索エンジンのデータベースを作成するための情報収集プログラムです。Webサイトの管理者はこのWebクローラに対して、サイトの情報を収集する方法を次のように指示できます。

Webサイトの登録指示

Webクローラへの指示では情報が収集されるのを待つだけですが、いくつかの検索エンジンでは、サイト管理者側からの登録要請を受けつけています。

検索エンジン 登録ページ
Google Google に URL を追加
Yahoo! 検索エンジン用ロボットの巡回先への推薦
Bing Bing - 自分のサイトを Bing に登録する
Baidu 検索全般について (サイト登録)

逆に検索エンジンに登録されるのを拒否するには、noindexで指示します。

検索結果への広告の掲載

管理しているサイトへの訪問を促すために、検索エンジンの検索結果にサイトへのリンクを表示させることができます。見方を変えると、検索結果にはそのように操作された情報が含まれているとも言えます。≫リスティング広告

Google

Yahoo!

複数の技術系サイトから、まとめて検索