« マンガ更新しましたー&拍手レス | メイン | 検索よけー各社の対応状況 »

検索エンジンとブログの関係

ブログは検索エンジンにかかりやすいものだというけど、なんでそうなのか、ちょっと自分なりに整理しようと思いました。

ブログへのルート
【検索エンジン】と【ブログ検索】の違い


検索エンジンブログ検索
巡回方法既に巡回しているサイトからのリンクを伝ってやってくる。Pingサーバーへの更新Pingや、フィード(RSS)リーダーへの登録情報を元にやってくる。
ブログのリンクを伝ってやってくることもあるかもしれない(「ネットを巡回しブログを探している」という言い方をしているブログ検索サイトもあるので)
収集方法HTMLの情報を収集フィードファイル(RSSなど)の情報を収集
※一部はRSSフィードだけでなく、HTML(トップページ)からも情報を収集しているらしい(gooブログ検索とか)
※Googleブログ検索のボットは、HTMLにも一旦アクセスしているらしい(ヘッダーのMETAタグで拒否できるので
↑Googleブログ検索ができるからといって、ブログ検索のボットは全てMETAタグで検索よけできる、とは間違っても思わないよーに!(「ブログにおける検索よけ(ロボットよけ)」参照)
対象サイト内の全てのHTMLブログ内の最新記事(フィード・トップページ)が主
(たまにフラフラ昔の記事にアクセスしているボットがいるけどどこかのリンクから来るのか?)
ボットYahoo! Slurp、Googlebot/2.1、msnbot/1.1、Baiduspider+、Yeti/1.0、etc...Y!J-BSC/1.0、YahooFeedSeekerJp/2.0、Google Feedfetcher Bot、Hatena Antenna/0.5、livedoor Reader、DrecomBot/1.0-RSS、Technoratibot/0.7、etc...
要は、検索エンジンのボットとブログ検索のボットは「違う」。
検索エンジンはgooやらBIGLOBEやらexciteやら、いろいろポータルサイトがあるけど、実はYahoo!やGoogleが各ポータルに提供している、という状態。(参照:「検索エンジン相関図」αSEO)
ブログ検索は、各社がボットを持っている。登録フィードを定期的に巡回してるボットもいれば、ネットをブログを探して徘徊していたりするボットもいるんだろう多分。


更新Pingからインデックス化まで



※ポータルサイト…FC2ブログとかSeesaaブログとかgooブログとかLivedoorブログとかの、ブログサービスのトップページ。

「更新Pingを打つと検索にかかりやすい」って何でそうなるんだろう?と考えてみた図。
いや、更新PingってPingサーバーに行くので、ブログ検索には行くだろうけど、ルート的に検索エンジン(GoogleとかYahoo!とか)と接点がない気がするんだけど、とずっと思っていた。
もしあるとしてもポータルにある「新着情報」だけども、ごまんとあるブログから放たれるので、流れるのも早いから確率としてはとっても低いような気がする。
こういったポータルサイトの場合、クローラーが来る頻度も非常に高いと思うので、それもありなのか(うちのブログでさえ、記事を投稿すると数分でGoogleとかYahoo!に反映されてることがあってびっくりする。即時反映が業界の流れになってきている、とはどこかのニュースで見た)。

フィードと検索

誰かがフィード(RSS)リーダーにブログを登録

フィードリーダーのボットがトップページヘッダーにある、オートディスカバリーの記述を発見
<link rel="alternate" type="application/rss+xml" title="RSS2.0" href="http://*/index.xml" />
<link rel="alternate" type="application/rss+xml" title="RSS1.0" href="http://*/index.rdf" />
<link rel="alternate" type="application/rss+xml" title="ATOM" href="http://*/atom.xml" />
こんなやつ。

発見したフィードURIを登録し、定期的に巡回

ブログ検索にインデックス

トラックバック

トラックバックPingを相手のブログに送る

自分のブログ記事の概要とブログ記事タイトル、ブログ名が相手のブログに反映される

相手のブログに検索エンジンボットがやってきて、クローリング

トラックバックのリンクを伝って、自分のブログにやってくる

ブログをクローリング

検索エンジン(ブログ検索)にインデックス

これで「検索エンジンにかかるには」、「検索よけするには」何が必要なのかがなんとなくわかるのではないかなーと。
ただ、別に研究してるわけではないので、違ってることもあるかもしれないし変わることもあるかもしれない。

グッジョブだったらポチッと→

コメントを投稿

月別アーカイブ

2017年
2016年
2013年
2012年
2010年
2009年
2008年
2007年
2006年
2005年
2004年
           

Blogのフィードを取得

Powered by
Movable Type 6.3.3