Googleのクロール・キャッシュリンク・インデックスでアクセス増加!
様々なサポートサービスやツールの登場により、今やWebサイトを作ること自体は難しいことではなくなりました。しかし思う様にアクセス数が集まらず、悩んでいる人も多いのではないでしょうか。そこで今回は、サイトを検索上位に表示させる為に役立つGoogleのクロール・キャッシュリンク・インデックスについて解説していきます。
クロールとインデックスの関係性
インターネットをする際、検索エンジンに語句を入力したら一瞬の内に目的の情報が表示されますが、これを可能にしているのが“クロール”や“インデックス”です。Webサイトを検索上位に表示させる為には、まずはこの知識が必要です。
クロールとインデックスは検索エンジンに深く関係する機能
“クロール”や“インデックスは検索エンジンのシステムに不可欠な存在です。理解する為にはそれぞれの働きと併せて、相互関係を把握しておく必要があります。
ネットの普及の影響で開発されたロボット型検索エンジンシステム
検索エンジンのシステムも“ディレクトリ型”と“ロボット型”があります。ディレクトリ型は検索エンジンにサイトの運営者やサービスの提供者が人手で情報を登録する仕組みで、まだwebサイトの数も少なかった時代には主流のシステムでした。しかしインターネットの普及と共に手作業では登録が追い付かなくなった為、ロボット型が開発されたのです。
クロールしてサイトのデータを集める
ロボット型エンジンでは“クローラー”や“スパイダー”と呼ばれるソフトウェアがインターネット上のwebページのリンクを辿りながら巡回してそのデータを収集していきます。これが「クロール」と呼ばれる作業です。クローラーが自動で情報収集することによって膨大な情報を管理できる点がロボット型エンジンの特徴と言えるでしょう。現在ではGoogleを始め、多くの検索エンジンでロボット型とディレクトリ型の両方が使用されています。
インデックスとはデータベースに登録すること
取得されたデータは解析・加工されデータベースに登録されます。登録することを「インデックスする」と言います。Webページはクロール・インデックスの双方を経て、検索結果として表示されるわけです。
意図的にクローラーを呼び込みインデックスさせることも可能
いくら質の高いWebサイトを作っても、Googleにクロールされなければ検索結果に表示されません。しかしクローラーの巡回頻度が上がる様に仕向けて、効率的にサイトの情報を検索結果に反映させるテクニックがあるのです。
サイトマップを送信しインデックスさせる
サイマップとは文字通りサイト内の地図の様な機能を持つページのことで、検索エンジンがサイトの構造を把握する際にも役立ちます。一般的にクローラーはリンクを辿って巡回しますが、Googleにサイトマップが送信されていればそれも参考にWebサイト内の各ページを巡回するのです。サイトマップの送信は公開したばかりのサイトや、内部のリンク構造が複雑なサイトの場合等に効果的なテクニックと言えます。
サイトを頻繁にアップデートする
Googleはページやリンクの追加、コンテンツの新規作成等更新頻度が高いサイトには頻繁にクロールする傾向があります。ただしサイトの更新をする際、他人のウェブサイトのコンテンツをコピーして追加した場合等不正をした場合には、むしろ検索順位が下がることになります。検索エンジンの主目的はユーザーの利益にかなうページを検索結果として返すことなので、この処遇は至極当然と言えるでしょう。あくまでもサイトの質を高めることが重要なのです。
インターネットの利便性を支える“キャッシュ”
“キャッシュ”について聞いたことはあるものの役割は知らない人が多いのではないでしょうか。キャッシュはインターネットシステムの中で重要な役割を果たしています。ここではキャッシュとキャッシュリンクを解説します。
キャッシュの役割は2つ
キャッシュの役割は大きく「データを一時的に保存すること」と「サイトを検索インデックスに登録すること」の二つに分かれます。つまり、サイトの作り手と閲覧者の双方に役立つのです。
ページ情報を一時保存する役割
検索エンジンとしてのGoogleで言う“キャッシュ”はクロールされたページの情報をGoogleのサーバー内に保存することを指します。頻繁に使われるデータを記憶装置に一時保存しておくことにより、必要な時にデータを手早く取り出せるのです。またキャッシュを削除することも可能です。ブラウザーでキャッシュを保持している場合、保持しているキャッシュが優先されてしまい、サイトを更新しても新しい内容が表示されないことがありますが、キャッシュを削除すれば更新された内容を表示させることが可能です。
サイトの評価の一要素としての役割
キャッシュのもうひとつの役割はサイトを検索インデックスに登録することです。ただ、キャッシュがそのまま検索結果として表示される訳ではありません。まずサイトの被リンク数やコンテンツ、キーワード等キャッシュで得た情報を元に“検索アルゴリズム”と呼ばれるシステムがサイトを分析・評価します。そしてそのデータが検索インデックスに登録されて初めて検索結果ページに表示されることになります。つまりキャッシュにはサイトの評価材料としての役割もあるのです。
ページタイトル付近に表示されるキャッシュリンク
検索結果のページタイトル付近に表示されるキャッシュのリンクをキャッシュリンクと言います。検索キーワードをハイライトで表示していてページ内でキーワードが分かり易くなっている等、様々な利点があります。
最近のページ情報を見ることができる
Googleの検索結果に表示されたキャッシュリンクをクリックすると、Googleが直近にこのページをキャッシュしたページ情報を見ることができます。リンク先のページでは検索キーワードが分かりやすい様にハイライトで色付けされて表示されます。ただ、キャッシュリンクの内容は一時保存の際のものなので、リアルアイムで存在しているサイトのコンテンツとは異なることもあります。
キャッシュリンクでもサイトにアクセス可能
サーバー障害等によりWebサイトの読み込みに時間がかかったり、一時的に閲覧できない場合には、代わりにキャッシュリンクを使用することでWebサイトにアクセスすることが可能になります。
インデックスの削除原因と復活方法
webサイトをインデックスした場合でも、何らかの理由で検索エンジンによって削除されるケースもあります。しかし、正しい対処をすれば復活することがほとんどです。
インデックスの削除原因は様々
インデックスは一度登録したら終わりではありません。検索エンジンから削除されることもあるのです。削除理由はペナルティーを受けたことやサイト管理者の誤操作によるもの等、様々です。
ペナルティーによるもの
サイトを検索上位表示させるための施策をSEO(検索エンジン最適化)と言いますが、検索エンジンの主目的は良質なページを表示させることです。そのためGoogleではサイト運営の指針『Googleウェブマスターガイドライン』を設けています。そしてガイドラインに違反する場合には、インデックスを削除する等の“ペナルティー”を科すことがあるのです。例えば、SEOの為にWebサーバーに細工を施しクローラーには一般の閲覧者と別の内容を見せる“クローキング”はガイドラインに反する悪質な行為であり、重いペナルティーが科せられます。
“タグ”の設定ミス
ホームページは画像やテキストだけで構成されているかの様に見えるかもしれませんが、実はこれらは全て“タグ”と呼ばれるアルファベットや数字や記号の列挙によって表現されており、Webブラウザーを通じて画像やテキストを変換させているのです。タグはサイトの名札の様な役割を担い、タグが無ければ検索エンジンにクロールされません。しかしタグの設定を誤るとインデックスが削除されることがあります。
例えば、通常「robots.txt」はサーバーの負荷を抑える為にクローラーの巡回を拒否するタグですが、誤って設定するとインデックス削除が起こってしまう可能性があるのです。また内容が薄い記事等のコンテンツや上位表示が見込めない様な記事を検索エンジンにインデックスさせない様に通知する「noindex」がタグを設定されている場合はインデックスされません。
インデックスの復活方法もある
インデックスが削除されてしまっても慌てることはありません。インデックスを復活させる方法もあるのです。しかし削除された原因によって復活する方法も復活までに要する時間も異なるので注意が必要です。
ペナルティーの解除申請を行う
ペナルティーが原因でインデックスを削除された場合、多くはペナルティーを解除してもらえる様Googleに申請することで復活します。ガイドラインに違反していることが分かったらまずはペナルティーの対象となった行為を改善し、解除申請を送ります。ここで覚えておかなければならないのは、“再審査リクエストはロボットが判断するのではなく、実際にスタッフが読んでいる”点です。そのため、何処をどの様に修正したのかを分かり易く伝えることが重要なのです。
Search consoleの機能を使う
Googleが提供しているサイトの管理者向けのツール“Search console”の機能を利用してインデックスを再度登録すること可能です。ツール内のクロールからFetch as Googleへと進み指示に従ってインデックス要求を行えば完了です。この場合、比較的短期間でインデックスが復活します。尚Search consoleを利用するためにはGoogleのアカウントを登録しておく必要があります。
検索上位に表示されるサイトを作るためには検索エンジンの仕組みや周辺知識を理解することが必要です。加えて、SEOに躍起になるあまりサイトのコンテンツを疎かにしないようにすることも重要ですから、知識を得る努力をするとよいでしょう。