Google検索のインデックスを確認する方法とされていない場合の対処法

Googleにインデックスされているかどうかを正しく確認する方法を解説します。

Google検索のインデックスを確認する方法とされていない場合の対処法

Webサイトの各ページのURLとその中身をGoogleの検索エンジンに認識してもらうことをインデックスされると言います。

Googleのクローラーがインターネット上のWebページを巡回し、各ページの情報を検索エンジンのデータベースに登録(インデックス)していきます。Webメディアの記事を追加しても、Google検索に表示されない場合にはそのページが正しくインデックスされていない可能性があります

この記事ではGoogle検索に特定のページが正しくインデックスされているかどうかを確認する方法と、正しくインデックスされていない場合の対処法について解説します。

Google検索にインデックスされているかを確認する二つの方法

インデックスを確認するには大きく二つの方法があります。自分のサイトのインデックスを正確に把握するにはSearch Consoleを使う方法を利用し、他のサイトも含めて簡易的にインデックスを確認するためにはsite: コマンドを利用します。

Search Consoleを利用する(おすすめ)

Search Consoleを利用すると、そのサイトの正確なインデックス状況が分かります。Search Consoleは、自分のサイトのGoogle検索でのパフォーマンスを確認したり、サイトの問題を検出して修正や最適化したりすることができるツールです。

まずはサイト全体のインデックス状況を把握してみましょう。Search Consoleには各ページのインデックス状況を確認することができるカバレッジのレポートがついています。Search Consoleのメニューの『カバレッジ』にアクセスすると以下のようなページが表示されます。

Search Console カバレッジレポート

カバレッジレポートには4つのステータスがあり、それぞれのページがいずれかのステータスに分けられて判別されています。

エラー

何らかの要因でインデックスに失敗したページです。ここに分類されているページはGoogle検索上で表示されないため、アクセス数に悪影響が出てしまいます。カバレッジレポートの下部にエラーの詳細が表示されるため、それぞれの要因に対して対策をしましょう。

有効(警告あり)

インデックスには登録されているものの、何らかの問題があって警告が出ている状況です。警告は必ずしも悪い意味ではないですが、Googleの検索エンジンが判断に迷うような内容の警告が出ている場合には対処することでより正確な情報を届けることができるようになります。

有効

正しくインデックスに登録されています。理想的には全ての望んだページがこのステータスになっていると良いでしょう。『インデックス登録されましたが、サイトマップに送信していません』の表示になっている場合は、サイトマップにURLを追加してSearch Consoleに読み込ませるようにしましょう。

また、本来はインデックスさせたくないページが『有効』のステータスになっている場合にはnoindexタグなどでインデックスから除外するための対応をとりましょう。

除外

『エラー』とは違い、意図的にインデックスに登録されていない状態です。noindexタグなどで除外したページやインデックスに登録済みのページと重複したページが該当します。

カバレッジレポートのステータスの詳細についてはGoogleのヘルプページでも確認することができます。

また、個別のページのインデックス状況を知りたければURL検査を行うことができます。左側のメニューの『URL検査』をクリックして特定のページのURLを入力すると、そのページのインデックス状況が分かります。

Search Console URL検査

インデックス情報だけではなく、最後のクロール日時やユーザビリティに関する内容も確認することができます。ページがインデックスされていない場合には『インデックス登録をリクエスト』ボタンを押しておきましょう。新しいページを追加したときにもこの方法でページを登録しておくと検索エンジンにインデックスされるのが早くなります

site:コマンドを利用する(簡易的な方法)

簡易的にインデックス状況を確認する方法もあります。

Google検索の最初にsite: を入力することで、指定したサイトのURLに絞って検索をかけることができます。たとえば、site:example.comをGoogle検索に入力するとexample.comのドメインのページが検索結果に出てくることになります。

Googleにインデックスされているページであればこの方法で検索結果に出てくるため、簡易的にインデックスされているかを確認するのに便利です。この方法であれば他のWebサイトに対しても大まかなインデックス状況を確認できます。

ただし、この方法はあくまで簡易的な方法です。site: コマンドはサイト内検索用のコマンドであり、指定したWebサイトに絞って検索をかけることが本来の目的になります。また、Google検索の1ページ目の検索結果のヒット数はあくまで概算値であることが多いため、正確にそのサイトのインデックス数を把握することができません。

個別のURLでインデックスする際にどのようなエラーや警告が出ているかも把握できないため、自分のサイトのインデックス状況を確認するためには必ずSearch Consoleを利用するようにしましょう

インデックスされない主な原因とその対処法

望んでいるページがインデックスされていない場合には対応が必要です。Google検索にページがインデックスされない主な原因別に、その対処法を紹介します。

原因①クローラーがまだ来ていない

一つ目の原因は、Google検索のクローラーがまだWebサイトに回ってきていない場合です。

特に新規のWebサイトを立ち上げたばかりの時にはGoogle検索はWebサイトの存在を知りません。そのため、Webサイト自体やそのサイトの各ページの存在を知ってもらうためにサイトマップの追加をする必要があります。

Webサイト内のページでインデックスしてもらいたいURLを、XMLサイトマップとして/sitemap.xmlなどのパスにアップロードします。そのURLをサーチコンソールから送信することで、Google検索が適切にWebサイトの構成を把握し、インデックスを進められるようになります。

(参考)Wagtailでサイトマップを作成する

Search Consoleの『サイトマップ』タブから、自分のサイトのサイトマップのURLを入力すると、GoogleのクローラーにインデックスしてもらいたいURLを伝えることができます。

Search Console サイトマップの送信

また、URL検査を行うと個別のページにクローラーを回してもらうこともできます。Google検索のクローラーは基本的にはサイトマップをもとに定期的にサイトを巡回していますが、サイトの設計が甘い立ち上げ初期のころはうまくページを回ってくれないこともあります。最初のうちはページを追加するごとにURL検査から『インデックス登録をリクエスト』をしておきましょう。

原因②クローラーが新規ページにたどり着けない

二つ目の原因は、クローラーが新しいページにたどり着けない場合です。

クローラーはサイトの中のリンクを辿って新規のページを探したりアップデートを確認したりしています。そのため、クローラーが巡回しづらい構成のサイトからは新しいページを見つけることができない場合があります。

クローラーが巡回しやすいサイトにするためには内部リンクを適切に張る必要があります。以下のような形で、Webサイト内のそれぞれのページがつながるようにしておきましょう。

  • ヘッダーやフッターからのリンク
  • カテゴリ・タグページからのリンク
  • パンくずリスト
  • サイドメニューのおすすめ記事・過去記事
  • 記事の中から別の記事へのリンク

新しくページを追加した際にもこのような形でリンクが張られるようにすると、定期的なクローラーのアクセスでもページが見つかりやすくなります。Webサイトの初期の設計の段階で内部リンクの設計も意識しておきましょう。

原因③エラーやその他の原因

その他、意図しない形でインデックスがなされていない場合もあります。

特定のページでnoindexタグなどを設定している場合や、Google検索のクローラーがアクセスできないようなrobots.txtの設定になっていることがあります。また、コンテンツの内容が極端に薄い場合や、他のサイトのコンテンツと重複しているとみなされた場合にもインデックされない場合があります。

こちらはSearch ConsoleのインデックスレポートやURL検査で各URLの状況を確認し、それぞれのエラーの内容に従って対応を進めてください。

Google検索に適切にインデックスされているかどうかはSEOの根幹部分になります。適切な対応をしてしっかりとオーガニックからのアクセスを獲得するようにしましょう。