インデックスとは?確認方法とSEO上の効果

更新日: 公開日:
インデックスとは?確認方法とSEO上の効果

インデックスとは、作成したWebページが検索エンジンのデータベースに登録されることです。ここでは、インデックスの概要や、より効果を出すための注意点などについて、詳しく解説していきます。

この記事のポイント

          
  • インデックスとは、作成したWebページが検索エンジンのデータベースに登録されること
  •       
  • インデックスされないと、検索結果に表示されないため、SEOの基本ともいえる
  •       
  • SEOで重要なのは、インデックスの数ではなく、“質の高い”ページがインデックスされることである

\SEO内製化支援プランの資料ダウンロードはこちらから/

インデックスとは検索エンジンのデータベースに登録されること

インデックスとは、検索エンジンのデータベースに、ウェブページが登録されることです。

インデックス(index)とは非常にさまざまなシーンで用いられる用語で、それぞれ異なる意味で使われます。本来インデックスとは「索引」「見出し」などの意味をもつ言葉です。

データベースに関わるシーンで用いられる際には、格納されたデータをより早く検索したり抽出できるように作られたりする索引データのことを言います。

SEOにおける「インデックス」とは、クローラーが収集したウェブページのデータを検索エンジンデータベースに整理された状態で格納されることを指し、「インデックス化」「インデキシング」などといいます。

SEOでは常用語として「インデックス化される=インデックスされる」と表現しています(特にこのあたりの厳密な言葉の使い方に細かくこだわる必要はないとは思いますので当サイトでもその使い方で統一しています)。

インデックスとはページがGoogleのデータベースに登録されること

実際には検索エンジンクローラーがウェブページのデータを収集した後にそのままの形でインデックス化されるわけではなく、一旦「インデクサ」と呼ばれるプログラムによって検索エンジンにとって処理がしやすいデータに変換する中間処理が行われ、その変換されたデータがインデックス化されます。

参考:インデクサの役割と中間処理 | SEO検索エンジン最適化

SEO上での効果

検索エンジン上での露出を増やすにあたっては、何より公開したウェブコンテンツが正しく検索エンジンにインデックスされていることが大前提にあります。データベースに登録された、つまりインデックスされたページが、検索結果に表示されているからです。

いくらランキングを向上させるための施策を講じたところで、そのページがインデックスされておらず、そもそもランキングの対象になっていなければその施策に効果はありません。

ページ数の多いサイトはサイトの構造が複雑になったり、サイト階層が深くなったりしやすくなるため、クローラーが適切に(狙い通りに)クロールし、インデックスできるように配慮するのは必要不可欠です。

クローラーへの配慮をおろそかにした結果、せっかく公開したページがなかなかインデックスされなかったり、正しく認識されなかったりすることは特に珍しいことではありません。

以下のようなサイトは特にクロールされやすいように施策を打つべき

例えば、大学受験生がいくら頑張って受験勉強を行ったところで、願書の提出を忘れてしまったらどんな大学でも不合格どころか受験資格すらありません(※筆者経験談)。

検索エンジンも同様に、まずはウェブウェブページを正しくインデックスさせられる、ということがSEOの大前提になります。

Google検索におけるインデックスの流れ

国内の利用者が最も多いGoogle検索ではどのようにインデックスされるのでしょうか。流れを確認しましょう。

Google検索におけるインデックスの流れ

画像引用元:JavaScript SEO の基本を理解する | Google 検索セントラル | Google Developers

基本的な流れとしては、①クロールキュー(検出)→②クロール→③レンダリング→④インデックスと押さえておけば大丈夫です。

①クロールキュー(検出)

前提として検索エンジンはページをURL単位で認識します。例えば、末尾のスラッシュのありなしでも別のURLと認識します。そして、この検出のタイミングでクロールするURLを発見し、キューとして(イメージとしては)リスト化していきます。検出したURLに対しクロールしていくわけですね。

そのため、まずは検索エンジンがそのページ(URL)を見つけることができるようにするのがポイントです。

この際、内部リンク、外部リンクやXMLサイトマップが検出の主な手段となります。そのため、新規サイトや、内部リンクが設定されていない孤立したページなどは、検索エンジンがなかなか見つけられないということもあります。

②クロール

①で検出したページ(URL)に対し、検索エンジンはクロールをしていきます。詳しくは下記の参考記事を確認していただきたいのですが、ページの情報を取得するイメージを持っていただければと思います。

よって、この際のポイントとしては検索エンジンがURLにアクセスできるようにrobots.txtで不要なクロールのブロックをしないことや、クロールの負担を減らすためにURLの正規化、不要なページを生成しないようにサイトの環境を整えることがポイントになります。

③レンダリング

検索エンジンはそのページをインデックスして問題ないかを判断するために、レンダリングという我々がブラウザでページを見るように描画する作業を行います。②のクロールで取得したデータを元にページを描画していると考えていただけると良いかと思います。

この作業を行うことで視覚的にページ内容の把握や、表示できないリソースの存在の認識が可能になります。

なお、検索エンジンのJavaScriptを扱う性能は、基本的に最新版のChromeと同等であり、ブラウザで表示できる場合は検索エンジンも実行できるイメージでOKです。

しかし、全てのサイトで無限にクロールすることはできず、各サイトにはクロールの割り振りが存在します。そのため画像などのリソースやページ表示に時間のかかるサイトではクロールやレンダリングにも影響が出る場合があります。

④インデックス

①~③の工程を経てインデックスされるのですが、以下の場合はインデックスされないこともあります。

  • インデックスする価値のないページと判断された
  • レンダリングが正常に行えなかった
  • 重複ページやソフト404などのエラーと判断された

 

その場合はそれぞれ対応が必要になりますが、そもそもの認識を「検索エンジンはインデックスして当然である」と考えずに、インデックスされる価値のある問題のないページを目指していきましょう。

\SEOで成果につなげる!資料ダウンロードはこちらから/

インデックスされない場合のポイント

インデックスさせたいページがインデックスされない場合に、どのような対策がとれるでしょうか。

ここでは代表的な2つの確認方法と改善方法を紹介します。

そもそも検索エンジンがそのページを検出・クロールできていない

ウェブサイトにやってきたクローラーはリンクをたどりウェブサイト内を巡回し、たどり着いたページをインデックスしていきます。このとき、サイト内の構造がわかりやすくなっていると、ページからページへと巡回しやすくインデックスもスムーズに行われます。クローラーの巡回を手助けするのがサイトマップです。

XMLサイトマップはクローラーにとっての地図になる

サイトマップというと、ユーザーのためにサイト内のページ構造をわかりやすく一覧にしたページだと思われるかもしれません。そうしたユーザー向けのサイトマップは「HTMLサイトマップ」と呼びます。もちろんHTMLサイトマップを設置することも重要なのですが、実はサイトマップにはもう一つあるのです。それが、クローラーにサイトの情報を伝えるための「XMLサイトマップ」です。

XMLサイトマップは、サイトの更新日や更新頻度などを記載しておき、ウェブサイトと同じサーバに設置します。XMLサイトマップは、基本的にユーザーの目には触れません。XMLサイトマップを参照するのは検索エンジンのクローラーです。XMLサイトマップでサイト情報をクローラーに伝えることでインデックスを促す効果が期待できます。

とはいえ、基本的にはXMLサイトマップではなく、内部リンクこそが、クロールの重要なポイントです。

「そのページへの内部リンクが1つもない」という状態では、検索エンジンはそのページを検出しにくいだけでなく、ページの重要性も理解しにくくなります。

新規ページがサイトTOP、カテゴリーTOPに表示されるようにする、関連する記事では内部リンクを設定する、データベースサイトであれば、カテゴリーページやパンくずリストを適切に活用し、内部リンクが行き届くように心がけて下さい。

Google Search ConsoleでURL再検査を行う

クローラーはリンクをたどって定期的に巡回し、インデックスを行います。そのため、リンクされていないページや公開して間もないページはなかなかインデックスされないことがあります。

そんなときは、インデックスを促すためにGoogle Search Consoleを活用しましょう。まず、該当ページのURLがインデックスされているかどうかを検査します。Google Search Consoleを開き、「URL検査」を選択。該当ページのURLを入力して「テスト」ボタンをクリックすれば、そのページが現在インデックスされているかどうかがわかります。インデックスされていなければ、「インデックス登録をリクエスト」ボタンをクリックします。

インデックス数とSEOの関係

低品質な記事が大量にインデックスされても上位表示されない。重要なのは質。

サイト内でインデックスされたページの数は多ければ多いほどSEO的に有利なのでしょうか。実はインデックスされたページの数はSEOにまったく関係ありません。SEOで大事なのは「質の高いページ」がたくさんあり、インデックスされていることです。価値の低いページを大量に作り、すべてインデックスさせたとしても、その数をもってサイトの評価が上がることはないのです。

参考:低品質ページを大量生産しても検索エンジンの評価は上がらない、高品質コンテンツだけを作る | 海外SEO情報ブログ

参考:Does a site rank better if it has a lot of indexed pages?- YouTube

ですから、インデックスの前にサイト内のコンテンツを見直し、質の高い記事を多く作ることをまずは意識しましょう。質の高いコンテンツができたら、それらをインデックスしていくという流れで進めましょう。SEOは何よりも質の高いコンテンツありきです。「インデックスさえすれば検索順位が上がる」というような魔法は存在しません。

まとめ

インデックスとは公開したWebページが検索エンジンのデータベースに登録され、検索結果に表示される状態になることを指します。

SEOの基礎中の基礎になる部分ではありますが、ページ数の多いサイトなどはインデックスされないという課題も頻出します。

こうしたクロール、インデックス周りなどでお困りごとがございましたら、弊社にぜひご相談ください。

関連記事

noindexとは?noindexタグの書き方や注意点について

noindexとは?noindexタグの書き方や注意点について

Googleが日本のリンクネットワークに制裁を与えたようです

インデックス数を増やすとSEO効果は上がるのか?

インデックス数を増やすとSEO効果は上がるのか?

新着記事

SEO アウトソース

SEOをアウトソースするメリットと注意点とは?

リスティング広告 seo

リスティング広告とSEOはどっちが効果的?その違いを徹底比較

集客 導線

集客導線の考え方とは?入り口と出口に分けて8つの方法を解説!

サイト内検索