重複コンテンツチェックはなぜ重要?重複の基準とペナルティ対策

更新日: 公開日:
重複コンテンツチェックはなぜ重要?重複の基準とペナルティ対策

重複コンテンツについて、その意味とSEOに与える影響・対策を解説しています。

<ポイント>

  • 重複コンテンツはSEOにさまざまな悪影響を及ぼす
  • 重複コンテンツの確認はタイトルチェックやGoogle Search Consoleで行う
  • サイト設計の段階で重複コンテンツが生まれないような仕組みを持たせておく
  • 重複コンテンツのタイプごとに、対応方法が異なる。その対応方法を知っておく

重複コンテンツにより生じる問題

重複コンテンツとは、「ページのURLは異なるが、その内容が完全に、またはほぼ同じであるコンテンツ」のことを指します。重複コンテンツによってどのような問題が生じるのか、確認しておきましょう。

重複コンテンツによって起こる問題

重複コンテンツは、同時に検索結果に表示されない

検索エンジンは、原則として重複コンテンツを同時に検索結果に表示することはありません。

もし複数の重複コンテンツが検索結果に表示されるような仕組みだったとすると、ある検索結果が1ページ同じ内容のページばかりで埋め尽くされてしまう、ということになります。しかし、このような検索結果を求めるユーザーはいないでしょう。

しかし、検索エンジンのランキング操作やトラフィックの増大を意図して、コンテンツが複数ドメインにまたがって複製されていることもあります。この種の偽装行為は、ユーザーが検索結果で実質的に同じコンテンツを何度も見ることになり、利便性の低下につながります。

参考(外部サイト):重複コンテンツの作成を避ける – Search Console ヘルプ

検索エンジンは、ユーザーが求める情報を探しやすくすべく、検索キーワードの意図に応じて検索結果上に多様性を担保しようとする仕組みがあります。

同じ内容のページがウェブ上に複数存在する場合は、コンテンツの内容以外の要因なども加味して、その中で最も表示させるのにふさわしいと判断したものを優先的に検索結果に表示させようとしますので、結果として他サイトと重複するコンテンツ(=独自性の薄いコンテンツ)は検索結果に表示されにくくなります。

自サイト内での重複による被リンク評価の分散

重複コンテンツによる悪影響は、自分のサイト内のページ間の重複においても生じます。自サイト内において問題になる例として代表的なものが、被リンク評価の分散です。

同じ内容のページが複数のURLで存在してしまうと、本来ならば1つのURLに集まるはずだった被リンクがそれぞれ分散してしまうことがあります。

例えば、同じ内容のページが3つのURLで存在している場合、本来ならば100得られるはずだった被リンク評価がそれぞれのURLに50,30,20のように分散してしまう場合があります。

もちろんGoogle側で処理して評価をしてくれることも期待できますが、もし正しく処理できなかった場合、本来得られるはずだった評価を取りこぼしてしまうことになるので、非常にもったいない状況になってしまいます。

Googleからのペナルティのリスク

Googleは重複コンテンツをガイドラインで禁止しています。禁止対象となるのは、「他のサイトのコンテンツをコピーしただけで付加価値を加えていないコンテンツ」です。他サイトのコンテンツをそのまま、あるいは若干の修正を加えただけで転載することはガイドライン違反となります。

このようなコンテンツは、Googleから「悪質」と見なされペナルティを受ける可能性があります。仮に悪質とまで判断されなかったとしても、低品質と見なされるのは確実です。

重複コンテンツの確認方法

ペナルティを避けるためには、Googleのガイドラインに違反している重複コンテンツが自社サイト内にあるかどうかを確認しなければいけません。もっとも、すべての文章がコピペで作られたページが自社サイト内に存在することは考えにくいでしょう。

注意すべきは、自分たちでは重複していると思っていないけれど、何らかの理由でGoogleに重複コンテンツだと判断されてしまったページです。このようなページの有無を確認するためには下記のような方法があります。

重複コンテンツの確認方法

タイトルを確認する

Googleはまったく同じタイトルのページを作ることを避けるように明言しています。タイトルとはhtmlの「title」タグのことで、Googleの検索結果に表示される要素です。

仮にタイトルが重複している場合、検索結果に同じ文言が出現することになりユーザーは混乱してしまいます。そういった事態を避けるために、Googleは「各ページのタイトルはすべて固有のものでなければならない」と定めています。自社サイト内の記事でタイトルが重複していることがないよう確認しましょう。

Google Search Consoleのカバレッジを確認する

Google Search Consoleを活用して重複コンテンツの有無をチェックすることができます。まずGoogle Search Consoleにログインし、カバレッジの「除外」から下記に該当するページを確認します。

「重複しています。ユーザーにより、正規ページとして選択されていません」

「重複しています。送信された URL が正規 URL として選択されていません」

「重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」

これらに該当するページは、Googleが重複コンテンツだと判断していることになります。内容を確認し、重複が確認できたら対応しましょう。文章をリライトしたり、タイトルを変更したり、canonicalの設定をします。

Google Search Consoleのカバレッジ確認のスクリーンショット

canonicalはURLの正規化で使用するタグで、設定することで「優先してインデックスしてほしいページ」であることをGoogleに伝えることができます。ECサイトで色違いの商品ごとに別URLを用意するなど、重複と見なされる可能性のあるコンテンツをどうしても残す必要がある場合はしっかり設定しておきましょう。

「site: 検索」をしてみる

オウンドメディアなどで大量に記事を作っている場合、まったく同じ内容の記事が生まれることは考えにくいので、重複コンテンツ認定されることは基本的にないはずです。

その場合は、念のため「site:検索」という手法を用いてキーワードごとにサイト内をチェックしてみましょう。site:検索とは、特定のサイト内だけを対象に指定のキーワードで検索する方法です。URLの前にsite:をつけ、URLの後ろにスペースを空けてキーワードを入れることで、site:検索を行うことができます。

例えば、「site:https://www.seohacks.net SEOとは」と検索窓に入力して検索してみてください。

「site:https://www.seohacks.net SEOとは」のsite検索のスクリーンショット

すると、seohacksドメイン内で「SEOとは」を文言に含むページが一覧されるはずです。site:検索の結果を詳しく見ていくことで、自社サイト内での思わぬ重複コンテンツが見つかる可能性があります。タイトルや内容が重複しており、Googleに重複コンテンツだと判断されそうなおそれのあるページが見つかったら、前述したタイトルや内容のリライト、あるいはcanonical設定でしっかりと対処しましょう。

重複コンテンツの例とその対策

ここからは重複コンテンツの具体的な事例別に対策方法を解説します。

サイトを運営していると、悪意のあるコピーなどを行わなくとも、意図せずして重複コンテンツを生成してしまう場合があります。

重複コンテンツが生成される状況として、下記のような場合が挙げられます。

  • URLの表記に一貫性が保たれてない場合
  • URLにパラメータが付与され、動的にURLが複数生成される場合
  • PC用とモバイル用で別のページを用意している時
  • 他のサイトにコンテンツを提供している時
  • 他のサイトにコンテンツを盗用された場合

下記ではそれぞれについてその詳細と、対策を説明していきます。

URLの表記に一貫性が保たれてない場合

URL表記に一貫性が保たれていない例としては、URL末尾の”index.html(index.php)”やURL先頭の”www”の有無が統一されていない場合が挙げられます。

この場合は、代表的なURLを1つ定め、そのURLを正規のURLとして検索エンジンに明示する措置を取ることが望まれます。この措置を「URL正規化」と呼びます。

正規化については、「URL正規化の方法、、の前に考えるべきこと|ナイルのSEO相談室」もご参照ください。

 

重複コンテンツのURLの表記が揺れている場合

URLの正規化の手法としては、状況に応じて下記のいずれかを行います。

ユーザーがアクセスするURLが1つで構わない場合→301リダイレクトによる正規化

301リダイレクトとはブラウザや検索エンジンに対し、URLが移転したことを示す方法です。
次のような場合、正規化に301リダイレクトを使用します。

  • wwwの有無、index.拡張子(index.htmlやindex.phpなど)の有無、/(スラッシュ)の有無による重複の場合
  • その他ユーザーがアクセスするURLが一つで構わない場合

例えば、
「http://www.example.jp」「http://www.example.jp/index.html」「http://example.jp」「http://example.jp/index.html」
の4つのURLで同じページが表示されてしまう場合、「http://www.example.jp」を正規のURLとし、他のURLにアクセスした場合は全てこの正規URLに301リダイレクトするようにします。

(wwwあり、なしのURLどちらを正規URLとするかは、お好みで決めても構いません。)

ユーザーが異なるURLで同一のコンテンツにアクセスしなければいけない場合→canonicalによる正規化

canonicalとは、正規のURLを検索エンジンに伝えるための記述方法です。

で指定されたURLが正規のURLとみなされます。
次のような場合、正規化にcanonicalを使用します。

  • 同一のコンテンツを別々のURLのまま運用する必要がある場合
  • 環境等の要因でリダイレクトによる正規化が不可能な場合

参考: canonical(カノニカル)とは?記述方法やSEOへの効果、必要性について | SEO用語集 [ナイルのSEO相談室]

重複コンテンツが動的URLで生成されてしまう場合

canonicalによる正規化を行うか、難しい場合にはまたはサーチコンソールで「URLパラメータ」の設定を行います。

 

重複コンテンツが動的URLで生成されてしまう場合

サーチコンソールを用いることで、Googleに対してURLパラメータによってコンテンツが変化するか否か、どのように変化するか、パラメータを含むURLのうちどれをクロール対象とするか、などを設定することができます。

これにより、重複となるURLをクロールする範囲を必要最低限に抑えることができます。パラメータ内の数字の異なるURLが同一コンテンツ上に存在する場合、正規化に「URLパラメータ」の設定を使用します。

上記以外でも、URLパラメータは分かる範囲で設定しておくべきでしょう。ただし、パラメータの作用が不明な場合はリスクもありますので、使うことはおすすめしません。

PC用とモバイル用で別のURLを用意している時

この場合は、アノテーションと呼ばれる設定を行うことが望まれます。

 

PC用とモバイル用で別のURLを用意している場合

アノテーションとは、スマートフォンやPCと言ったデバイスごとに最適化されたURLが存在することを、検索エンジンにも認識できるよう明示することを言います。

具体的には、次の2つの措置を取ります。

① PC向けページとは別にスマートフォン/フィーチャーフォン向けページが存在することを伝えるために、PC向けページの要素内に、スマートフォン/フィーチャーフォン向けのURLに対して、link rel=“alternate”を記述する。

② スマートフォン/フィーチャーフォン向けページのコンテンツがPC向けページと同一であることを伝えるために、スマートフォン/フィーチャーフォン向けページ、それぞれの要素内に、PC向けページのURLに対して、link rel=“canonical”を記述する。

こちらの内容についての詳細は、

モバイル(スマホ)用のURLが別に存在する場合にやるべき3つのSEO対策もご参照ください。

他のサイトにコンテンツを提供している時

他のサイトにコンテンツを提供している場合は、本来ならば提供元である自サイトのコンテンツがオリジナルとして評価されるべきでしょう。

 

他のサイトにコンテンツを提供している場合

しかし場合によっては、提供先のサイトがオリジナルとして評価され、検索結果に優先表示されてしまう場合もあります。

そのような事態を避けるために、オリジナルコンテンツがどちらであるかを検索エンジンに理解してもらえるよう工夫する必要があります。

rel=”canonical”を設置してもらう・noindexを設定してもらう

コンテンツ提供先のサイトに対して指示が可能であれば、ページから提供元のページに向けてcanonicalのURLを指定してもらうことで自社サイトを正規と認識させることや、noindexメタタグでインデックスさせないようにしてもらうのが確実です。

オリジナルコンテンツへのリンクを設置してもらう

上記のような実装指示が難しい場合、コンテンツ提供先のページから、「提供元:◯◯」などの文言とともに、コンテンツ提供元へのリンクを設置してもらいましょう。あらかじめ、提供元へのリンクを設置することを利用規約としてコンテンツを提供するのも有効です。この方法でも、オリジナルがどちらであるかを検索エンジンに伝えることができます。

ただしこれも媒体側のルールによってまちまちですので、提供者が完全にコントロールしきれる問題ではありません。

コンテンツ提供方法・提供時期を工夫する

上記のような対応に加え、コンテンツの提供方法を工夫することは有効です。

例えば提供先にはすべてのコンテンツではなくコンテンツの一部だけを提供するようにする、といった方法が挙げられます。また、オリジナルコンテンツの公開時期を最も早くするようにすることも重要です。このような措置を行うことで、検索エンジンにオリジナルコンテンツであると見なされる可能性は高くなります。

他のサイトにコンテンツを盗用された場合

コンテンツを無断でコピーされ、そのコピーコンテンツがオリジナルであると検索エンジンに評価されてしまうことがありますが、この場合は著作権の問題となります。違法コピーを行なったサイトの所有者に直接削除要請を行った上で、Googleに通知を提出し、インデックスから削除するよう要請しましょう。

参考(外部サイト):通報フォーム 著作権侵害による報告 | Google サーチコンソール 

サイト設計の段階で、重複コンテンツが生じないようにすることが重要

ここまで様々な重複コンテンツ対策を述べてきましたが、コンテンツ提供や盗用の例を除き、あらかじめ重複コンテンツが生じないような仕組みをサイトに持たせておくことが一番の対策となります。

新規にサイトを立ち上げる際は、重複コンテンツが生じないようなサイト設計を心がけるようにしましょう。

参考:URL正規化の方法、、の前に考えるべきこと|ナイルのSEO相談室

なお、悪意を持ったコピーなどの場合を除き、重複コンテンツの存在自体はペナルティの対象になることはほとんど無いとGoogleは発表しています。しかし、サイトの評価を下げてしまう恐れがある以上、可能な限り対策をすることをおすすめします。

「どういったコンテンツが重複になるかわからない」「前担当から特に引き継ぎを受けていないため、SEOに問題があるかわからない」と言った方は、弊社のSEO課題点チェックサービスをご確認下さい。

また、SEO対策の全体像、検索エンジンの仕組みをより詳しく学びたい方はこちらの記事もご覧ください!

参考:SEOとは?SEO対策を仕組み、技術対策、コンテンツまで徹底解説! |SEO基礎知識-ナイルのSEO相談室

まとめ

他サイトをそのままコピーした重複コンテンツは論外ですが、サイトの種類によっては気づかないうちに自サイト内で重複コンテンツが生まれてしまう可能性はあります。Googleに重複コンテンツと判断されてしまうとSEOの観点からも様々な悪影響があります。特にページ数の多いサイトでは、本記事で紹介した方法を用いて定期的にチェックしてみましょう。

サイト内検索

Webサイトの運用・集客でお困りの際は、ぜひお気軽にご相談ください

お問い合わせはこちら