重複コンテンツによって生じる問題とその対策

重複コンテンツについて、その意味とSEOに与える影響・対策を解説しています。

重複コンテンツとは

ここで言う重複コンテンツとは、「ページのURLは異なるが、その内容が完全に、またはほぼ同じであるコンテンツ」のことを指します。

雑誌や書籍になどにおいては、同じ内容の本が何百冊も増刷されるのは当たり前です。しかしWeb上では、世界中のどこからでもある特定のページにアクセス出来るため、同じ内容のページが複数存在する必要性は原則ありません。Web上では、コピーされた情報の価値はとても小さいのです。

特にSEOにおいては、重複コンテンツの存在は様々な不利益を及ぼす可能性があります。

重複コンテンツにより生じる問題

重複コンテンツは、同時に検索結果に表示されない

検索エンジンは、原則として重複コンテンツを同時に検索結果に表示することはありません。

もし複数の重複コンテンツが検索結果に表示されることが許されてしまうと、検索結果が1ページ同じ内容のページばかりで埋め尽くされてしまう、ということも有り得ます。しかし、このような検索結果を求めるユーザーはいないでしょう。

検索エンジンは、ユーザーが求める情報を探しやすくすべく、検索キーワードの意図に応じて検索結果上に多様性を担保しようとする仕組みがあります。

同じ内容のページがWeb上に複数存在する場合は、その内最も表示させるのにふさわしいと判断したものを優先的に検索結果に表示させようとしますので、結果として、他サイトと重複するコンテンツ(=独自性の薄いコンテンツ)は検索結果に表示されにくくなる、ということです。

被リンク評価の分散

重複コンテンツの問題は、他サイトと自分のサイトの間だけの重複でなく、自分のサイト内のページ間の重複においても生じます。自サイト内において問題になる例として代表的なものが、被リンク評価の分散です。

同じ内容のページが複数のURLで存在してしまうと、本来ならば一つのURLに集まるはずだった被リンクがそれぞれ分散してしまうことがあります。

例えば、同じ内容のページが3つのURLで存在している場合、本来ならば100得られるはずだった被リンク評価がそれぞれのURLに50,30,20のように分散してしまう場合があります。

もちろんGoogle側で有る程度上手に処理して1まとめの評価をしてくれることも期待できますが、100%ではありません。もし正しく処理できなかった場合、本来得られるはずだった評価を取りこぼしてしまうことになるので、非常に勿体無い状況です。

重複コンテンツの例とその対策

サイトを運営していると、悪意のあるコピーなどを行わなくとも、意図せずして重複コンテンツを生成してしまう場合があります。

重複コンテンツが生成される状況として、下記のような場合が挙げられます。

  • URLの表記に一貫性が保たれてない場合
  • URLにパラメータが付与され、動的にURLが複数生成される場合
  • PC用とスマホ用で別のページを用意している時
  • 他のサイトにコンテンツを提供している時
  • 他のサイトにコンテンツを盗用された場合

下記ではそれぞれについてその詳細と、対策を説明していきます。

URLの表記に一貫性が保たれてない場合

URL表記に一貫性が保たれていない例としては、URL末尾の”index.html(index.php)”やURL先頭の”www”の有無が統一されていない場合が挙げられます。

この場合は、代表的なURLを1つ定め、そのURLを正規のURLとして検索エンジンに明示する措置を取ることが望まれます。この措置を「URL正規化」と呼びます。

(正規化については、SEOブログ「URL正規化の方法、、の前に考えるべきこと」もご参照ください。)

URLの正規化の手法としては、状況に応じて下記のいずれかを行います。

ユーザーがアクセスするURLが1つで構わない場合→301リダイレクトによる正規化

301リダイレクトとはブラウザや検索エンジンに対し、URLが移転したことを示す方法です。
次のような場合、正規化に301リダイレクトを使用します。

  • wwwの有無、index.拡張子(index.htmlやindex.phpなど)の有無、/(スラッシュ)の有無による重複の場合
  • その他ユーザーがアクセスするURLが一つで構わない場合

例えば、
「http://www.example.jp」「http://www.example.jp/index.html」「http://example.jp」「http://example.jp/index.html」
の4つのURLで同じページが表示されてしまう場合、「http://www.example.jp」を正規のURLとし、他のURLにアクセスした場合は全てこの正規URLに301リダイレクトするようにします。
(wwwあり、なしのURLどちらを正規URLとするかは、お好みで決めても構いません。)

ユーザーが異なるURLで同一のコンテンツにアクセスしなければいけない場合→canonicalによる正規化

canonicalとは、正規のURLを検索エンジンに伝えるための記述方法です。

で指定されたURLが正規のURLとみなされます。
次のような場合、正規化にcanonicalを使用します。

  • 同一のコンテンツを別々のURLのまま運用する必要がある場合
  • 環境等の要因でリダイレクトによる正規化が不可能な場合

重複コンテンツが動的URLで生成されてしまう場合

canonicalによる正規化を行うか、難しい場合にはまたはウェブマスターツール「URLパラメータ」の設定を行います。

「URLパラメータ」とはGoogleウェブマスターツール上で使用可能な機能で、Googleに対しパラメータの果たす役割を伝えることできます。パラメータによってコンテンツが変化するか否か、どのように変化するか、パラメータを含むURLのうちどれをクロール対象とするか、などを設定することができます。

これにより、重複となるURLをクロールする範囲を必要最低限に抑えることができます。パラメータ内の数字の異なるURLが同一コンテンツ上に存在する場合、正規化に「URLパラメータ」の設定を使用します。

上記以外でも、URLパラメータは分かる範囲で設定しておくべきでしょう。ただし、パラメータの作用が不明な場合はリスクもありますので、使うことはおすすめしません。

PC用とスマホ用で別のページを用意している時

この場合は、アノテーションと呼ばれる設定を行うことが望まれます。

アノテーションとは、スマホやPCと言ったデバイス毎に最適化されたURLが存在することを、検索エンジンにも認識できるよう明示することを言います。

具体的には、次の2つの措置を取ります。

① PC向けページとは別にスマートフォン/フィーチャーフォン向けページが存在することを伝えるために、PC向けページの要素内に、スマートフォン/フィーチャーフォン向けのURLに対して、link rel=“alternate”を記述する。

② スマートフォン/フィーチャーフォン向けページのコンテンツがPC向けページと同一であることを伝えるために、スマートフォン/フィーチャーフォン向けページ、それぞれの要素内に、PC向けページのURLに対して、link rel=“canonical”を記述する。

こちらの内容についての詳細は、SEO対策Q&A
「デスクトップ用とスマートフォン用のURLが別々の場合、スマホ版URLに特別SEOをする必要はありますか?」
もご参照ください。

他のサイトにコンテンツを提供している時

他のサイトにコンテンツを提供している場合は、本来ならば提供元である自サイトのコンテンツがオリジナルとして評価されるべきでしょう。しかし場合によっては、提供先のサイトがオリジナルとして評価され、検索結果に優先表示されてしまう場合もあります。

そのような事態を避けるために、オリジナルコンテンツがどちらであるかを検索エンジンに理解してもらえるよう工夫する必要があります。

rel=”canonical”を設置してもらう

確実な方法の一つとして、コンテンツ提供先のページから、提供元のページに向けて、canonicalのURLを指定してもらう方法があります。canonicalにより、複数の重複コンテンツのうち、どれが評価すべき代表的なコンテンツであるかを検索エンジンに伝えることができます。

でも現実には、せっかくコンテンツを掲載してリンクも獲得できたにも関わらず、それを元のURLに正規化してくれるなんていう良心的なメディアはないでしょう。

オリジナルコンテンツへのリンクを設置してもらう

コンテンツ提供先のページから、「提供元:◯◯」などの文言とともに、コンテンツ提供元へのリンクを設置してもらいましょう。予め、提供元へのリンクを設置することを前提としてコンテンツを提供するのも有効です。この方法でも、オリジナルがどちらであるかを検索エンジンに伝えることができます。尚、この際は検索エンジンを混乱させないため、提供元から提供先へのリンクは設置しないように注意しましょう。

ただしこれも媒体側のルールによってまちまちですので、提供者がコントロールしきれる問題ではありません。

コンテンツ提供方法・提供時期を工夫する

上記のような対応に加え、コンテンツの提供方法を工夫することは有効です。

例えば提供先にはすべてのコンテンツではなくコンテンツの一部だけを提供するようにする、といった方法が挙げられます。また、オリジナルコンテンツの公開時期を最も早くするようにすることも重要です。このような措置を行うことで、検索エンジンにオリジナルコンテンツであると見なされる可能性は高くなります。

他のサイトにコンテンツを盗用された場合

可能性としては非常にまれですが、コンテンツを無断でコピーされ、そのコピーコンテンツがオリジナルであると検索エンジンに評価されてしまうことがあります。この場合は著作権の問題となります。違法コピーを行なったサイトの所有者に直接削除要請を行った上で、Googleに通知を提出し、インデックスから削除するよう要請しましょう。
Google ウェブマスターツール | 著作権侵害の報告“https://www.google.com/webmasters/tools/dmca-notice?pli=1&hl=ja

サイト設計の段階で、重複コンテンツが生じないようにすることが重要

ここまで様々な重複コンテンツ対策を述べてきましたが、コンテンツ提供や盗用の例を除き、予め重複コンテンツが生じないような仕組みをサイトに持たせておくことが一番の対策となります。

新規にサイトを立ち上げる際は、重複コンテンツが生じないようなサイト設計を心がけるようにしましょう。
参照:URL正規化の方法、、の前に考えるべきこと

なお、悪意を持ったコピーなどの場合を除き、重複コンテンツの存在自体はペナルティの対象になることはほとんど無いとGoogleは発表しています。しかし、サイトの評価を下げてしまう恐れがある以上、可能な限り対策をすることをおすすめします。

少人数でSEO業務を担当されている方へ

社内外の関係者へ報告するためのレポート作成業務や日々の状況把握に追われ、施策の実行がおろそかになってにいませんか?Refractなら1つの画面で重要なデータを全て把握でき、その上ワンクリックで詳細なレポートを作成することが可能です。

SEOレポーティングツール「Refract」無料トライアル実施中!

ワンクリックでレポート作成可能。SEOレポーティングツール「Refract」無料トライアル実施中、15日間無料でお使い頂けます。

Webサイトの運用でお困りではありませんか?

私たちが得意とするコンテンツマーケティングやSEOに限らず、Webの運営・改善に関する総合的な知見を持つ私たちなら、きっと御社の悩みを解決できると考えています。

サイト内検索

SEO・サイト運用・コンテンツマーケティングでお困りの際には ぜひお気軽にご相談ください

実務に役立つeBookが
無料でダウンロードできます

SEOやコンテンツマーケティングに
ご関心のある方はぜひご利用ください。

×