テクニカルSEO(サイト内部の対策)の調査をしていると見かける重複コンテンツ。
あなたのサイトも気付かない内に、マイナスな影響を及ぼしているかも。
重複コンテンツとは?
本記事でいう重複コンテンツとは、以下の状態を指します。
- wwwのあり・無し両方のページにアクセスできる
- URL末尾/(スラッシュ)のあり・無し両方のページにアクセスできる
- httpとhttps両方のページにアクセスできる(最近は少ない)
- index.html/index.phpのあり・無し両方のページにアクセスできる
- 意図しない動的URLにアクセスできる
- 意図しない2ページ目以降にアクセスできる
- パラメータの順番が入れ替わった同じ内容のページにアクセスできる
- コピーサイトにアクセスできる
これらは私が実際に見てきた事例です。
wwwやURL末尾の/(スラッシュ)、index.html等のあり・無し両ページの存在は、どのサイトでも見かけます。それ以外は後述します。
まず、意識していただきたいのは、XMLサイトマップに掲載していないからと言って油断せず、これらのページにアクセスできる状態にしない方が良いということです。
具体的には、wwwのあり・無し両ページの存在などの重複コンテンツとなり得るページでは、正規ページへ301リダイレクトをかけておくべきだと考えます。
これは、いつ、どんなタイミングで、誰に、どういった形でリンクをされるか分からないですし、何かの拍子に間違えたURLでリンクを設置してGoogleが認識してしまう可能性もあるからです。
ここで最も重要なのは、Googleが重複コンテンツを認識してしまうことを避けるという点です。
なぜ重複コンテンツは良くないのか
重複コンテンツは、その量や状況によりサイトの評価を下げる、つまり検索順位が上がらない可能性があるからです。
Googleは、同じ内容のページでもURLが違えばそれぞれ単体のページとして認識します。そして、その内容が同じであれば重複コンテンツとしてGoogleサーチコンソールでエラーを挙げます。
この時、同じページをインデックス登録してしまうと検索ユーザーの利益にならないため、Googleはどちらか一方を正規ページとしてインデックス登録し、もう一方をインデックス登録しません。
たとえウェブサイト側で正規ページとして扱ってほしいURLであっても、Googleが「こっちは重複コンテンツ、別のURLが正しい」と判断してしまうと、どうにもできません。
大量の重複コンテンツが生成され、エラーとして出てしまっていることでサイトの評価が下がるということは、検索結果でも良い順位にはなれない可能性があるということです。
どれだけ良いコンテンツを作っていても、サイト全体の評価が悪いとGoogleからは「このサイトはあまり良いサイトでは無いからユーザーに役に立たないかも」と思われてしまい、良い検索順位に出ない可能性が高まります。これは非常に勿体ないですよね。
コンテンツを発信する際は、適切な評価を得るためにも、その土台となるHTMLタグの適正化を行う必要があるのです。
【事例1】動的URLの重複コンテンツ
これはデータベース型サイトと呼ばれる、求人サイトや販売サイトなどデータベースを用いてページを自動生成しているサイトによく見られます。
動的URLとは、URL内に「?」や「=」などが含まれ、パラメータが含まれるものです。
たとえば、 https://example.com/date?pref=1&area=2 のような形。
私は制作面には詳しくないのですが、膨大な量のデータがあるため、制作面での利便性から動的にすることが多いのかなと思います。また、Googleは動的URLを理解していることから、動的URLにすること自体は問題ありません。
しかし、この動的URLの生成条件を作り込まずにいると、重複コンテンツを生む原因になってしまう可能性がありますので注意が必要です。
パターン①意図しない動的URL
これは、具体的なURLを示すのは難しいのですが、製作者も意図していない、想定外のURLが生成されているパターンです。
パラメータや文字列もバラバラで、何故生成されたのかわからないことが多いです。
パターン②パラメータの順番が入れ替わった同じ内容のページ
パラメータの順番が入れ替わったが、同じページ内容を表示しているパターンです。
ページA:https://example.com/date?pref=1&area=2
ページB:https://example.com/date?area=2&pref=1
上記のように、都道府県を表す「pref」と地域を表す「area」の数字は同じで、前後入れ替わっただけでも別々のURL=別々のページとGoogleは認識します。
しかし、参照している都道府県や地域のデータは同じですので、ページ内容は同じです。
この場合、Googleが重複コンテンツと認識する可能性があるでしょう。
【事例2】意図しない2ページ目以降の重複コンテンツ
これは何故生成されているのか、製作者に理由を聞いていないので不明なのですが、1ページ目しかないはずなのに、何故か2ページ目以降も存在していることがありました。
本来、サイト上に存在しないページへアクセスすると404エラーを返すのが一般的です。
しかし、この事例ではURLの末尾に「?page=2」「?page=3」等、数字を入れるとアクセスできてしまったのです。
ちなみに、この事例は意外とよく見かけます。
【事例3】コピーサイトの重複コンテンツ
過去に、メインで使用するサイトとは別のドメインを用意し、そこにメインで使用するサイトの管理画面を設置する運用をしていたサイトがありました。
詳細は不明ですが、何故か管理画面を設置したドメインにも全く同じサイトが生成されており、さらにアクセスできる状況にあったのです。
Googleも別ドメインのサイトを認識し、インデックス登録までしていました。
この場合、同じ内容のページが別々のドメインで存在しているとGoogleは認識するため、どちらかを重複コンテンツであると見なします。
重複コンテンツへの対処法
これまでに紹介した事例にある、重複コンテンツへの基本的な対処法は以下の4つです。
- 正規URLへ向けて301リダイレクトを設定する
- canonicalタグを適切に使用する
- 意図しないパラメータが生成されないように対応する
- パラメータの順番を固定する
ウェブサイトの状況やルール等によって、最適な対処方法は都度変わりますが、基本的には301リダイレクトを設定し、物理的にアクセスできない状態にします。
さらに、正規ページに”自己参照canonical”を設定することで、Googleが他のページを正規ページだと認識しないようにします。
時折、canonicalタグの設定だけで対策しているサイトも見かけますが、canonicalタグはあくまでもシグナル(お知らせ)で、301リダイレクトのように強制的な指示にはなりません。
Googleはcanonicalタグの内容を無視する場合もありますので、301リダイレクトの設定が確実です。
また、そもそも重複コンテンツができないように、意図しないパラメータが生成されないよう対応したり、パラメータの順番を固定することも大切です。
ただし、先述した通り、ウェブサイトの状況やルール等によって、最適な対処方法は都度変わりますので、闇雲に301リダイレクトをかけてしまって正規ページもインデックス登録されないなどといった事態にならないよう、十分にご注意ください。
「本当にこの対応でいいのかな?」と不安になるようでしたら、プロに依頼するのが確実です。
重複コンテンツの改善事例
重複コンテンツに対して、先述した301リダイレクトの対処を行って改善した事例を一つご紹介します。
過去に私が対応させていただいた案件で、特に力を入れたいキーワードで20位前後だったお客様がいました。
様々な調査をする中で、重複コンテンツを確認した際、そのウェブサイトは事例3でご紹介したように、いくつかのコピーサイトができてしまっていました。
営業を介してやり取りを行っていたため、担当者や制作会社の方が存在を把握していたかどうかは不明ですが、お送りした提案書には状況の説明と、重複コンテンツの解消を最重要項目として記載しました。
そして、お客様にご対応いただいた翌週頃には順位が上昇し、10位以内に表示され始めました。
順位が改善された要因のひとつにはこのサイトのドメインそのものが強かったという点もありますが、逆に言えば、それだけドメインが強いサイトでも、意図していない重複コンテンツがあっただけで順位を落としていたと言えます。
これは非常に勿体ないですよね。
SEO対策は、良いコンテンツを提供することはもちろん大切ですが、それ以前に土台(HTMLタグ)が整っていないと効果を最大限に発揮できません。
家を建てる際、整っていない基礎の上に建てても家は常にグラグラと不安定になります。これではいつか壊れる可能性がありますよね。私はウェブサイトも同じことが言えると考えています。
重複コンテンツの探し方
重複コンテンツは、実際にURLを打ち込んで確認するほか、Googleサーチコンソールで見つけます。
wwwやURL末尾の/(スラッシュ)、index.html等のあり・無し両ページなどであればTOPページやそれ以外の適当なページで手入力して確認します。
時折、TOPページのみリダイレクトが設定されていて、それ以外のページには未設定というサイトがありますので、必ずTOPページとその他2~3ページで確認しましょう。
パラメータ付きページの重複に関してはGoogleサーチコンソールで発見できます。
「重複しています。ユーザーにより、正規ページとして選択されていません」というエラーが出ている場合は、必ずエラー対象となっているURLを「URL検査」にかけて、詳細を確認してください。

URL検査結果の詳細を開き、一番下にある「Googleが選択した正規URL」を確認します。これが重複判定された対象のURLです。
ここから、どのような理由で重複コンテンツになったのかを確認し、対処法を考えましょう。
まとめ
今回は、テクニカルSEOでよく見る重複コンテンツについて解説しました。
ただ、長くなるため今回は説明しきれなかったところ、端折ったところなどありますし、ここでご紹介した対処法だけが正解ではありません。本当にSEOは奥が深いです。
重複コンテンツは簡単に解決できるものもあれば、状況が複雑で解決策を考えるのがややこしい場合もあります。
求人サイトや賃貸検索サイトのような、条件を指定してユーザーが欲しいデータを検索するタイプのサイトでは、検索システムを設計する時点で綿密にルールを考えることが重要です。
SEO対策は、サイト内の導線やGoogleの考え方など、様々な要素が絡まっていますし、ウェブサイトによって最適な対処方法は様々です。
「このサイトにこう書いてあったから」と自社と同様のケースだけを見て、改善案まですべて丸ごと信じてしまうと、失敗してしまう可能性があります。
詳しく調べると、実は別の要素が原因だった…なんてこともあり得るかもしれません。
また、サイトの改善施策でも、「ここはこうした方がもっと良くなる」と、一部の状況だけを見て対応を決めるのではなく、サイト全体の状況や改善後の変化を想定しながら対応を考えましょう。
リソースや知識などの関係で、細かいところまで考えることが難しい場合は、SEOコンサルタントやSEOの支援会社など、SEOのプロに頼るのもおすすめです。

