重複コンテンツ問題とアーカイブのnoindex化


ワードプレスのプラグイン「Yoast SEO」では、投稿、固定ページ、メディア、カテゴリー、タグ、日付アーカイブ、筆者アーカイブなどの各ページタイプをindexにするか、noindexにするかのheadメタタグを選択的に出力することができます。

2021 Yoast Index contents type

各タブで「はい」を選べば、

<meta name="robots" content="index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1" />

各タブで「いいえ」を選べば、

<meta name="robots" content="noindex, follow" />

というようにメタタグを入れてくれ、検索エンジンのクローラーにインデックスしてほしいかどうかを伝えることができます。

indexか、noindexか

と、いわれても、どっちにすればいいか、よくわからぬ。

タイプIndex/Noindex注記
投稿indexメインコンテンツ。
固定ページnoindex「お問い合わせ先」や「プライバシーポリシー」などのページ。クロールをブロックするほどでもない。
メディアnoindex画像ファイルをアップロードすると自動生成してしまう内容のないページ。indexしないで、画像ファイルにリダイレクトした方がいい。
カテゴリーindex【重複コンテンツの可能性あり】関連する内容の記事をグルーピングして、サイトの階層情報を持たせることができるページタイプ。パンくずリストのクロールでつまずかない様に2020年に「index」にしてみたがエラーはでなかった。意味のあるパーマリンクを持ったページなので、indekで継続。
タグnoindex【重複コンテンツの可能性あり】横断的に記事をまとめるページタイプ。個人的にあまり使っていないので、引き続きnoindex。
日付アーカイブnoindex【重複コンテンツの可能性あり】日付で記事をグルーピングするページタイプ。このサイトには日付で検索してくる人は皆無なので、他のページと競合しない様にnoindex。
著者アーカイブnoindex【重複コンテンツの可能性あり】著者ごとに記事をグルーピングするページタイプ。このサイトには著者は1人なので、日付アーカイブと同じものが出来る。日付アーカイブと同じ理由でnoindex。

重複コンテンツ問題とは

重複コンテンツとは、検索エンジンのクローラーに違いが認知できないレベルで似ている複数のページのこと。以前はタイトルタグとメタディスクリプションで重複しているコンテンツがあれば、サーチコンソールでエラーリストに入っていました。

「デスクトップ版とモバイル版」や「イギリス英語版とアメリカ英語版」が分かりやすいですね。

ブログだと、カテゴリー、タブ、日付アーカイブ、著者アーカイブも、アーカイブの1ページ目と2ページ目が同じカテゴリー名(=同一タイトルタグ)になったり、カテゴリーの説明(=同一メタディスクリプション)になりがちで、同じページを量産しているように捉えられてしまうことがありました。

プラグインYoast SEOの場合は、検索エンジンが違いを認識できるようにするために、タイトルやディスクリプションにページ数を記述するなどして避ける事はできます。※それでも似てるけど。

Yoast、カテゴリーのタイトルタグ設定

タクソノミーのタブで「ヘルプが必要ですか?」を表示させ、一番右の「Snippet variables」から変数が取れます。

Yoast、タイトル、ディスクリプション用の変数

参考:Googleの「重複するコンテンツ

最後に

最終的には、カテゴリーページや日付アーカイブに流入を促したいかどうかで判断するんだと思います。

「ブログ名 1月」という検索用語を頻繁に使う読者がいると思えば、indexするんでしょうけど、個人的にはそんな人想像つかない。

最後までお読みいただきありがとうございます。


コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です