Google Search Console、AMPが「代替ページ(適切な canonical タグあり)」に分類される

この記事は約5分で読めます。

Google Search Console、代替ページ(適切な canonical タグあり)​

Google Search Consoleの管理画面で、
インデックス > カバレッジ > 除外
にチェックを入れます。

Google Search Console、インデックス > カバレッジ > 除外

Google Search Console、インデックス > カバレッジ > 除外

すると

  • noindex タグによって除外されました
  • クロール済み – インデックス未登録
  • 代替ページ(適切な canonical タグあり)

のような項目が並んでいます。

それらの中から
代替ページ(適切な canonical タグあり)
をクリックすると、下記のような画面になります。

Google Search Console、代替ページ(適切な canonical タグあり)

Google Search Console、代替ページ(適切な canonical タグあり)

上記画面を見ると

  • ttps://u-ff.com/~~~/?amp=1

という形式のURLが並んでいます。

「/?amp=1」というのはAMP用のURLです。
AMP(アンプ)というのは、サイトをスマホで見るときに、ページを高速表示するための仕組みです。

AMP用のURLが
インデックス > カバレッジ > 除外
に分類されているということは、AMP用のURLはインデックスされていないということ?

「?amp=1」をrobots.txtでクロール禁止にしてみる

  • ttps://u-ff.com/~~~/?amp=1

のような形式のURLはインデックスが除外されていました。
それならば、クロールもしなくていいのではなないかと思い、robots.txtでクロール禁止にしてみました。

Disallow: /*?amp=1

上記のような1行をrobots.txtに書き加えました。

robots.txtについて、詳しくは下記の記事をご参照ください。

Google Search Console、robots.txtでクロールを禁止する方法
replytocomをクロール禁止にしたい Google Search Consoleで、 インデックス > カバレッジ > 除外 を確認すると、以下のようなURLが多数インデックスから除外されていました。 ttps...

「?amp=1」をrobots.txtでクロール禁止にした結果

リンク先のAMPバージョンをインデックスに登録できません

リンク先のAMPバージョンをインデックスに登録できません

robots.txtでAMP用のURLをクロール禁止にした結果、
Google Search Consoleで
リンク先のAMPバージョンをインデックスに登録できません
というエラーが出てしまいました。

AMP用のURLは、インデックスはされないけれど、クロールは許可しないといけないようです。

AMPの仕組み

AMPは基本的にスマホ専用のページです。
画像サイズを小さくするなど、スマホでサイトを見たときにページを軽くしてくれます。

Googleの検索結果からブログなどを表示するとき、AMPありとAMPなしではデータの通信経路が違います。
普通は、「ブログ→スマホ」とデータが送信されるのですが、
AMPの場合は、「Google→スマホ」とデータが送信されます。

ブログのAMPが有効になっているかどうかは、ブログの設定によります。
AMPが有効になっていれば、Googleの「AMPキャッシュ」にブログのデータが保管されていて、それがスマホ上に表示されます。

このAMPキャッシュ上のデータは、Googleさんが自動的に生成してくれているんだと勘違いしていました。
実際には、AMPデータはブログ側で作成して、Googleさんはブログ側にあるAMPデータをコピーして保管してくれているだけでした。

  • https://u-ff.com/google-search-console-robotstxt/

上記のURLに普通バージョンのデータが、下記のURLにAMPバージョンのデータがあります。

  • https://u-ff.com/google-search-console-robotstxt/?amp=1

このURLへのクロールを禁止にしてしまうと、GoogleはAMP用データを「AMPキャッシュ」へコピーできなくなってしまいます。

つまり、下記のような

Disallow: /*?amp=1

AMPページへのクロールを禁止する設定をrobots.txtに書いてはいけません。

下記の記事にはrobots.txtで「replytocom」へのクロールを禁止にしたら、警告が表示された失敗談が解説してあります。

Google Search Console、「robots.txt によりブロックされましたが、インデックスに登録しました」への対処方法
Googleがrobots.txtを無視する robots.txtというファイルをブログに設置すると、特定のURLをGoogleがクロールしないように制御できます。 ttps://u-ff.com/korona-kanniken...

「?replytocom=」をクロール禁止にすると、「警告」でしたが、
「?amp=1」をクロール禁止にすると、「エラー」になります。

「警告」よりも「エラー」の方が深刻度が高いです。

まとめ

AMP用ページのURL(/?amp=1)をクロール禁止にしてはいけない。

robots.txtを設定した後は、Google Search Consoleの「robots.txt テスター」を使って動作確認ができます。

Google Search Console、「robots.txt テスター」の使い方
robots.txtを変更した後にすること robots.txtを設定すると、特定のURLに対してクロールを禁止にしたり、許可したりできます。 robots.txtを変更後は 「果たして、このやり方であっているんだろうか?」 と...

コメント

タイトルとURLをコピーしました