Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the wp-slimstat domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/kusanagi/u-ff.com/DocumentRoot/wp-includes/functions.php on line 6121
Google Search Console、AMPが「代替ページ(適切な canonical タグあり)」に分類される | 3分ニュース: にゃんぷん

Google Search Console、AMPが「代替ページ(適切な canonical タグあり)」に分類される

この記事は約4分で読めます。

Google Search Console、代替ページ(適切な canonical タグあり)​

Google Search Consoleの管理画面で、
インデックス > カバレッジ > 除外
にチェックを入れます。

Google Search Console、インデックス > カバレッジ > 除外

Google Search Console、インデックス > カバレッジ > 除外

すると

  • noindex タグによって除外されました
  • クロール済み – インデックス未登録
  • 代替ページ(適切な canonical タグあり)

のような項目が並んでいます。

それらの中から
代替ページ(適切な canonical タグあり)
をクリックすると、下記のような画面になります。

Google Search Console、代替ページ(適切な canonical タグあり)

Google Search Console、代替ページ(適切な canonical タグあり)

上記画面を見ると

  • ttps://u-ff.com/~~~/?amp=1

という形式のURLが並んでいます。

「/?amp=1」というのはAMP用のURLです。
AMP(アンプ)というのは、サイトをスマホで見るときに、ページを高速表示するための仕組みです。

AMP用のURLが
インデックス > カバレッジ > 除外
に分類されているということは、AMP用のURLはインデックスされていないということ?

「?amp=1」をrobots.txtでクロール禁止にしてみる

  • ttps://u-ff.com/~~~/?amp=1

のような形式のURLはインデックスが除外されていました。
それならば、クロールもしなくていいのではなないかと思い、robots.txtでクロール禁止にしてみました。

Disallow: /*?amp=1

上記のような1行をrobots.txtに書き加えました。

robots.txtについて、詳しくは下記の記事をご参照ください。

Google Search Console、robots.txtでクロールを禁止する方法
replytocomをクロール禁止にしたいGoogle Search Consoleで、インデックス > カバレッジ > 除外を確認すると、以下のようなURLが多数インデックスから除外されていました。 ttps://u-ff.com/kor...

「?amp=1」をrobots.txtでクロール禁止にした結果

リンク先のAMPバージョンをインデックスに登録できません

リンク先のAMPバージョンをインデックスに登録できません

robots.txtでAMP用のURLをクロール禁止にした結果、
Google Search Consoleで
リンク先のAMPバージョンをインデックスに登録できません
というエラーが出てしまいました。

AMP用のURLは、インデックスはされないけれど、クロールは許可しないといけないようです。

AMPの仕組み

AMPは基本的にスマホ専用のページです。
画像サイズを小さくするなど、スマホでサイトを見たときにページを軽くしてくれます。

Googleの検索結果からブログなどを表示するとき、AMPありとAMPなしではデータの通信経路が違います。
普通は、「ブログ→スマホ」とデータが送信されるのですが、
AMPの場合は、「Google→スマホ」とデータが送信されます。

ブログのAMPが有効になっているかどうかは、ブログの設定によります。
AMPが有効になっていれば、Googleの「AMPキャッシュ」にブログのデータが保管されていて、それがスマホ上に表示されます。

このAMPキャッシュ上のデータは、Googleさんが自動的に生成してくれているんだと勘違いしていました。
実際には、AMPデータはブログ側で作成して、Googleさんはブログ側にあるAMPデータをコピーして保管してくれているだけでした。

  • https://u-ff.com/google-search-console-robotstxt/

上記のURLに普通バージョンのデータが、下記のURLにAMPバージョンのデータがあります。

  • https://u-ff.com/google-search-console-robotstxt/?amp=1

このURLへのクロールを禁止にしてしまうと、GoogleはAMP用データを「AMPキャッシュ」へコピーできなくなってしまいます。

つまり、下記のような

Disallow: /*?amp=1

AMPページへのクロールを禁止する設定をrobots.txtに書いてはいけません。

下記の記事にはrobots.txtで「replytocom」へのクロールを禁止にしたら、警告が表示された失敗談が解説してあります。

Google Search Console、「robots.txt によりブロックされましたが、インデックスに登録しました」への対処方法
Googleがrobots.txtを無視するrobots.txtというファイルをブログに設置すると、特定のURLをGoogleがクロールしないように制御できます。 ttps://u-ff.com/korona-kannikensakitto...

「?replytocom=」をクロール禁止にすると、「警告」でしたが、
「?amp=1」をクロール禁止にすると、「エラー」になります。

「警告」よりも「エラー」の方が深刻度が高いです。

まとめ

AMP用ページのURL(/?amp=1)をクロール禁止にしてはいけない。

robots.txtを設定した後は、Google Search Consoleの「robots.txt テスター」を使って動作確認ができます。

Google Search Console、「robots.txt テスター」の使い方
robots.txtを変更した後にすることrobots.txtを設定すると、特定のURLに対してクロールを禁止にしたり、許可したりできます。robots.txtを変更後は「果たして、このやり方であっているんだろうか?」と心配になると思います...

コメント

  1. にゃんぷん待てる様
    rinmuuですやっとここまでたどり着きました/?amp=1まだ解決していませんが
    少しずつ解決しようと思います

This website stores cookies on your computer. These cookies are used to provide a more personalized experience and to track your whereabouts around our website in compliance with the European General Data Protection Regulation. If you decide to to opt-out of any future tracking, a cookie will be setup in your browser to remember this choice for one year.

Accept or Deny

タイトルとURLをコピーしました