
URLがrobots.txtによってブロックされています (Google Search Console)
対象:Google Blogger ユーザー
Google Search Console のサイトマップに警告が2件記録されていたので、警告の詳細(サイトマップインデックス)を確認したところ、以下のコメントが見つかりました。
コメント内容から robots.txt の記述に問題があることがわかったので、警告が記録されないよう修復した手順をメモに残します。
問題 | URL が robots.txt によってブロックされています。 |
説明 | サイトマップには robots.txt によってブロックされている URL が含まれています。 |
例 | サイトマップ: kzstock.blogspot.com/sitemap.xml?page=1 値: https://kzstock.blogspot.com/2018/09/internet-archive-legal-evidence.html |
問題の原因を特定することはできたが修復方法が・・・?
サイトマップインデックスのコメントから robots.txt の以下の記述がクロールエラーを引き起こしていることがわかりました。
Disallow: /*archive
上記の記述は過去にrobots.txtを更新した時に追記したものだと思われます。
よく覚えてない。
Blogger の robots.txt を修正するために情報収集をする過程で、Bloggerユーザーは漏れなく Disallow: /*archive を設定していることがわかったので、私もそれに倣って意味も調べずに設定したような記憶です。
Disallow: /*archive の意味
クロールエラーを引き起こした Disallow: /*archive の意味を調べました。そして、次のことがわかりました。
朝日新聞やテレビ朝日がやっていたような、検索エンジンから隠れる設定になっていました。
具体的には、当方のBloggerの投稿記事のURLに [archive] という文字が含まれていた場合、検索エンジンがインデックスすることを拒否する設定になっていました。
具体的には以下のURLです。
タイトル:ウェイバックマシン (Wayback Machine/Internet Archive) は証拠能力があると米国司法が判断
https://kzstock.blogspot.com/2018/09/internet-archive-legal-evidence.html
タイトル:ウェイバックマシン (Wayback Machine/Internet Archive) は証拠能力があると米国司法が判断
https://kzstock.blogspot.com/2018/09/internet-archive-legal-evidence.html
Disallow: /*archive を修正する方法
Blogger > 設定 > 検索設定 > 独自の robots.txt > 編集
警告が記録されないように、そして、投稿した記事がGoogleにインデックスされるように、"Disallow: /*archive" の記述を見直しました。
ここで躓きました。
Google Search Console から修正を試みたのが間違いでした。
Bloggerの robots.txt は管理画面から修正しなければなりません。

[編集] をクリックすると robots.txt が表示されるので、編集がおわったら [変更を保存] を選択します。
修復方法
修復方法は2通り考えられます。- Disallow: /*archive の行をまるごと削除する
- Allow: /*archive に修正する
将来復活させる予定があるので、今回は修正する方法(プランB)を選択しました。
Allow: xxx は記述する必要はありませんが、将来元に戻すときに Disを先頭に付加するだけで済むので、あえて残しています。

あとがき
Google Search Console を利用してサイトマップのクロール状況を確認する方法は次の通りです。Search Console > クロール > サイトマップ
問題が検出されている時のみ [問題の件数:警告数2] などが記録されます。
今回の例では、[警告数:2] のリンクをクリックすると、詳細情報が表示されます。

Blogger の記事 (Articles about the Blogger)
- 【Blogger】指定したラベルの記事を新着順で抽出して一覧表示する(ことに成功)
- Google Bloggerブログがマルウェア検出で公開停止に!原因は?復旧は?
- IFTTT 使用レポート(使い方)
- Blogger: ブログのページ幅を最適化(アドセンス対策)
- Bloggerの管理画面が英語表記になる時の緩和策
- moreタグの動作をカスタマイズする方法|Blogger
- アドセンスコードをmoreタグの位置に挿入する方法(同期コード)
- more タグの位置にアドセンスコードを挿入する方法
- モバイルユーザビリティエラーの対処方法 (Blogger)
- Google Search Consoleに記録された構造化データエラーとは?(対策あり)
- Blogger ラベルの記事(要約付)
- GSC が含まれる記事(要約付)
新着順 (New arrival order)
- 【2024年度総括】藤井七冠(最優秀棋士)、羽生九段現役続行と会長退任を表明
- 【バグ】TVerRec 3.4.2 のリネーム処理不具合とその原因を考察
- 【恐怖】ポンジスキームとは?歴史から学ぶ詐欺の仕組み
- 【終息】TVerRec 3.3.9(暫定)で機能制限ほぼ解除、3.4.0リリース!
- 【緊急】TVerRec 3.3.6緊急リリース!仕様変更に暫定対応
- 【未解決】TVerRecダウンロード不具合!TVerの仕様変更かも?
- 【昇級/降級】全棋士ランキング確定、伊藤匠叡王B1へ昇級、羽生九段B2へ降級
- 【将棋】なぜ藤井聡太は人々を魅了するのか?【2024年度振り返り】
- 【更新】Lhaz 2.5.4リリース!法人利用が有料化へ
- 【Pixel 3月/2025】カメラ、WebView 、Bluetooth、電話のバグ修正【Android 15】
タイトル:URLがrobots.txtによってブロックされています (Google Search Console):SC2
このサイトを検索 | Search this site
0 コメント