
asahi.com から学ぶ検索エンジンから隠れる方法
twitterでasahi.comのことが話題になっていました。
asahi.com は朝日新聞デジタル日本語版サイトのことで、トップページのURLは https://www.asahi.com です。
twitter で次のことが指摘されていました。
asahi.com の特定のウェブページが、全ての検索エンジンのクロールとインデックス登録から除外されるように、メタタグに noindex, nofollow, noarchive が記述されている。
特定のウェブページとは、日本語版サイトに掲載された、英文で書かれた慰安婦報道の訂正記事を指しています。
帳面消し的な意味合いの強い「訂正記事」なので、なんとか目立たなくしようと涙ぐましい努力をしています。
- 英文記事なのに日本語サイトに掲載している
- HTMLのメタタグに細工をして検索エンジンにキャッシュされないようにしている
「すみません。嘘記事を書いていました。」
と知られたくないんですね。
メタタグの構文と意味
メタタグは html 構文のヘッダ部分、<head> ~ </head> に記述する決まりになっています。
具体例
<head><meta name="robots" content="noindex, nofollow, noarchive"></meta>
</head>
ヘッダに加えた noindex, nofollow, noarchive は、検索エンジンのクローラーに対して次のことを要求します。
- インデックスの拒否
- ページ内にある全てのリンクを無効化するようにクローラーへ要求する
- ページをキャッシュしないようにクローラーへ要求する
Googleクローラーは noindex, nofollow, noarchive に従った動作をするので、限りなく人目に触れる機会をゼロに近づけることができます。
クローラーとは、Googleなどのロボット型検索エンジンがインターネット上のファイルを収集するためのプログラムのことです。
Google社の公式サイトに書かれていたメタタグの説明を引用します。
メタタグ | 説明 |
robots | すべての検索エンジンに有効 |
noindex | ページをインデックスに登録しないようにします |
nofollow | Googlebot がページのリンクを追跡しないようにします |
noarchive | Google でページのキャッシュ リンクを表示しないようにします |
インチキ発覚後・・・
2018/08/24asahi.com は twitterで拡散されたことを気にしたのか、「吉田証言」と「挺身隊」に関する訂正記事のソースコードから、noindex, nofollow, noarchive を削除しました。
問題のスクリーンショット
問題のスクリーンショットが残っていたので、貼り付けておきます。
あとがき
noindex, nofollow, noarchive が付加されていた2つの記事を資料として残しておきます。※この記事を書いている時点で問題のヘッダは削除されています
日本語訳:「済州島で連行」証言 裏付け得られず虚偽と判断
2014年8月22日10時00分
Testimony about 'forcible taking away of women on Jeju Island': Judged to be fabrication because supporting evidence not found:朝日新聞デジタル
修正された日時 (dateModified)
"dateCreated": "2014-08-22T10:00:00+09:00",
"datePublished": "2014-08-22T10:00:00+09:00",
"dateModified": "2018-08-23T14:48:43+09:00"
2014年8月22日10時00分
Testimony about 'forcible taking away of women on Jeju Island': Judged to be fabrication because supporting evidence not found:朝日新聞デジタル

修正された日時 (dateModified)
"dateCreated": "2014-08-22T10:00:00+09:00",
"datePublished": "2014-08-22T10:00:00+09:00",
"dateModified": "2018-08-23T14:48:43+09:00"

日本語訳:「挺身隊」との混同 当時は研究が乏しく同一視
2014年8月22日10時00分
Confusion with 'volunteer corps': Insufficient research at that time led to comfort women and volunteer corps seen as the same:朝日新聞デジタル
修正された日時 (dateModified)
"dateCreated": "2014-08-22T10:00:00+09:00",
"datePublished": "2014-08-22T10:00:00+09:00",
"dateModified": "2018-08-23T14:49:30+09:00"
2014年8月22日10時00分
Confusion with 'volunteer corps': Insufficient research at that time led to comfort women and volunteer corps seen as the same:朝日新聞デジタル

修正された日時 (dateModified)
"dateCreated": "2014-08-22T10:00:00+09:00",
"datePublished": "2014-08-22T10:00:00+09:00",
"dateModified": "2018-08-23T14:49:30+09:00"

騒動が忘れられる頃に、dateModified が消されて、削除されたメタタグが復活しそうです。
朝日新聞がアリバイ作りで書いた吉田証言虚偽訂正記事の英語版にGoogle検索を回避するメタタグが埋め込まれてます。ケントさんが探してもみつからなかったのはこのせいです。わざと検索させないようにしてます。— amenonao (@amenonao) August 19, 2018
view-source:https://t.co/QkaQiVzNqS pic.twitter.com/o1JzOnc6TT
External link
アサヒる の記事 (Articles about the アサヒる)
新着順 (New arrival order)
- 【2024年度総括】藤井七冠(最優秀棋士)、羽生九段現役続行と会長退任を表明
- 【バグ】TVerRec 3.4.2 のリネーム処理不具合とその原因を考察
- 【恐怖】ポンジスキームとは?歴史から学ぶ詐欺の仕組み
- 【終息】TVerRec 3.3.9(暫定)で機能制限ほぼ解除、3.4.0リリース!
- 【緊急】TVerRec 3.3.6緊急リリース!仕様変更に暫定対応
- 【未解決】TVerRecダウンロード不具合!TVerの仕様変更かも?
- 【昇級/降級】全棋士ランキング確定、伊藤匠叡王B1へ昇級、羽生九段B2へ降級
- 【将棋】なぜ藤井聡太は人々を魅了するのか?【2024年度振り返り】
- 【更新】Lhaz 2.5.4リリース!法人利用が有料化へ
- 【Pixel 3月/2025】カメラ、WebView 、Bluetooth、電話のバグ修正【Android 15】
タイトル:asahi.com から学ぶ検索エンジンから隠れる方法:SC2
このサイトを検索 | Search this site