エラーメッセージとはHTTPステータスコードのことを言います。
HTTPステータスコードとはそもそも何か。まずその仕組みから理解しましょう。
PCやスマートフォンからウェブサイトを閲覧するためには、Google ChromeやMicrosoft edgeといったウェブブラウザなどを通して、閲覧したいウェブサイトがあるWebサーバーへリクエストを送ります。
すると、Webサーバーからリクエストに対する返答がきます。
なんの問題もなくリクエストが実行されれば、閲覧したいウェブサイトがすぐ表示されますが、何かしらの問題があった場合、数字が表示されることがあります。
それが“HTTPステータスコード”です。“HTTPステータスコード”は、大きく5つの種類に分けることができます。
※参考:https://developer.mozilla.org/ja/docs/Web/HTTP/Status
ステータスコード自体目にすることが少ないですが、ウェブサイトをリニューアルしてURLを変更した場合であれば、「301リダイレクト」などは言葉として耳にしたり、ブラウザ上でも目にすることが多いかと思います。
そしてSEOにおいても上記ステータスコードが関係する場合があります。
レスポンスの状況によっては、インデックス(Googleの検索結果として表示されるためのGoogle側のウェブページ記憶)がされない、もしくは削除される等の可能性があるからです。
特に上記表の「4・・」に含まれる「404」と「410」について、各ウェブサイトを運営するウェブマスターたちは、その違いや両者におけるGoogle側の見解を知りたいなど、Googleが開催するHang outなどでも質問が出るほどです。ではこの2つはどのような違いがあるのでしょうか。
ステータスコード404と410は、以下のような違いがあります。
これは、“Not Found”=リクエストされた結果(ページ等)が見つからないという結果です。
さらに言えば、現在リクエストしたけど見つからないという内容で、時間軸で考えると「今」の結果です。
これは“Gone”=リクエストされた結果はいなくなった(削除された)という結果です。
404と違い、現在だけでなく、永久的にページが削除され、戻ってくることがないという結果です。
こう見ると、違いがわかる・・・ように思えますが、SEO的な考えで見るとウェブページがないという状況なので、結果的にGoogleの認識は変わらないのでは?となります。
現在はGoogleに所属していないですが、以前Googleの重要人物であったMatt Cuts氏は、当時以下の動画で回答しています。
“Does Google treat 404 and 410 status codes differently?”
Googleは、ステータスコード404と410で異なる扱いをする場合もあるが、その違いについてセンシティブになる必要はないようです。
ただ、クローリングシステムでみると、下記のような違いがあります。
基本的にはエラーかもしれないし、意図的に行ったものかもしれないしということで、Googleのクローラーは定期的にページをチェックしてくれるようです。その頻度が通常通り、24時間なのか頻回なのかの違いはありますが。
尚、上記動画は2012年のものとなっており、GoogleのJohn Mueller氏が2018年に英語サイトのウェブマスター向けに行っているハングアウトでも、404と410における質問が出ておりましたのでそちらの内容も確認してみましょう。
English Google Webmaster Central office-hours hangout
中長期的にみれば、404も410も同じであるとしており、どちらの場合での対象となるページURLをインデックスから削除すると回答しています。あるかどうかわからないページへのクロールには時間をあまり使わないように、クローリング頻度を減らすとのこと。微妙な違いがあるとすれば、インデックスから削除される時間が、404よりも410の方が早いことがあるそうですが、2~3日の違いしかないようです。
Matt Cuts氏が話していたよりも、404と410それぞれの違いがなくなってきているようです。
この2つのステータスコードについては、大きな違いはないと考えて良いでしょう。
ページの評価についても異なる扱いをすることはないので、この問題は神経質に捉えずともよさそうですね。