Как Google обрабатывает в выдаче страницы с ошибками 404 и 410

В новом обучающем видео Мэтт Каттс, глава команды по борьбе с поисковым спамом Google, объясняет, в чём для поискового робота разница между кодами состояния HTTP 404 (Not Found) и 410 (Gone).
И 404 и 410 коды ошибок веб-страницы свидетельствуют о ее недоступности.

Однако ошибка 404 обозначает, что запрошенному URL не соответствует никакая страница сайта. Этому могут быть две причины: ссылка неверна или ранее существовавшая страница была удалена. Код 404 также не сообщает, была или появится ли страница в будущем или она исчезла навсегда.

410 код состояния http-сервера определяется как «удален». Т.е. затребованный URL был, но больше не существует и навсегда удален с сервера.

Таким образом, Google относится к двум кодам немного по-разному. В случае кода ошибки 404 Google будет «защищать» страницу и не пометит ее как удаленную в течение 24 часов. И спустя некоторое время робот снова обращается к странице и перепроверяет ее.

Если Google-бот находит на странице 410 ошибку, он автоматически помечает ее в результатах выдачи как удаленную.

Если страницы больше нет, и вы думаете, что это временно, используйте код ошибки 404. Если страницы больше нет, и вы не знаете другую страницу, которой можно было бы заменить ее, и вы знаете, что эта страница больше никогда не появится, используйте код ответа сервера 410.

Статьи по теме:

Twitter покажет уведомления в браузере Месяц бесплатных ссылок Google занялась регистрацией доменов Рейтинг информационных угроз за август Impress: многоцелевой сервер приложений для Node.js Google получила запрос от RIAA на удаление 50 миллионов пиратских ссылок Ростелеком фильтрует трафик по URL, но не через DPI — правда ли дело в экономии? Операторы связи разблокировали ЖЖ Роскомнадзор внес в черный список 46 тысяч ссылок на сайты Появилась новая угроза для Android-устройств в России