«Битые» внутренние ссылки – конец индексации
Недавно я решил проверить степень индексируемости нескольких своих сайтов. В общем-то, сайты создавались как сателлиты для одного крупного проекта. Но не для ссылки на него, а совершенно иные задачи там поставлены.
Создавались сайты за счёт рерайченного контента с ксапа. Некоторый контент там был авторским. И Яндекс довольно шустро всё проглотил. Проиндексирована большая часть сайта, если не вся. Да и задача стояла, чтобы просто они индексировались.
Некоторое время всё шло нормально, но последняя проверка показала, что два сайта выпали из индекса. Первоё что мне пришло в голову, что поисковая система решила, что это обычные сателлиты и перестала их индексировать. Вторая причина – контент, возможно, пали подозрения по поводу авторства. Хотя там был и собственный контент, но видимо это не особо помогало.
Но проблема была проще. Дело в том, что сайты все мои работают на CMS Word Press, и статьи у меня были просто импортированы их XML-файла. Когда я настроил ссылки по дате и названию, то символы, почему-то, не воспринимались. И сайт выдавал ошибку 404. Хотя я и пытался перевести на латиницу, но видимо не все статьи были сделаны, да ещё и тэги не работали. В результате, примерно половина таких ссылок вызывали ошибку 404.
Конечно, я всё исправил, но теперь придётся долго ждать, пока поисковая система Яндекс изволит включить мой сайт в индекс. К сожалению, это далеко не всегда быстро делается. Пару сайтов, выпавшие из индекса пропали почти на пол года, а теперь там только главная страница и всё. Следует заранее позаботиться о нормальной работе сайта, и проверить, чтобы не было «битых» внутренних ссылок. Это позволит избежать неприятности с индексацией сайта.