|
Вот некоторые причины, из-за которых сайт не индексируется:
1. Время, прошедшее с момента заполнения формы добавления сайта, не достаточно велико. У Яндекса самый быстрый поисковый робот.
Обычно, при малой загруженности его поискового робота, добавленная страница появляется в результатах поиска уже через 2-5 часа. Многие страницы попадают в результаты поиска через неделю после добавления. У других поисковых систем индекс обновляется реже. Могут даже добавляться полтора месяца.
2. Сайт был недоступен или имел слишком большое время отклика во время посещения его поисковым роботом. Если Ваш сервер сбоит не часто, то сайт через некоторое время так или иначе окажется в индексе поисковой системы. 3. Некоторые из поисковых систем (например, Google) индексируют лишь те сайты, на которых есть хоть одна внешняя ссылка с другой страницы, которая уже проиндексирована поисковой системой.
4. Неверные настройки сервера. Наиболее часто встречающаяся ошибка среди непрофессионалов — это использование .htacsess. Из-за этой ошибки поисковый робот, применяя при обращении к файлу robots.txt директивы ErrorDocument или RewriteRule, получает от сервера код, отличающийся от 200 (OK) или 404 (Not found). В этом случае индексация страницы не произойдёт, так-как поисковый робот будет в ступоре. Чтобы избежать возникновения этой ошибки, необходимо в случае использования директивы ErrorDocument всегда создавать файл robots.txt, можно сделать его даже пустым. А если же используется директива RewriteRule, необходимо быть предельно аккуратным и всегда следить за кодом ответа сервера.
5. Неверно составленный файл robots.txt. Если другие поисковые роботы подпадают под правило запрета индексации какого-то одного робота, необходимо проверить правильность написания файла robots.txt.
6. Поисковая система не способна распознавать ссылки на страницах Вашего сайта. Наиболее частый случай — все ссылки представляют собой объекты Javascript или Flash. Некоторые поисковые системы неверно воспринимают перенаправление - «редиректы». Наиболее «адекватным» в этом смысле является Google. Этот поисковый гигант без труда справляется и с ссылками в виде объектов Flash. По зубам ему и «редиректы». И только Javascript он пока пропускает.
7. Ваш сайт попал в «бан-лист» поисковой системы.
8. Имеются проблемы в работе самой поисковой системы. Фатальные сбои в работе поисковой системы редкое явление, но всё же они имеют место быть. Происходят сбои аппаратуры даже при её избыточности, и часть индекса поисковой системы при этом теряется. Кластерная структура поисковой системы также является причиной проблем.
9. Вы используете динамические страницы. Нужно сказать, что динамические страницы индексируются корректно далеко не всеми поисковыми системами. Из-за чего это происходит? Динамические страницы приносят с собой две проблемы: 1) информация дублируется — если URL вида www.site.ru имеет одно то же значение, что и URL вида site.ru для Вашего сайта, то для поисковой системы это две совершенно разные страницы; наиболее часто данная проблема возникает при отслеживании сессий посетителей. Роботы поисковых систем не используют в своей работе cookies, поэтому URL для них всегда разный; 2) робот поисковой системы способен с лёгкостью перезагрузить сайт, формирующий динамические страницы.
10. Ваш сайт находится в не индексируемой зоне поисковой системы. Каждая поисковая система имеет свою «область охвата». К примеру Рамблер и Яндекс индексируют в основном русскоязычную часть Всемирной паутины. Поэтому, если Ваш сайт не находится в одной из индексируемых доменных зон (например, su, ru, am, az, by, ge, kg, kz, md, tj, ua, uz для Яндекса; ru, su, ua, by, kz, kg, uz, ge для Рамблера), то автоматическое индексирование Вашего сайта не произойдёт. При возникновении данной проблемы необходимо написать письмо с просьбой включения Вашего сайта в индекс, в службу поддержки поисковой системы.
11. Большинство крупных поисковиков «пугаются» бесплатных хостингов с сотнями тысяч сайтов, и служб пере направления - «редиректа» (например da.ru). Если Ваш сайт расположен на подобном хостинге, индексация может и вовсе не произойти, либо её можно ждать очень долго.
12. Большинство материала сайта не уникальна.Поисковые машины не любят дублированный контент, зачем записывать то, что уже и так есть на сервере.Часто так бывает, что приходит робот, начинает индексацию, и вскоре выплевывает все и уходит. Поэтому важно, особенно в начале использовать уникальный контент.
13. Ваш хостинг ввел запрет для поисковых машин. Некоторые хостинг провайдеры иногда, с целью уменьшить нагрузку на сервер, запрещают поисковым роботам визиты.
14. Вы используете бредотекст, или в тексте очень много ошибок и робот эти страницы относит к ошибочным.
15. вы купили "забаненый" в прошлом доменное имя.
|