четверг, 30 июля 2009 г.

Оптимизация. Полные дубли страниц в пределах домена.

Тормоз ищет таланты! Нужны умные головы... * [Бомж-Провинциал]

Хотя официальные источники из Яндекса утверждают, что дубли контента внутри сайта, не влияют на позиции в поисковой выдаче. Однако опыт показывает, что устранение всех внутренних дублей помогает улучшить ситуацию по многим запросам.

Я хочу рассказать об основных элементах, которые способствуют автоматическому созданию полных дубликатов сайта:

1. Версии страниц для печати.

Очень часто на сайтах не закрывают от индексации страницы предназначенные печати документа. В основном они отличаются от основных страниц отсутствием графики и других элементов дизайна, но при этом полное совпадение основного контента.

Я рекомендую закрывать такие страницы в файле robots.txt. Сделать это довольно просто, обычно url адреса таких страниц содержат слово «print».

Кстати, автоматическое создание таких страниц характерно для сайтов, сделанных на движке Joomla (он еще pdf генерит, которые также индексируются и могут добавить ряд неудобств).

2. Индексные страницы

Попробуйте набрать в адресной строке www.site.ru/index.php, www.site.ru/index.html, www.site.ru/index.shtml, www.site.ru/index.htm, www.site.ru/index.asp, www.site.ru/default.asp и т.п., если данный страницы открываются в браузере, и сервер отдает статус код 200ОК, то перед вами дубли главной страницы. Данные страницы необходимо закрыть от индексации или настроить 301 редирект на страницу www.site.ru.

Хочется отметить, что наличие индексных страниц характерно не только в корневом каталоге, но и в некоторых внутренних (www.site.ru/page/index.html).

Наличие данных страниц в индексе поисковой системы Яндекс свидетельствует о присутствие на сайте ссылки на индексные файлы.

3. Результаты поиска

Если на сайте реализована возможность поиска, то в результатах очень часто дублируется существующий на сайте контент (примером может послужить этот блог). В этом случае обязательно стоит закрывать результаты поиска от индексации.

4. Слеш/ без слеша.

За этим бессмысленным подзаголовком подразумевается очень серьезная и часто остающаяся без внимания проблема. Хотя выявить ее довольно просто, достаточно зайти в какой-нибудь каталог на сайте и стереть в адресной строке слеш. Если после загрузки страницы в адресной строке так и остался адрес без слеша, то данная проблема присутствует на сайте.

Дело в том, что для поисковика страницы http://www.site.ru/category/ и http://www.site.ru/category совершенно разные страницы. Порой даже они различаются по своему содержанию (показывается страница предыдущего раздела). Это исправляется путем настройки 301 редиректа со страницы http://www.site.ru/category на http://www.site.ru/category/.

5. Фильтры, сортировки

При наличии сортировки или возможности фильтрации товаров в из каталога, также возникает вероятность возникновения дублей контента.

6. Краткие обзоры

Это характерно в основном для блоков новостей, каталога статей и т.п., когда в качестве краткого описания выступают абзацы из основной статьи. Если нет возможности сделать уникальные обзоры, то я стараюсь закрыть такие блок в тег .

7. Страницы с тегами, статьи по дате, автору и т.п.

Особенно характерно для блоговых движков. Получаем много одинаковых страниц с разными url адресами.

8. Неправильная настройка 404 ошибки

Про настройку 404 ошибки я сделаю отдельную статью, но упомянуть здесь все же стоило.

Здесь указаны наиболее часты причины возникновения полного дублирования контента, совсем мелкие и редкие случаи я упоминать не стал.

Похожие записи:

  1. Оптимизация. Настраиваем основное зеркало. Лично я правильной настройки зеркал уделяю очень большое внимание....
  2. Оптимизация С сегодняшнего дня на моем блоге появляется новая рубрика,...
  3. Оптимизация. Настройка внутренних ссылок. Как и обещал, начинаю публикацию своих мыслей по поводу внутренней...


Гарантированное размещение в англоязычных каталогах.
* Реклама в бомжеленте.

Помогите детям!

[http://4ill.ru/optimizaciya-polnye-dubli-stranic-v-predelax-domena/]