Skip to content


Количество проиндексированных страниц на сайте

Занялся анализом сайтов и наткнулся на интересные подробности, но вначале о простом.

Яндекс.вебмастер сразу показывает в рубрике «Индексирование сайта» сколько было «Загружено страниц» и сколько из них попало в выдачу «Страницы в поиске«. Для исследуемого сайта это было 2567 и 848, соответственно. Очевидно, поисковая система анализируект контент, то что ей нравится — дает в выдачу, а про остальное она знает и, возможно, при очередном обновлении, если будут нужны данные страницы возьмет и их.
— количество всех проиндексированных страниц достаточно большое — sitemap.xml содержит всего 659 ссылок (нормальная ситуация для блога с 342 записями, 40 рубриками и 260 метками), а остальные — это страницы с комментариями, архивами и т.п., что так хорошо генерируется вордпрессом.

Если сайт не  ваш и вы не можете добавить его в вебмастер, то количество страниц в выдаче яндекса можно узнать простым запросом site: имя сайта.  Получил 831, чуть меньше, из-за того, что страницы попадают в выдачу не стразу, после посещения роботом сайта, для этого необходимо время. Причем, это необязательно связано с новыми страницами: статичный сайт, который совершенно не менялся пол года постоянно меняет число страниц, происходят небольшие «флуктуации».

Что интересно, именно количество страниц в выдаче яндекса показывают анализаторы сайтов типа PR-CY.ru.

Теперь перейдем к google webmaster — единственное что он может показать, это количество страниц их файла sitemap.xml, размещенного в корне каталога. Для того, чтобы узнать, сколько страниц в проиндексированно нужно задать  site: имя сайта в строке поиска (для рассматриваемого сайта было получено 3060). Но не все эти страницы участвуют в выдаче, «странице в поиске» показываются по запросу  site: имя сайта/* или  site: имя сайта/&  — 618

Однако, тот же PR-CY.ru при анализе показывает  3060! Да и все остальные системы делают тоже самое: считают страницы в выдаче яндекса и общее количество проиндексированных страниц у гугла. Вот такое несоответствие.

Есть еще нюансы, в зависимости от того, как вы приписали настройки dns для своего сайта запросы могут давать различные цифры.

 site:www.имя сайта.ru
 site:имя сайта.ru  

 Запрос с суффиксом www в гугле более предпочтителен, поскольку он выдает данные на весь домен, с учетом возможных поддоменов.

Запрос с именем сайта в кавычках  site:»имя сайта.ru» дает 618, количество страниц в выдаче.

 

Posted in SEO, Блогинг, теория.


4 Responses

Stay in touch with the conversation, subscribe to the RSS feed for comments on this post.

  1. Сергейsays

    полезная информация для анализа своего сайта

  2. Александрsays

    Есть способ проще. скачать программу — Site-Auditor
    там все это можно посмотреть за пару минут.

    • adminsays

      посмотреть можно в разных программах и на разных сайтах, но если не понимать, что они собирают, по какому алгоритму, то смысла в этом нет

  3. websersays

    А сколько надо страниц в индексе яшы чтоб тиц был?



Some HTML is OK

or, reply to this post via trackback.


девять − = 5