Skip to content


Количество проиндексированных страниц на сайте

Занялся анализом сайтов и наткнулся на интересные подробности, но вначале о простом.

Яндекс.вебмастер сразу показывает в рубрике «Индексирование сайта» сколько было «Загружено страниц» и сколько из них попало в выдачу «Страницы в поиске«. Для исследуемого сайта это было 2567 и 848, соответственно. Очевидно, поисковая система анализируект контент, то что ей нравится — дает в выдачу, а про остальное она знает и, возможно, при очередном обновлении, если будут нужны данные страницы возьмет и их.
— количество всех проиндексированных страниц достаточно большое — sitemap.xml содержит всего 659 ссылок (нормальная ситуация для блога с 342 записями, 40 рубриками и 260 метками), а остальные — это страницы с комментариями, архивами и т.п., что так хорошо генерируется вордпрессом.

Если сайт не  ваш и вы не можете добавить его в вебмастер, то количество страниц в выдаче яндекса можно узнать простым запросом site: имя сайта.  Получил 831, чуть меньше, из-за того, что страницы попадают в выдачу не стразу, после посещения роботом сайта, для этого необходимо время. Причем, это необязательно связано с новыми страницами: статичный сайт, который совершенно не менялся пол года постоянно меняет число страниц, происходят небольшие «флуктуации».

Что интересно, именно количество страниц в выдаче яндекса показывают анализаторы сайтов типа PR-CY.ru.

Теперь перейдем к google webmaster — единственное что он может показать, это количество страниц их файла sitemap.xml, размещенного в корне каталога. Для того, чтобы узнать, сколько страниц в проиндексированно нужно задать  site: имя сайта в строке поиска (для рассматриваемого сайта было получено 3060). Но не все эти страницы участвуют в выдаче, «странице в поиске» показываются по запросу  site: имя сайта/* или  site: имя сайта/&  — 618

Однако, тот же PR-CY.ru при анализе показывает  3060! Да и все остальные системы делают тоже самое: считают страницы в выдаче яндекса и общее количество проиндексированных страниц у гугла. Вот такое несоответствие.

Есть еще нюансы, в зависимости от того, как вы приписали настройки dns для своего сайта запросы могут давать различные цифры.

 site:www.имя сайта.ru
 site:имя сайта.ru  

 Запрос с суффиксом www в гугле более предпочтителен, поскольку он выдает данные на весь домен, с учетом возможных поддоменов.

Запрос с именем сайта в кавычках  site:»имя сайта.ru» дает 618, количество страниц в выдаче.

 

Posted in SEO, Блогинг, теория.


Выбор хостинга

В одной записи я уже поднимал вопрос о хостинге, но теперь пришло время поделится накопившемся опытом.

Основной вопрор при создании сайта, блоге — где его разместить? На платном или бесплатном хостинге. В чем отличия?

Бесплатный хостинг

  • Преимущества:
    – он бесплатный;
    – не нужно заниматься апгрейдом и настройкой (как например в ЖЖ или в системе .com).
  • Недостатки:
    – можно использовать только для доменов 3 уровня, прикрутить к ниму свой домен потребует денег;
    – не доступны многие стандартные функции  (доступ к сайту фтп, добавление свох тем или плагинов запрещено — можно выбирать из разрешенного  набора);
    – существуют ограничения на трафик, место на диске и т.п.;
    – любые дополнительные услуги необходимо оплачивать (платные акаунты и т.п.);
    – сложно (неудобно) монетизировать сайт на таком хостинге, часто могут использоваться банеры и собственная реклама хостера.

Платный хостинг

  • Преимущества:
    – выбираете тот тарифный план, который вам нужен, не платите за лишнее;
    – полная свобода действий: настраиваете все что нужно, создаете поддомены, почту, любой движек;
    – тех. поддержка: можно задать вопрос, на который оперативно ответят, помогут что-то настроить.
  • Недостатки:
    – необходимость платить;

Я достаточно давно занимаюсь сайтами и в начале делал все только на бесплатных хостингах. На них можно тренироваться, обкатывать блоги. Неплох для этого сервис wordpress.com, однако, выбор плагинов и тем там ограничен, а за подключения блога на домен 2 уровня придется достаточно много заплатить. Гораздо дешевле купить домен и хостинг раздельно.

На что нужно смотреть при выборе хостинга?

  1. Объем трафика, входящего и выходящего, хотя у многих он уже не ограничен. Для блога с 300 записями и 2000 посещений в сутки и фотографиями на внешнем сервисе необходимо около 10-20 Гб в месяц. Если посещаемость слабая (10-100 посетителей), но вы активно раскручиваете сайт, то достаточно большое количество трафика могут съесть роботы поисковых систем, тогда необходимо в robots.txt устанавливать ограничения, запрещать просмотр некоторых разделов.
  2. Место под сайты. Для блога без большого количества картинок и других медиа-материалов вполне достаточно 50М, см. статью, как можно уменьшить размер блога на диске, если у вас много картинок, то их можно размещать на стороннем сервисе (например в пикасо), либо сразу брать хостинг с 500-1000Мб.
  3. Количество БД MySQL — под блог на вордпрессе необходима как минимум одна, если у вас планируются поддомены, в которых будут работать форумы или другие системы, то больше. Хотя форум можно прикрутить к той же базе данных что и блог.
  4. Система управлением хостингом. Самая удобная и простая система — это c-Panel, хотя используют и другие.
  5. Способы оплаты. Смотрите, чтобы хостинг поддерживал тот метод оплаты, который вам наиболее удобен (вебмани, например).

Хостинг для блога на вордпрессе можно найти от 0.5$ в месяц, что легко окупается с помощью sape. Если на ваш сайт ходит мало посетителей, до 100-1000 в день, то самого простого и дешевого хостинга будет достаточно.

Дальше необходимо посмотреть, насколько хостинг справляется с нагрузкой, насколько быстро грузятся страницы. Вордпресс достаточно требователен к ресурсам, хотя хостинг можно подстраивать, устанавливать дополнительные плагины, но тут опять таки лучше чтобы это делал специалист.

Я достаточно долго искал подходящий хостинг, сразу оптимизированный и настроенный под wordpress и нашел — hostingland.ru, стоимость 100 рублей в месяц за 1 сайт и 1000Мб места. После переезда на этот хостинг страницы блога стали загружаться значительно быстрее. За год сервис всего несколько часов был недоступен. Трафик не ограничен. После регистрации дается 14 дней бесплатно протестировать хостинг (правда на 1 акаунт только 1 раз). После того как я перенес туда первый блог и мне все понравилось, я постепенно перенес и все остальные (по мере окончания срока хостинга в других местах) и теперь рекомендую этот сервис всем. Кстати, существует и партнерка: можно получить 10% от привлеченных клиентов.

Так что рекомендую, хостинг в Новосибирске, оптимизированный для вордпресса.

 

Posted in Блогинг, технические заметки.


WordPress 3.0

Появилась новая версия моего любимого движка, начинаю пробывать. По описанию — улучшений масса. Множество исправленных багов.

Из очевидного сразу:

  • новый дизайн админки
  • подменю «обновить» переехало вверх
  • можно создавать свое меню.
  • админка работает быстро.
  • память используется (с 32 плагинами) всего 24М, ресурсоемкость не сильно изменилась.

Непонравилось:

  • новый стиль, который идет по умолчанию, ничего особенного из себя не представляет. Если попробывать скачать новую тему, имеющую те же возможности (настройка цвета и картинки в заголовке, несколько панелей для виджетов сбоку, сверху и снизу), то на выбор будет несколько десятков тем, гораздо более интересных. Это только для новичков, поиграться
  • В одной из установок вордпреса после апгрейда невозможно изменить настройки экрана в режими редактирования, к тому же пропали рубрики, котоые не получается вернуть (пользуюсь перой, может в ней дело?). Второй вордпрес с такими же настройками на том же сервере ведет себя нормально. Возможно из-за разных первоначальных настроек экрана редактирования.

Posted in CMS.

Tagged with .


Очистка вордпреса

Сегодня расскажу о уменьшении места, которое нужно вордпресу на хостинге. Для многих это будет не актуально, сейчас хостинг стал дешевый, за несколько $ в месяц предлагают гигабайты на диске, но есть и минимальные тарифы, по 50-100-500 мегабайт, для пользователей которых данная информация будет очень полезна.

Что необходимо? Доступ по ftp к вашему блогу на .

Что будем удалять?

  1. Темы оформления, которые вам больше не нужны. Если вы планируете когда-то поменять — удалите, перекачайте на свой компьютер, когда будете менять, тогда и закачаете. Тоже самое относится и к неиспользуемым плагинам.
  2. Файлы с переводом интерфейса (в основном плагинов и админки) на различные языки, файлы которые заканчиваются вот так: es_ES.mo (испанский), zh_CN.mo (китайский). Эти файлы лежат обычно в папках lang, languages, только оставляйте файлы с русским языком RU.po и оригинальные с расширением .pot
  3. Скриншоты, файлы типа screenshot-1.png
  4. Различные инструкции типа readme.txt, readme.html, если вы опытный пользователь, то и так знаете что там написано, если будет нужно — всегда можно зайти на страничку плагина и прочитать все что нужно. А если вдруг с плагином начинаются проблемы, то все равно нужно лезть на сайт, общаться с автором.
  5. Лицензии в формате .txt, все равно кроме вас их там никто не прочитает
  6. Папки с временными файлами, которые созданы плагинами. Они могут остаться, если вы отключали плагины не отключив их в настройке.
  7. Неудачные апгрейды, папка upgrade, там могут остаться временные файлы.
  8. Образцы конфигов, wp-config-simple.php, которые идут в инсталяте, старые версии конфигов и системных файлов — их часто создают различные плагины после редактирования, добавления в конфиги своей информации.
  9. Карта сайта в формате xml, она занимает много места, если у вас много страниц. Можно настроить плагин для генерации карты на создание только запакованного.

Где лежат эти файлы? каталог public_html/каталог, куда установлен вордпресс/wp-content
основной размер создают плагины plugins и темы. Удалите все темы, кроме используемой, затем займитесь плагинами.

Вот вам пример, один из самых популярных плагинов simple-tags, содержит

  • 6 скриншотов (414к)
  • 1 ридми (12к)
  • 18 файлов переводов (1064К),  16 если оставлять русский (879к)

практически полтора мегабайта совершенно ненужной информации, после очистки остается всего 515к, т.е. 75% из занимаего им по умолчанию места было совершенно бесполезно.

Другой пример, плагин wp-optimize, общий размер до очистки 163к, после 28к. Что не нужно: index.htm, readme.txt, screenshot-1.jpg, screenshot-2.jpg, wp-optimize-fa_IR.mo, wp-optimize-fa_IR.po. Уменьшается в 5 раз!

Популярный google-sitemap-generator после очистки всего 276к,  выкидывается 1.5 мегабайта описания и интерфейсов на разных языках.

После полной очистки блог становится заметно меньше, 18 мегабайт для сайта с 26 плагинами (без учета картинок в постах), до очистки 30-40М. Это кажется совсем немного даже если у вас 50-100 мегабайт, но оставшееся место будет быстро сокращаться, например, из-за временных файлов различных кэширующих плагинов и в какой-то момент сайт может перестать работать.

Если вы закачиваете картинки в блог, то со временем каталог с ними станет очень большим.  Старайтесь сжимать и оптимизировать размер картинок.

Один минус ручной очистки — после обновления плагина его нужно чистить заново.

Что пожно еще выкинуть? как уменьшить размер установки не ухудшая функциональность?

Posted in CMS, технические заметки.

Tagged with .


Рейтинг совершенно не научных фантастических сериалов

В последнее время просмотрел много сериалов, позиционирующих себя как научно-фантастические. Но к сожалению, их можно назвать только фантастическими, наукой там даже и близко не пахнет. Основная проблема — не может один человек разбираться во всех научных направлениях сразу. А поскольку состав актеров ограничен жанром, то один-два или несколько актеров, играющие ученых становятся супер вундеркиндами во всех областях. Такое было возможно в 19 веке и раньше, когда все научные теории в принципе было возможно рассмотреть и изучить за одну человеческую жизнь. Чем дальше развивалась наука, тем более узкими становились исследования, а сейчас человек из соседней лаборатории может совсем не понимать коллегу из соседней комнаты. В общем это общая проблема, не будем на ней больше останавливаться, переходим к рейтингу.

  1. Числа (Numb3rs)
    Ученый, математик-прикладник помогает брату из ФРБ расследовать преступления с помощью математических методов. В целом все правдоподобно, методы и теории, на которых основывается помощь существуют в реальном мире, о них даже правильно и интересно рассказывают. Одно но, презентации для объяснения и программы для расчетов составляются моментально. Можно подумать, что как только есть формула, она сразу начинает обрабатываться компьютером, база данных сама создается, данные вводятся сами собой. В жизни бы так, чтоб за тебя все делала группа программистов и дизайнеров за кадром. Интересно, но надоело к 3 сезону однообразностью сюжетов.
  2. Эврика (Eureka)
    Город ученых с совершенно нереальными технологиями. например главный компьютер естественно квантовый, по мощности превосходит все остальные существующие на земле в несколько раз. Начальники, которые разбираются во всем и сразу. Пара ученых, которые разбираются во всем еще лучше, начиная от генетики и погоды и заканчивая квантовой физикой, программированием роботов и т.п.. Особенно умиляют школьники, которые в качестве курсового проекта делают то, что в жизни не способны сделать несколько институтов за десятилетия (термоядерный синтез, как вулкан из глины, просто даже для младших классов). И конечно военные, которые все это финансируют. Вначале смотреть интересно, но чем дальше, тем менее научные становятся сюжеты. Я, так как сам физик, долго смотреть это не смог.
    Сериал для школьников, создан для популяризации науки.
  3. За гранью (Fringe)
    Основной ученый сериала не просто разбирается во всем. Он предварительно просидел запертым 17 лет в психушке, но прекрасно знает все научные достижения современности. Да еще оказывается, что любая технология у террористов (специфика, сериал о расследованиях ФБР) проходила через его лабораторию лет 20-30 назад по военным заказам, а кроме него никто не в силах разгадать эту загадку. В общем совершенно нереально, Главная героиня постоянно ходит с кислым лицом. Сериал вначале затянул, но после 3-5 серил разонравился, не впечатляет.

Предлагайте еще сериалы для моего рейтинга, добавлю, посмотрю :)

Posted in сериалы, Фильмы.