Ответ на комментарий к статье «Поиск отдыха и развлечений»
Конкретные результаты поиска, конечно, зависят от того, какой контекст проиндексирован.
В настоящее время списки сайтов для индексации в нашей системе проходят отбор.
Что касается подъема по частоте вхождения искомых слов – то, поиск по одному слову с точки зрения любой оптимизации выглядит, мягко говоря, не корректно или даже глупо…
Попробуем сделать аналогичный запрос на гугль, яндекс или гого:
http://www.google.com.ua/search?hl=uk&q=%D0%9C%D0%B0%D0%BB%D1%8C%D1%82%D0%B0&btnG=%D0%9F%D0%BE%D1%88%D1%83%D0%BA+Google&meta=&aq=f&oq=
http://yandex.ru/yandsearch?p=0&text=%D0%9C%D0%B0%D0%BB%D1%8C%D1%82%D0%B0&lr=187
http://gogo.ru/go?q=%CC%E0%EB%FC%F2%E0&
Что мы видим на первом месте – оплаченные сайты, ссылки на википедию (тоже поднятые искусственно), а потом?
Потом – все те же высокочастотные вхождения одного искомого слова, но оценить их число труднее из-за огромного кол-ва ресурсов. Однако, по числу вхождений слова «Мальта» в заголовок ресурса понятно – что и гугль и яндекс используют этот показатель, как один из основных, который основан на запросе пользователя (ведь при запросе из одного слова очень трудно найти другие). И у гугль и у яндекс и у гого – на первых страницах (не считая явно искусственно поднятых) в заголовках 4-5 вхождений искомого слова «Мальта», но, начиная с 30-й страницы их число уменьшается до 2-3 и, начиная с 50-й – уже 1-2…
Оценить, как сменяется число вхождений искомого слова в контенте ресурсов – сложнее, хотя косвенно, даже по представленному в подсветке фрагменту ресурса – подтверждается аналогичная частотная закономерность.
Так что бесспорные монстры глобального поиска, такие как гугль, тоже «рассчитывает» на «доморощенных оптимизаторов» при обработке запросов из одного слова, разница лишь в том, что объемы ресурсов данных систем в сотни тысяч раз превышают наши скромные возможности. Огромным системам типа гугль приходится задействовать для отбора горстки ресурсов, доступных для показа (сравните, по запросу «Мальта» гугль находит около 18 500 000 ресурсов, но доступны для просмотра лишь около 1000 – что составляет 0.0054% от общего числа найденных/проиндексированных) сложные эвристические механизмы и алгоритмы, суть которых составляет тайну технологии и исследуется во всем мире как «черный ящик», а работа которых в конечном итоге сводится к расчету неких, не зависящих от пользователя и его запроса, числовых показателей, которые сохраняются с индексом и используются для быстрого отбора этих тысячных процента… Читать дальше…
Комментарии