§ Механизмы работы поисковых систем
Основная задача любой поисковой системы – дать пользователю ответ на его запрос. Ответ поисковой системы в сети Интернет должен быть актуальным и информативным.
1. Первая задача поисковых систем – сбор информации или «индексация» сайтов. Для этого сначала поисковые системы формируют свои базы знаний или так называемый «индекс» – роботы поисковой системы ходят по сайтам, забирают тексты и картинки, и, сформировав это в удобный для использования вид, складывают в свои архивы. Одновременно страницы и сайты анализируются на предмет морфологии, текстов, тематики и положении в сети Интернет относительно других сайтов. Конкретная работа роботов строится на алгоритмах, созданных совместной работой лингвистов, программистов и аналитиков. Из-за того, что объем информации в сети Интернет огромен (по данным поисковой системы Яндекс, ими проиндексировано 5 тысяч 610 Гб информации), сбор и хранение данных требует огромных мощностей – высокопроизводительных серверов с большой памятью и сильными процессорами.
2. Следующая задача поисковых систем – определение тематики информации (определение тематических групп, рубрицирование сайтов по теме их текстов). Делается это частично вручную, например, у многих поисковых систем существуют собственные каталоги сайтов, когда опытный редактор точно соотносит некий ресурс конкретной рубрике в огромном списке сайтов. Для определения важности ресурса в сети создателями поисковых систем были придуманы коэффициенты и методы их расчета, основанные на учете внешних ссылок на сайты. Это тИЦ (тематический индекс цитирования) у Яндекса, Page Rank у Google, коэффициент популярности у Рамблера. Эти данные даже частично показываются пользователям, но на самом деле расчетов гораздо больше. На этом подготовительная стадия заканчивается.
3.Основная задача поисковых систем – поиск и вывод ответов на запросы пользователей. Эта функция есть поиск по огромному массиву индекса с учетом неких заложенных алгоритмов релевантности и дальнейшего ранжирования результатов. Эта информация в удобном виде преподносится пользователям – показываются сниппеты (выдержки из текста), жирным выделяются запрошенные слова.
4. Еще поисковые системы анализируют реакцию пользователя на информацию, выданную поисковой системой. У поисковой системы Google есть панель-бар (надстройка к браузеру), с помощью которой пользователь может высказать свое мнение об отношении к тому сайту, на который его отправила поисковая система.
Так же многие российские поисковые системы учитывают как и куда пользователи кликают из результатов поиска. Точной информации о том, как что учитывается нет, но понятно, что чем меньше на сайт кликают по сравнению с другими сайтами, тем менее он релевантен запросам пользователей.
|