Теоретик СЕОТеоретик СЕО

Компоненты, составляющие основу поисковой системы

Основы поисковой системыДля продвижения вашего сайта вам придется тесно работать с основными поисковиками. Наверняка каждому приходилось слышать такие термины, как паук, краулер, индекс поисковика и другие. Эти понятия являются одними из главных компонентов из которых состоит каждая поисковая система.

Паук (Spider) — браузероподобная, не имеющая визуальных компонент программа, обеспечивающая скачивание веб-страниц. В отличии от привычного браузера, который отображает всю информацию, содержащуюся на странице, паучок работает с html-текстом напрямую.

Краулер (Crawler — иначе «путешествующий» паук) — автоматически проходящая по всем сайтам программа. Выделяя все находящиеся на странице ссылки, координирует дальнейшие действия паука, на основании заранее составленного списка адресов или исходя из заданных ссылок. Занимается поиском новых документов, следуя по отысканным ссылкам.

Индексатор (Indexer) — программа для анализа разобранных на части веб-страниц, скачанных и найденных пауками. Анализируются следующие элементы страниц: как заголовки, текст, специальные html-теги, стилевые и, конечно, структурные особенности страниц.

(Database) База данных — общее хранилище всех собранных данных, скачанных и проанализированных поисковой системой страниц.

Система выдачи результатов или Search engine results engine — отвечает за извлечением из базы данных результатов поиска. Это самый важный для оптимизатора компонент в работе поисковика, так как выдает полезную и очень ценную информацию о том, какие страницы больше всего подходят под запросы пользователя и в каком порядке их лучше расположить(процесс ранжирования).

Веб-сервер или Web server — компонент, осуществляющий процесс взаимодействия между поисковой системой и пользователем. Отвечает за выдачу в виде html-страницы результатов запроса пользователя по интересующему поисковому термину.

Не смотря на то, что всем основным поисковикам присущи общие черты, которые были описаны в этой статье, каждая поисковая система наделена своим алгоритмом ранжирования и существуют некоторые различия в способах реализации механизмов поиска. Так например, некоторые поисковые компоненты могут быть собраны в одну программу. Как правило, это сочетание элементов Spider+Crawler+Indexer, которое ускоряет скачивание популярных ресурсов, поиск новых веб-страниц и делает анализ их элементов.

  1. vfesyuk: 20.06.201420:30

    Следует добавить, что в каком-то элементе ПС «сидит» алгоритм отношения к ресурсу. В частности: скорость его обновлений, его трастовость, и так далее. Задача веб мастера: дружить с ПС, зная или угадывая то, что он хочет.

Ваши данные

*