Автоматизированные информационно поисковые системы — страница 3

  • Просмотров 11790
  • Скачиваний 1296
  • Размер файла 25
    Кб

быть реализован в любой разрабатываемой системе. Задача распределения ресурсов поисковой системы по различным ИПС глобальной сети должна решаться адаптивно, на основании учета доли ссылок признанных релевантными во время предыдущих сеансов поиска. Второй блок автоматизированной поисковой системы отправляет созданный запрос и осуществляет сортировку и отбор полученных ссылок, после чего обращается по выбранным адресам и

получает из сети некоторое множество документов, также содержащих гиперссылки. Обработка результатов поиска. После получения в результате поиска в сети некоторого множества документов, среди них необходимо выделить наиболее релевантные. Наличие “сообществ” не облегчает эту задачу. Можно выделить следующие несколько классов наиболее частых ситуаций. Отсутствие в исследуемом сегменте сети искомой информации. В этом

случае следует перейти к другому сегменту, т. е. обычно исследовать ресурсы, созданные на других языках. Найденные “сообщества” содержат информацию не по требуемой тематике, а главным образом по другим, близким к искомой. Обнаружено слишком большое количество информационных ресурсов. В последних двух случаях необходимо осуществить автоматический перебор всех найденных документов и определить степень близости их к

исходному запросу. Во многих случаях поиска в новой области, когда общий уровень пользователя недостаточно высок, желательно осуществлять фильтрацию выдаваемой информации по стилю текста так, чтобы начальное ознакомление с материалом происходило с использованием популярных и научно-популярных текстов. Для уменьшения объема рассматриваемых материалов следует также осуществить фильтрацию результатов поиска по типу

источников. Так очевидно, что документы, расположенные на научных сайтах, на коммерческих, или на серверах СМИ будут существенно различаться по своему характеру. 2. Структура работы автоматизированных систем Работа поискового указателя происходит в три этапа, из кото­рых два первых являются подготовительными и незаметны для пользователя. Сначала поисковый указатель собирает инфор­мацию из World Wide Web. Для этого используют

специальные программы, аналогичные браузеры. Они способны скопи­ровать заданную Web-страницу на сервер поискового указателя, просмотреть ее, найти все гипетэссылки, которые на ней имеют те ресурсы, которые найдены там, снова разыскать имеющиеся в них гиперссылки и т. д. Подобные программы называют червяками, пауками, гусеницами, краулерами, спайдерами и другими подобными именами. Каждый поисковый указатель эксплуатирует для