Шпоры по теории информации, мировые информационные ресурсы и сети — страница 12

  • Просмотров 7203
  • Скачиваний 348
  • Размер файла 4539
    Кб

или страницы по ключевым словам с помощью локальной поисковой машины. База данных ссылок (индекс) каталога обычно имеет ограниченный объем, заполняется вручную специалистами, создающими каталог. Некоторые каталоги используют автоматическое обновление индекса. Результат поиска в каталоге представляется в виде списка, состоящего из краткого описания (аннотации) документов с гипертекстовой ссылкой на первоисточник. (Yahoo, List.Ru, )

Поисковая машина - поисковая система с формируемой программным "роботом" базой данных, содержащей информацию об информационных ресурсах. Все поисковые машины, предназначенные для сети Интернет, имеют более или менее схожие принципы работы. Поиск в такой системе проводится по запросу, составляемому пользователем, состоящему из набора ключевых слов или фразы, заключенной в кавычки. Индекс формируется и поддерживается в

актуальном состоянии роботами-индексировщиками. (Google, Рамблер, Апорт2000) Средства простого поиска. 1. Поиск группы слов. Большинство российских поисковых систем, как и поисковая машина Апорт, воспринимает группу слов так, как будто между ними стоит союз И. Например, лица в розыске. 2. Поиск словоформ. В большинстве случаев Апорт позволяет находить разные словоформы, например, запрос допрос несовершеннолетнего можно было

сформулировать несовершеннолетний допрос. 3. Поиск точных форм. Иногда нужно от словоформ отказаться. Допустим нас интересует слово престол, а не престольный и не первопрестольный. В этом случае Апорт использует восклицательный знак, например: !престол. 4. Роль заглавных букв. Для большинства поисковых систем заглавные буквы воспринимаются буквально. Так, например поиск по словам укажет только на те страницы, где встречаются

слова Красная Шапочка. А поиск по запросу красная шапочка укажет на страницы, где встречаются слова Красная Шапочка, и Красная шапочка, и красная Шапочка, и красная шапочка. 5. Значение подстановочных символов. Апорт позволяет использовать символ * вместо любого количества символов до конца слова. Например, если нужны документы, в которые входят слова Татарская республика и , то можно использовать только: республика Татарс*. 6.

Учет зарегистрированных слов. Зарегистрированными словами (стоп-словами) считаются те, которые не учитываются при поиске. Обычно к ним относятся все слова, которые меньше 4 символов – предлоги, союзы, местоимения, артикли и т.д. Так, например в запросе все о юристах будет учитываться только слово юристах и его словоформы. В специализированных поисковых системах к зарегистрированным могут относиться слова, характерные для этих