Автоматизированные информационно поисковые системы — страница 8

  • Просмотров 11779
  • Скачиваний 1296
  • Размер файла 25
    Кб

ключевому набору слов и для определения языка конкретной страницы использует методы искусственного интеллекта. Пользователи могут настроить опции поиска и выбирать тип поиска - сложный или упрощенный, а также воспользоваться различными способами предоставления информации. В отличие от машин, которые индексируют только ключевые слова, она индексирует весь текст, что позволяет осуществлять полный поиск. Однако из - за этого

пользователь может просто утонуть в информации. Базы данных: Расположенные по всему миру WWW-страницы и Usenet News (новости). Содержание: 31 миллион WWW-страниц (на май 1997 г.) и полный текст более чем 14,000 newsgroups обновленный в реальном масштабе времени. Поиск: Предлагает простой(simple (S)) поиск или (much more advanced (MMS)),т.е. более передовой, способ. S - поиск стоит в основном использовать для общих вопросов, MMS - поиск использует специфический поисковый

синтаксис. Для облегчения выполнения процедуры имеется подсказка(Simple Search Help). MMS - поиск, используя булинь(boolean), т.е. с помощью ключевых союзов, используя (and, or, not - (и, или, не)) и простую смежность (near - (около)) позволяет употреблять несколько слов, чередование слов, словосочетание в качестве ключевых для проведения поиска. TS - поиск: Введением ключа типа: " Ваша Фраза " как первое направление поиска, который будет ограничивать

число найденных WWW - документов с заголовками типа " Ваша Фраза ". Результаты: Предлагает три выбора результатов (но два дают тот же самый результат): 1) "Стандартные"("Standard") - результаты, полученные машиной в виде списка параграфов, резюмируемые ей, с наличием URL - адреса, размером файла и последней датой модернизации. Результаты возвращаются как десять пунктов на экране, 2) "Компактный"("Compact") помещают каждый

пункт в одной строке с последней датой модернизации картотеки, 3) "Детальный"("Detailed"), который является таким же самым, как и "Стандартный". Адрес: http://altavista.digital.com Частота модернизации: Постоянно WWW-роботом. 4. Проблемы и возможности автоматизированных поисковых систем Работа многих поисковых машин считается вполне успешной. Однако все современные поисковые системы страдают некоторыми серьёзными недостатками:

поиск по ключевым словам даёт слишком много ссылок и многие из них бесполезны. огромное количество поисковых машин с разными пользовательскими интерфейсами порождает проблему когнитивной перегрузки. методы индексирования баз данных, как правило, не связаны с информационным содержанием. часто выдаются ссылки на информацию, которой в Интернете уже давно нет. машины ещё не столь совершены, чтобы понимать естественный язык в