Глобальные поисковые системы

Автор работы: Пользователь скрыл имя, 28 Октября 2011 в 22:57, реферат

Краткое описание

Данная курсовая работа посвящена теме «Глобальные поисковые си-стемы».
Internet — глобальная компьютерная сеть, охватывающая весь мир. Сегодня Internet имеет около 300 миллионов абонентов в более чем 180 странах мира. Ежемесячно размер сети увеличи¬вается на 5—7%. Internet образует как бы ядро, обеспечивающее связь различных информационных сетей, принадлежащих раз¬личным учреждениям во всем мире, одна с другой.

Содержимое работы - 1 файл

курсовая работа.doc

— 139.00 Кб (Скачать файл)

Федеральное агентство по образованию

Государственное образовательное  учреждение

Высшего профессионального  образования

САРАТОВСКИЙ ГОСУДАРСТВЕННЫЙ  УНИВЕРСИТЕТ

ИМЕНИ Н.Г. ЧЕРНЫШЕВСКОГО 

Кафедра _______________________ 
 
 
 
 

«Глобальные поисковые системы» 
 
 

КУРСОВАЯ РАБОТА

        студента  3  курса механико-математического     факультета

                        Баранчикова Александра Александровича 
 
 
 
 

Научный руководитель          ______________________       Амелин Р.В.

                                                                 подпись, дата

                                                       
 
 
 
 
 
 
 

Саратов – 2009г.

 

Содержание 

 

ВВЕДЕНИЕ

 

     Данная курсовая работа посвящена теме «Глобальные  поисковые системы».

     Internet — глобальная компьютерная сеть, охватывающая весь мир. Сегодня Internet имеет около 300 миллионов абонентов в более чем 180 странах мира. Ежемесячно размер сети увеличивается на 5—7%. Internet образует как бы ядро, обеспечивающее связь различных информационных сетей, принадлежащих различным учреждениям во всем мире, одна с другой.

     Всплеск интереса к глобальной информационной сети Internet наблюдается сейчас повсеместно. В сложившихся условиях потребность в информации о сети Internet становится особенно острой. В настоящее время по Internet распространяется множество документов, касающихся как функционирования сети и работы в ней пользователей, так и связанных с различными сферами жизни: наукой, культурой, экономикой и т.д. Причем, обновление информации в Internet, обширной разветвленной сети, которая включает в себя компьютерные узлы, разбросанные по всему миру, происходит, практически, в режиме реального времени.

     В действительности Internet не просто сеть, — она есть структура, объединяющая обычные сети. Internet — это «Сеть сетей».

     Чтобы описать сегодняшнюю Internet, полезно воспользоваться строгим определением. В своей книге «The Matrix: Computer Networks and Conferencing Systems Worldwide» Джон Квотерман описывает Internet как «метасеть, состоящую из многих сетей, которые работают согласно протоколам семейства TCP/IP, объединены через шлюзы и используют единое адресное пространство и пространство имен».

     Для организации межсетевых соединений необходим соответствующий протокол.

     Протокол  — это набор договоренностей, который определяет обмен данными между различными программами. Протоколы задают способы передачи сообщений и обработки ошибок в сети, а также позволяют разрабатывать стандарты, не привязанные к конкретной аппаратной платформе. Все параметры — от скорости передачи данных до методов адресации при транспортировке отдельных сообщений — задаются протоколами, используемыми в данной конкретной сети.

     В Internet базовым протоколом служит TCP/IP (Transmission Control Protocol/Internet Protocol). IP отвечает за адресацию сетевых узлов, a TCP обеспечивает доставку сообщений по нужному адресу. Эти мощные протоколы были предложены в 1974 г. Робертом Кэном, одним из основных разработчиков ARPANET, и ученым-компьютерщиком Винтоном Серфом, вице-президентом CNRI. Следует иметь в виду, что TCP/IP не единственный протокол, пригодный для объединения различных сетей. Internet ныне превратилась в многопротокольную сеть, интегрирующую другие стандарты. Основные среди них — стандарты взаимодействия открытых систем (OSI).

     Предложенные  Международной организацией по стандартизации (ISO) протоколы OSI получили широкое распространение в Европе. Системы, основанные на других протоколах, тоже подключаются к Internet через шлюзы. Например, BITNET — это сеть, которая использует для передачи данных свои собственные стандарты, однако, по крайней мере, частично, она доступна через шлюзы из Internet.

     В Internet нет единого пункта подписки или регистрации; вместо этого вы контактируете с поставщиком услуг, который предоставляет вам доступ к сети через местный компьютер. Последствия такой децентрализации с точки зрения доступности сетевых ресурсов также весьма значительны. Среду передачи данных в Internet нельзя рассматривать только как паутину проводов или оптоволоконных линий. Оцифрованные данные пересылаются через маршрутизаторы, которые соединяют сети и с помощью сложных алгоритмов выбирают наилучшие маршруты для информационных потоков.1

     Цель  нашей курсовой работы – дать характеристику глобальным поисковым системам.

     В ходе раскрытия данной цели ставлю перед собой следующие задачи:

     - описать механизмы поиска и провести сравнительный обзор поисковых систем

     - для подробного описания выбора  поисковой системы необходимо  будет описать понятия охвата и глубины, скорости обхода и актуальности ссылок, качества и скорости поиска.

     Курсовая  работа состоит из введения, двух глав, заключения и списка литературы. Общий объем работы составляет 21 страницу.

 

      ГЛАВА 1. ПОИСКОВЫЕ СИСТЕМЫ

     Основная  задача Internet — предоставление необходимой информации. Чтобы найти нужную информацию необходимо знать адрес Web-страницы, на которой эта информация находится. Лучше всего искать в Сети необходимую информацию с помощью поисковых систем. Поисковая система представляет собой специализированный Web-узел. Поисковые системы классифицируют по методам поиска.

     Поисковые каталоги предназначены для поиска по темам. Обычно они построены по иерархическому принципу, т.е. каждый шаг поиска это выбор подраздела с более конкретной тематикой искомой информации. На нижнем уровне поиска пользователь получает относительно небольшой список ссылок на искомую информацию.

     Поисковый индекс обеспечивает поиск по заданным ключевым словам. Обычно ключевые слова вводятся при заполнении специальной формы поиска, после чего нажимается кнопка «Поиск». В результате поиска формируется набор гиперссылок на Web-страницы, содержащий указанные термины. Обычно поисковые индексы выдают огромное количество искомых страниц.

     В этом списке представлены ссылки на различные  Web-страницы, причем ссылки располагаются по степени убывания встреченных на данных страницах слов, совпадающих с ключевыми словами. При просмотре списка необходимо выбрать те страницы, которые нужно просмотреть. Некоторые системы составляют список ссылок по степени свежести страниц, другие же — по степени вероятности того, что данные страницы окажутся искомыми. Вычисление вероятности основывается на данных о том, как скоро на странице встречается искомое слово. Первыми в таком списке идут ссылки на те страницы, у которых ключевые слова встречаются уже в названии.

     Поисковые каталоги предоставляют доступ к меньшему количеству страниц, чем поисковые индексы, но они точнее указывают на основные ресурсы Сети. Поэтому при первичном поиске информации целесообразно использовать поисковые каталоги. А квалифицированным пользователям Internet более полезны поисковые индексы. Они позволяют разыскать малоизвестные и узкоспециализированные ресурсы. Многие современные поисковые системы сочетают в себе оба указанных метода.

     Программа Internet Explorer 6.0 имеет специальные средства организации поиска без явного обращения к поисковым системам. Можно получить доступ к одной из известных поисковых систем, просто щелкнув на кнопке «Поиск», слева появится окно поиска. Далее можно набрать ключевые слова для поиска и выбрать поисковую систему. Результаты поиска будут отражены в правой части окна обозревателя. Если выбрать нужную ссылку, то в правом окне появится содержимое выбранной страницы. Чтобы скрыть окно поиска, необходимо щелкнуть на кнопке «Поиск» еще раз.

     При работе с Internet Explorer можно проводить поиск прямо в поле «Адрес». Для этого в адресную строку вводиться слово или фраза для поиска. Под адресной строкой откроется окно со словом «Поиск» и искомой фразой. Internet Explorer начнет поиск с использованием заранее определенной системы поиска; при этом кнопка «Поиск» на панели инструментов нажмется сама.

     Можно осуществить поиск, нажав кнопку «Пуск» и выбрав опцию меню «Найти». Окно Internet Explorer откроется само с уже нажатой кнопкой «Поиск».

     Если  удалось найти то, что искали, но все же не совсем то, то в этом случае пригодится механизм связанных ссылок. Для любой Web-страницы можно просмотреть список ссылок, имеющих к ней отношение, возможно, среди них окажется как раз то, что нужно. Чтобы просмотреть связанные ссылки, нужно сделать следующее. Необходимо выбрать в меню «Сервис» команду «Показать связанные ссылки».

     После этого на панели инструментов нажать кнопку «Поиск», и в левой части экрана полнится окно, содержащее список ссылок, связанных с данной страницей. Нужно щелкнуть на одной из ссылок и просмотреть в правом окне соответствующую Web-страницу.

     Чтобы скрыть окно поиска, необходимо щелкнуть еще раз на кнопке «Поиск».2

     1.1. Механизмы поиска

     Поисковые системы обычно состоят из трех компонентов:

  • агент (паук или кроулер), который перемещается по Сети и собирает информацию;
  • база данных, которая содержит всю информацию, собираемую пауками;
  • поисковый механизм, который люди используют как интерфейс для взаимодействия с базой данных.

     Средства  поиска и структурирования, иногда называемые поисковыми механизмами, используются для того, чтобы помочь людям найти информацию, в которой они нуждаются.

     Средства  поиска типа агентов, пауков, кроулеров  и роботов используются для сбора информации о документах, находящихся в Сети Internet. Это специальные программы, которые занимаются поиском страниц в Сети, извлекают гипертекстовые ссылки на этих страницах и автоматически индексируют информацию, которую они находят для построения базы данных.

     Каждый  поисковый механизм имеет собственный  набор правил, определяющих, как собирать документы. Некоторые следуют за каждой ссылкой на каждой найденной странице и затем, в свою очередь, исследуют каждую ссылку на каждой из новых страниц, и так далее. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым файлам, файлам мультипликации; другие игнорируют ссьики к ресурсам типа баз данных WAIS; другие проинструктированы, что нужно просматривать, прежде всего, наиболее популярные страницы.

     Агенты  — самые «интеллектуальные» из поисковых средств. Они могут делать больше, чем просто искать: они могут выполнять даже транзакции от Вашего имени. Уже сейчас они могут искать сайты специфической тематики и возвращать списки сайтов, отсортированных по их посещаемости. Агенты могут обрабатывать содержание документов, находить и индексировать другие виды ресурсов, не только страницы. Они могут также быть запрограммированы для извлечения информации из уже существующих баз данных. Независимо от информации, которую агенты индексируют, они передают ее обратно базе данных поискового механизма.

     Агенты  извлекают и индексируют различные  виды информации. Некоторые, например, индексируют каждое отдельное слово во встречающемся документе, в то время как другие индексируют только наиболее важных 100 слов в каждом, индексируют размер документа и число слов в нем, название, заголовки и подзаголовки и так далее. Вид построенного индекса определяет, какой поиск может быть сделан поисковым механизмом и как полученная информация будет интерпретирована.

     Агенты  могут также перемещаться по Internet и находить информацию, после чего помещать ее в базу данных поискового механизма. Администраторы поисковых систем могут определить, какие сайты или типы сайтов агенты должны посетить и проиндексировать. Проиндексированная информация отсылается базе данных поискового механизма так же, как было описано выше.

     Общий поиск информации в Сети осуществляют программы, известные как пауки. Пауки сообщают о содержании найденного документа, индексируют его и извлекают итоговую информацию. Также они просматривают заголовки, некоторые ссылки и посылают проиндексированную информацию базе данных поискового механизма.

Информация о работе Глобальные поисковые системы