МЕНЮ


Фестивали и конкурсы
Семинары
Издания
О МОДНТ
Приглашения
Поздравляем

НАУЧНЫЕ РАБОТЫ


  • Инновационный менеджмент
  • Инвестиции
  • ИГП
  • Земельное право
  • Журналистика
  • Жилищное право
  • Радиоэлектроника
  • Психология
  • Программирование и комп-ры
  • Предпринимательство
  • Право
  • Политология
  • Полиграфия
  • Педагогика
  • Оккультизм и уфология
  • Начертательная геометрия
  • Бухучет управленчучет
  • Биология
  • Бизнес-план
  • Безопасность жизнедеятельности
  • Банковское дело
  • АХД экпред финансы предприятий
  • Аудит
  • Ветеринария
  • Валютные отношения
  • Бухгалтерский учет и аудит
  • Ботаника и сельское хозяйство
  • Биржевое дело
  • Банковское дело
  • Астрономия
  • Архитектура
  • Арбитражный процесс
  • Безопасность жизнедеятельности
  • Административное право
  • Авиация и космонавтика
  • Кулинария
  • Наука и техника
  • Криминология
  • Криминалистика
  • Косметология
  • Коммуникации и связь
  • Кибернетика
  • Исторические личности
  • Информатика
  • Инвестиции
  • по Зоология
  • Журналистика
  • Карта сайта
  • Что такое интернет?

    превратилось из повальной моды в новый бизнес — со всем что свойственно

    современному бизнесу: платой за квадратные сантиметры рекламной площади.

    С другой стороны, быстрому распространению системы, столь естественно

    объединяющей разнородные ресурсы, способствовало не в последнюю очередь ее

    зарождение не в недрах коммерческой фирмы, а в научном учреждении —

    Европейской лаборатории физики частиц, сотрудники которой не стали делать

    секретов из своей разработки и даже не попытались на ней разбогатеть.

    К счастью, сама природа WWW как прежде всего средства поиска и организации

    информации позволяет надеяться, что это замечательное изобретение не

    превратиться в инструмент одной лишь коммерции и рекламы (Кирсанов, 1996).

    Серверы и клиенты WWW связываются между собой по специальному протоколу

    HTTP (Hyper Transfer Protocol, протокол передачи гипертекста). URL для WWW

    выглядит как :

    http://< адрес сервера>

    Переходить от одной странице Web к другой — интересный способ исследования

    World Wide Web, однако вам рано или поздно понадобится найти что-то

    конкретное. Но таким образом это сделать не удастся. В Internet имеются

    специальные инструменты Web-поиска.

    Инструменты поиска в WWW.

    Инструментов поиска информации в Internet, построенных на разных принципах

    и преследующих разные цели, существует немало. Но все их объединяет то, что

    они располагаются на специально выделенных сетевых компьютерах с мощными

    каналами связи, обслуживают ежеминутно огромное количество посетителей и

    требуют от своих владельцев значительных затрат на поддержку и обновление.

    Тем не менее, почти все они отвечают на запросы пользователей совершенно

    бескорыстно, а платят за это удовольствие спонсоры и рекламодатели. По

    масштабам влияния на сетевое сообщество поисковые системы, без сомнения,

    являются одним из краеугольных камней Internet.

    Классификацию поисковых систем удобнее всего строить на основании того, на

    сколько автоматизирован в них сбор и обработка информации, предоставляемой

    пользователям, — иначе говоря, кто набирает базу данных, в которой

    производится поиск: люди или сами компьютеры.

    2. Инструменты поиска

    Условно инструменты поиска подразделяются на поисковые средства справочного

    типа (directories) и поисковые системы в чистом виде (search engines).

    2.1 Тематические каталоги

    Поисковые инструменты первого типа чаще всего называют предметными, или

    тематическими каталогами. Компания, владеющая таким каталогом, непрерывно

    ведет огромную работу, исследуя, описывая, каталогизируя и раскладывая по

    полочкам содержимое WWW-серверов и других сетевых ресурсов, разбросанных по

    всему миру. Результатом ее титанических усилий является постоянно

    обновляющийся иерархический каталог, на верхнем уровне собраны самые общие

    категории, такие как “бизнес ”, ”наука”, ”искусство” и т.п., а элементы

    самого нижнего уровня представляют собой ссылки на отдельные WWW-страницы и

    сервера вместе с кратким описанием их содержимого.

    Гарантий того, что такой каталог действительно охватывает все содержимое

    WWW, никто не даст, однако возможная не полнота и даже однобокость подбора

    материалов с лихвой искупается там, что пока еще не под силу никакому

    компьютеру — осмысленность отбора.

    Предметные каталоги предоставляют и возможность поиска по ключевым словам.

    Однако поиск этот происходит не в содержимом самих WWW-серверов, а в их

    кратких описаниях, хранящихся в каталоге.

    Предметные каталоги Internet можно пересчитать буквально на пальцах, так

    как их создание и поддержка требуют огромных затрат. К наиболее известным

    относятся Yahoo, WWW Virtual Library, Galaxy и некоторые другие.

    Yahoo.

    Наиболее популярен у населения Internet каталог Yahoo. На первой же

    странице Yahoo, расположенной по адресу http://www.yahoo.com, вы получаете

    доступ к двум основным методом работы с каталогом — поиску по ключевым

    словам и иерархическому древу разделов.

    Начав спуск по разделам каталога, вы увидите, что каждый раздел содержит

    точно такое же поле для ввода ключевых слов и кнопку Search, запускающую

    поиск.

    Каждый раздел может включать в себя как перечисление входящих в него

    подразделов, так и собственно ссылки на страницы, относящиеся сразу ко

    всему разделу, с их краткими описаниями.

    Вместо путешествия по дереву подраздела вы можете сразу попасть в нужное

    место каталога Yahoo с помощью поиска. Введя одно или несколько ключевых

    слов, разделенных пробелами, в строку поиска и нажав кнопку Search, вы

    получите список всего в Yahoo, что содержит в себе указанные ключевые

    слова. Этот список будет разделен на две части — “categories” и “sites”.

    Если общее количество ссылок, возвращенных в результате поиска, превышает

    25, список ссылок будет разбит на несколько частей.

    Автоматическим поиском можно воспользоваться не только с главной страницы

    Yahoo, но и из любого подраздела; при этом специальный переключатель,

    расположенный под полем ввода ключевых слов, позволяет либо ограничить

    поиск текущим разделом и его подразделами, либо искать во всем каталоге

    (Черил, 1998).

    Magellan.

    Но не редко случается так, что выдаваемый машиной список очень велик и

    просмотреть его просто не реально. Выходом из этой ситуации может стать

    более строгий отбор информации, заносимой в каталог. Одна из самых

    известных систем такого рода — каталог Magellan по адресу:

    http://www.mckinley.com

    Эта база данных содержит сведения о 80 тысячах WWW-страниц — что очень не

    много в сравнении с теми миллионами, которые существуют в сети. Однако если

    Yahoo в качестве описания ресурса использует одну-две строчки текста, то

    сотрудники системы Magellan на некоторые из страниц, заносимые в их базу

    данных, сами пишут небольшие рецензии, а также оценивают качество этих

    информационных ресурсов по пятибалльной шкале. По мимо базы рецензий,

    Magellan владеет так же собственным автоматическим индексом, для поиска в

    котором нужно перебросить переключатель под полем ввода в положение entire

    database.

    Как правило запрос представляет собой одно или несколько ключевых слов,

    разделенных пробелами (Кирсанов, 1996).

    Point.

    Схожая по своим принципам служба фирмы Point (http://www.pointcom.com)

    вообще основной упор делает не на поиск, а на работу с тематическим

    каталогом.

    Служба Point известна в сети тем, что ее сотрудники постоянно заняты

    оцениванием сетевых ресурсов и ведут списки тех узлов, которые они считают

    принадлежат к “лучшим пяти процентам WWW”.

    Сама фирма Point Ведет общедоступную базу данных всех “пятипроцентных WWW-

    страниц, где о каждой можно прочитать подробную лицензию (Хоникарт, 1996).

    Virtual Library.

    Самым старым предметным каталогом WWW является каталог Virtual Library:

    http://www.w3.org/hypertext/DataSources/bySubject/Overview.html

    Эта система достаточно полно охватывает научную прослойку WWW - серверы

    университетов, лабораторий и учебных заведений.

    Russia-On-Line Subject Guide.

    Для пользователей в нашей стране определенный интерес может представлять

    тематический каталог Russia-On-Line Subject Guide, расположенный по адресу

    http://www.online.ru/rmain. Этот каталог содержит довольно пестрое собрание

    ссылок на зарубежные источники плюс тематический обзор российских и

    русскоязычных ресурсов WWW.

    2.2.Автоматические индексы.

    К проблеме поиска информации в Internet можно подойти и с другой стороны.

    Существуют программы в которые загрузили несколько тысяч общеизвестных URL-

    адресов. Будучи запущена на компьютере с доступом к WWW, эта программа

    начинает автоматически скачивать из сети документы по этим URL, причем из

    каждого нового документа она извлекает все содержащиеся в нем ссылки и

    добавляет их в свою базу адресов. Поскольку в конечном счете все WWW

    документы связаны между собой, рано или поздно такая программа обойдет весь

    Internet.

    Разумеется, программа не может ни понять ни как либо классифицировать то,

    что она видит в сети. Программы такого типа называются роботами. Они

    ограничиваются сбором статистической информации и построением

    словоуказателей (индексов) по текстам документов. Собираемая роботом база

    данных — индекс — хранит в себе, попросту говоря, сведения о том в каких

    WWW-документах содержаться те или иные слова.

    Именно такой автоматически собираемый индекс и лежит в основе поисковых

    систем второго рода, которые часто так и называют — автоматические индексы.

    Автоматический индекс состоит из трех частей: программы-робота, собираемой

    этим роботом базы данных и интерфейса для поиска в этой базе, с которым

    работает пользователь. Все эти компоненты вполне могут функционировать без

    вмешательства человека.

    Поскольку какая-либо классификация или оценивание материалов в системах

    такого рода отсутствуют, к ним следует прибегать только тогда, когда вы

    точно знаете ключевые слова, относящиеся к тому, что вам нужно, — скажем,

    фамилию человека или несколько достаточно редких терминов из

    соответствующей области. если же задать поиск по сколько-нибудь

    распространенным словам, то вам не хватит жизни, чтобы обойти все

    полученные в результате поиска URL-адреса, — к примеру, индекс системы Alta

    Vista содержит 11 миллиардов слов, извлеченных из 30 миллионов WWW-страниц.

    Автоматических индексов WWW-страниц существует немало: WebCrawler, Lycos,

    Excite, Inktomi, Open Text и другие. Некоторые из них (например, Lycos)

    представляют собой более или менее удачный синтез предметного каталога и

    автоматического индекса.

    Alta Vista.

    Ее адрес http://altavista.digital.com . Эта система появилась в декабре

    1995 года. Она один из самых больших по объему индексов из всех поисковых

    систем такого рода и самые мощные и гибкие правила построения запросов.

    Alta Vista понимает два разных языка запросов, довольно сильно отличающихся

    друг от друга. На первой странице Alta Vista вы видите бланк для простого

    запроса (Simple Search), а панель заголовка вверху страницы содержит кнопку

    Advanced Search, нажав которую, вы получите бланк для усложнения запроса.

    Кроме WWW-страниц, Alta Vista ведет отдельный индекс для статей из более

    чем 14000 конференций Usenet (включая иерархию групп relcom.*).

    Поиск Alta Vista: чтобы Alta Vista срабатывала на группе слов, только когда

    они стоят рядом, нужно заключить эту группу в кавычки. Если необходимо

    исключить из результата все документы, содержащие определенное слово,

    необходимо приписать это слово со знаком “минус”.

    Слово без всякого знака действует в запросе точно так же, как и оно же со

    знаком “плюс”.

    В отличие от Yahoo, по умолчанию Alta Vista ищет вхождения целых слов, т.

    е. заказанные термины должны стоять в документе обособленно, а не быть

    частью других цепочек символов. Если же вам нужно найти все вхождения

    слова, даже когда оно входит в состав других слов, пользуйтесь символом *.

    звездочка может стоять только в конце слова, а чтобы предотвратить

    обвальный поиск, дающий слишком много результатов, Alta Vista требует,

    чтобы слово, заканчивающееся на *, состояло не менее чем из 3 букв. Более

    того, символ * позволяет найти не любое окончание слова, а только не

    превышающее длину пяти символов и не содержащее заглавных букв или цифр.

    Результаты поиска Alta Vista, как и Yahoo, выдает в виде списка ссылок на

    документы, но вместо описания каждого документа рядом с его заголовком вы

    увидите просто первые несколько строк его текста. Если найдено будет больше

    10 документов, Alta Vista разобьет их список на страницы по 10 ссылок на

    каждой. Alta Vista сортирует ссылки так, чтобы на первом месте стояли

    “самые важные” документы с вашими ключевыми словами при определении степени

    важности учитывая следующие факторы:

    входят ли ключевые слова в заголовок документов;

    содержатся ли эти слова в первых нескольких строках документов;

    насколько близки друг к другу в тексте обнаружены ключевые слова

    (Кирсанов, 1996).

    Infoseek

    Infoseek, вступивший в эксплуатацию в конце 19996 года, несколько

    напоминает Alta Vista, однако объем обследуемых им полных текстов

    документов еще не превышает 30 млн. Web-страниц. Адрес:

    http://www.infoseek.com. Это довольно мощная система, обладающая высокой

    скоростью и простой в обращении. Возможности составления запроса почти

    такие же, как и в Alta Vista, но не столь богатые. При почти полном

    сохранении значений знаков «плюс», «минус» и «кавычек», чувствительности к

    разнице заглавных и строчных букв и возможности ограничивать поиск

    фрагментами Web- страниц, Infoseek пока не обладает способностью определять

    рядом стоящие термины (нет оператора NEAR), ограничивать поиск по дате

    обновления источника и, главное, усекать окончания ключевых терминов.

    Но данная поисковая система содержит массу факультативных функций. К

    таковым относится, например, возможность определять количество ссылок в WWW

    на конкретную страницу, то есть судить, насколько она популярна или же,

    наоборот, выяснить, сколько ссылок на внешние страницы содержится на данном

    узле, вернее, сколько из них отражены в индексных файлах Ultraseek.

    Использование специальной функции Imageseek позволяет находить в Internet

    изображения (рисунки, фотографии) на определенную тему. Infoseek имеет

    также один из лучших справочников ресурсов Сети.

    HotBot

    Одним из мощных поисковых средств в World Wide Webможно отнести HotBot,

    содержащий сведения о полных текстах 110 млн. страниц. Адрес: http://

    www.hotbot.com. HotBot принадлежит к новейшим системам, поэтому его

    углубленный поиск дает поразительно широкие возможности для детализации

    запроса. Это достигается за счет использования многоступенчатого меню,

    предлагающего различные варианты составления поискового предписания. Можно

    осуществить поиск по наличию в документе одного или нескольких терминов,

    поиск по отдельной фазе, поиск конкретного лица или ссылки на определенный

    электронный адрес. Для большей детализации запроса возможно применение

    условий SHOULD (может содержать), MUST (должен обязательно содержать), MUST

    NOT (не должен содержать) по отношению к каким-либо понятиям. Кроме того,

    HotBot представляет возможностьограничить поиск по дате создания или

    последнего обновления документа, по георафическому положению сервера.

    Верхом сервисных возможностей является поиск документов, содержащих

    определенные типы файлов, например аудио или видио. Для этого надо лишь

    сделать отметку в специальном пункте меню запроса (Куприянова, 1998).

    WebCrawler.

    Это еще один инструмент поиска типа search-bot (поисковый робот).

    Адрес: http://www.webcrawler.com . Поиск здесь очень прост. Введите как

    можно больше ключевых слов в поле поиска, нажмите Search.

    Lycos.

    Это большая база данных индексирующая содержание всех найденных ею страниц

    Web. Адрес: http://www.lycos.com .

    World Wide Web Worm.

    Вы найдете этот инструмент поиска на

    http://www.cs.colorado.edu/home/mcbryan/wwww.html . Это еще один обширный

    указатель участков Web.

    В каждом конкретном случае целесообразно использовать свой инструмент

    поиска. Вам придется пытаться проводить поиск при помощи одного инструмента

    и, если вы не получили результатов, переходить к другому. Но все же каким

    инструментом пользоваться? В первую очередь лучше воспользоваться

    тематическим каталогом типа Yahoo, размер у них сравнительно небольшой,

    зато велика скорость. Если найти необходимую информацию не удалось, это

    говорит о том, что вы интересуетесь слишком узкой темой, или же с вашей

    темой плохо соотносятся выбранные вами ключевые слова. Это не значит, что

    нужной информации в WWW нет — просто найти ее будет сложнее. Для ее поиска

    вам прийдется воспользоваться более примитивными, более автоматическими и

    потому более всеобъемлющими системами типа Alta Vista (Кент, 1996).

    2.3.Российские поисковые системы

    Поисковые системы глобального масштаба свое основное внимание концентрируют

    на англоязычных ресурсах Сети. Задачу поиска информации на серверах в

    пределах отдельных стран выполняют системы локального характера, специально

    адаптированные к особенностям конкретных языков. Существуют подобные

    поисковые средства и в России. Всех их объединяет возможность обработки

    материалов во всех кириллических кодировках(. Однако по мощности и уровню

    предлагаемого сервиса русскоязычные поисковые системы значительно

    отличаются друг от друга.

    К лидирующей группе в настоящее время относятся системы Rambler, «Апорт» и

    «Яndex».

    Rambler

    Среди фаворитов выделяется Rambler (http://www.rambler.ru), ставший первой

    профессиональной отечественной поисковой системой. Эта система обеспечивает

    полнотекстовый поиск на 3 млн. страниц, расположенных на более чем 15 тыс.

    Web-узлах Росси и стран ближнего зарубежья. Помимо Web-серверов,

    обследуется также недельный архив телеконференций иерархии relcom.

    Rambler обладает близким к оптимальному выводом результатов поиска. Даже в

    нормальной форме ссылка на найденный объектвключает полную информацию.

    Система сконструирована таким образом, что один и тот же документ в

    различных кодировках показывается в различных кодировках показываются

    только один раз, а его конкретные адреса суммируются в списке, идущим за

    резюме.это сокращает время на аналмз полученных результатов из-за

    отсутствия дублирования одних и тех же документов.

    Главный недостаток Rambler заключается в невозможности осуществлять поиск

    по целой фазе или хотя бы указывать в запросах предельное расстояние

    искомых терминов друг от друга. Случайное сочетание совершенно несвязанных

    слов приводит к выдаче ссылок на документы, совершенно не релевантны

    запросу.

    Апорт

    Поисковая система Апорт (http://www.апорт.ru) снабжена массой различных

    функций, относящих ее к числу самых удобных для пользователя.

    Одно из главных достоинств Апорт состоит в широких возможностях составления

    запроса. Помимо традиционных операторов “и” и “или”, поиска по целой фазе,

    система способна вычленять сочетания терминов, расположенных в тексте рядом

    друг с другом. Апорт предлагает возможность автоматического перевода

    запроса с русского на английский язык и наоборот. И Rambler, и Апорт

    способны выделять один и тот же документ в различных кодировках и выдавать

    ссылку на него лишь раз, перечисляя конкретные адреса в списке URL. К

    сожалению, при этом вовремя не удаляются сведения об устаревших версиях

    одной и той же страницы, которые перечисляются как существующие, имея

    разницу лишь в дате обновления. Еще одним недостатком этой системы является

    не всегда корректная обработка названий страниц, из-за чего в результатах

    поиска часто указывается «документ без названия».

    Яndex

    Поисковая система Яndex (http://www.yandex.ru) , где помимо серверов

    доменов «ru» и «su» Яndex индексирует содержание зарубежных русскоязычных

    Web-узлов.

    Главной отличительной чертой этой системы является глубокий морфологический

    анализ обрабатываемых терминов. Мощнейшая лингвистика позволяет учесть

    практически все возможные оттенки употребления ключевых слов и составить

    запрос максимально точно. Яndex обладает хорошим механизмом распознавания

    одного документа в нескольких кодировках или на зеркальных серверах.

    Вслед за лидирующей российской тройкой идут еще несколько поисковых

    средств, среди которых “Русская машина

    поиска”(http://search.interrussia.com), «TELA-поиск» (http://tela.dux.ru/)

    и Russian Internet Search (http://www.search.ru). Пока все эти серверы не

    отличаются ни широтой поиска, ни комфортностью, и могут быть использованы

    лишь в качестве дополнения к ведущим поисковым средствам.

    Поисковый сервис в русскоязычном блоке Internet, также как и во всем мире,

    развивается стремительно. Нет сомнения, что в ближайшем будущем показатели

    существующих систем повысятся, появятся новые поколения поисковых средств,

    предоставляющих пользователям еще большие возможности (Куприянова, 1998).

    Список литературы

    1. Дмитрий Кирсанов Понятный Internet / -М. Символ-Плюс, 1996

    2. Джери Хоникарт Internet без проблем /- М. 1996

    3. Питер Кент Internet / М. 1996

    4. Джон Левин Секреты Internet / Киев 1996

    5. В. Степанов С компьютером на ты / - М., 1998

    6. Кирк Черил Internet. Книга ответов / М. 1998

    7. Г. И. Куприянова Информационные ресурсы Internet / М., 1998

    Страницы: 1, 2


    Приглашения

    09.12.2013 - 16.12.2013

    Международный конкурс хореографического искусства в рамках Международного фестиваля искусств «РОЖДЕСТВЕНСКАЯ АНДОРРА»

    09.12.2013 - 16.12.2013

    Международный конкурс хорового искусства в АНДОРРЕ «РОЖДЕСТВЕНСКАЯ АНДОРРА»




    Copyright © 2012 г.
    При использовании материалов - ссылка на сайт обязательна.