Выполнили Репной А. Г. и Хейстонен С. В.

Практическая работа № 1. 

Классификация информационно-поискового пространства Интернет.

 Глобальные поисковые системы:

Название ресурса

Адрес ресурса

Краткая аннотация ресурса

 

Дата регистрации

AltaVista

http://www.altavista.com/

 

Проиндексировано страниц - более 500 миллионов.

Обновление базы - полное обновление каждые три месяца.

Среднее время индексации - 4-6 недель для бесплатной регистрации, 1-2 недели для платной.

Имя робота - Scooter. Действующая версия - Scooter W3.1.2.

Платные ссылки - три ссылки из базы Overture.com вверху страницы выдачи, внизу
- ссылки на смежные сервисы.

Обновление - еженедельно для платных регистраций, 4 недели для бесплатных.

Индексация по ссылкам - поведение робота непредсказуемо, лучшим выходом будет ручная регистрация всех важных страниц сайта.

 

 

 

 

 

9 сентября 1998

Dmoz

http://www.dmoz.com/

В каталоге DMOZ работает очень большое количество людей - волонтеров-редакторов. Отсюда возникает некоторая проблема. Поскольку эти же люди сами пользуются этим каталогам, то в отношении их работы часто возникает критика. Ведь в руках этих волонтеров большая сила – они, например, могут не регистрировать сайты конкурентов. Впрочем, эта тема была актуально 3-4 года назад. Все-таки сейчас люди растут в профессиональном мастерстве, и таких проблем возникает все меньше.

 

02 января 1999

Mamma

http://www.mamma.com/

Поиск информации на различных поисковых серверах. Каталог популярных запросов. Поиск информации на различных поисковых серверах. Каталог популярных запросов.

31 июня 1996

Yahoo

http://www.yahoo.com/

 

Содержит каталог ссылок на ресурсы мировой сети. Эта поисковая система завоевала репутацию наиболее авторитетного справочника ресурсов Интернета. Даёт прекрасный результат, если необходимо найти максимальное число зарубежных  сайтов по интересующему запросу. Возможен поиск на русском языке.

Yahoo был основан в 1994, и на сегодняшний день это самый старый и наиболее полный каталог интернет-ресурсов.

Удивительно, но эта невероятно популярная система, обслуживающая миллионы запросов ежеденевно, зародилась как простая коллекция закладок, которую пополняли всего 2 человека - Дэвид Фило и Джерри Янг.

Yahoo является наиболее популярным поисковым средством. Секрет успеха Yahoo заключается в людях. Yahoo имеет около 150 редакторов, для того, чтобы составлять и редактировать содержимое своих каталогов. Yahoo имеет базу данных в более, чем 1 млн. проиндексированных сайтов. Также, в случае нехватки своей собственной базы данных, Yahoo использует базу данных Google (до июля 2000 года Yahoo пользовался базой данных Inktomi).

18 января 1995

MsnSearch

http://search.msn.com/

 

MSN особенно важна, т.к. именно эта поисковая система по умолчанию используется, когда пользователи Internet Explorer вводят в адресную строку поисковый запрос. С 1997 года для выдачи результатов поиска используются разные базы данных, такие как: Yahoo!, LookSmart, Altavista, DirectHit, Inktomi и RealNames

MSN - http://www.msn.com

Поисковик разработан и запущен компанией Microsoft d 1997 году.

В отличии от других поисковых систем, ранее у MSN никогда не было собственного паука или каталога. С 1997 года для выдачи результатов поиска использовались разные базы данных, такие как: Yahoo!, LookSmart, Altavista, DirectHit, Inktomi и RealNames.

Только с начала 2005 года MSN запустил бета-версию собственного поискового алгоритма. Пользователи MSN Search, как и раньше, смогут осуществлять поиск по всей Сети в целом, а также по отдельным тематическим категориям, в том числе и по энциклопедии Microsoft Encarta.

Также новый движок включает возможность локализированного поиска (Near Me) - система способна автоматически определять местонахождение пользователя по IP-адреcу его компьютера.

10 ноября 1994

AllTheWeb

 

http://www.alltheweb.com/

 

Проиндексировано страниц - более 600 миллионов.
Поддержка фреймов - использует содержимое тэга NOFRAMES.
Типы индексируемых файлов - заявляется о поддержке более чем 250 форматов данных, включая видео, графику, mp3 и других.
Поддержка метатэгов - самый важный тэг - title. Метатэги не индексируются и не используются для определения релевантности, но могу учитываться при определении PR или использоваться в качестве описания.
Обновление базы - раз в две недели.
Среднее время индексации - 4-6 недель.
Платная регистрация - возможна в рамках партнерской программы. Минимум $100 за 100 ежедневно обновляемых страниц. Позволяет использовать средства поиска FAST на сайте.
Предоставляет результаты для - Lycos.
Платные результаты поиска - нет.
Результаты поиска по каталогу - нет.
Частота ключевых слов - ключевые слова должны упоминаться в первой трети страницы. Желательно использовать синонимы и слова “по теме” на сайте.
Рекомендуемая частота ключевых слов - 1.0 - 5.5%.

26 сентября 1998

ASK

http://www.ask.com

Интерфейс поисковика был полностью переработан, впрочем, изменения коснулись не только внешности, но и механизмов работы службы. Пользователи получили возможность изменять фоновый рисунок главной страницы сервиса, которая по умолчанию выполнена в минималистском стиле. Появился новый поиск по видеороликам, использующий технологии компании Blinkx.

20 октября 1998

AOL Search

http://search.aol.com/aolcom/webhome

AOL это очень большой портал, который предоставляет широкие возможности для поиска информации. AOL не имеет своей собственной базы данных. Результаты поиска берутся из Inktomi и ODP
(Open Directory Project). AOL имеет соглашения о партнерстве в 10 странах. Но AOL Search нигде не имеет своих региональных отделений.

22 июня 1995

Gigablast

http://www.gigablast.com/

Gigablast обеспечивает крупномасштабную, быстродействующую и актуальную технологию информационного поиска для сайтов. Gigablast предлагает разнообразные инструменты, включая генерацию тем и способность к
индексации различных  форматов файлов. Этот механизм поиска дает пользователю качественные результаты при большом охвате информации. Кроме того, поисковая система Gigablast обеспечивает уникальные «гигабайты» информации, позволяя посетителям легко улучшить их поиск на основе смежных тем в результатах поиска.

25 ноября 2001

Google

http://www.google.com/

 

Проиндексировано страниц - более 3,000,000,000 страниц.
Поддержка фреймов - полностью.
Типы индексируемых файлов - PDF, CGI, ASP, JSP, CFM, PHP.
Обновление базы - раз в 60 дней.
Среднее время индексации - от 48 часов до 2 недель.
Предоставляет данные для - Topclick.com, Yahoo, Netscape, EarthLink.net
Платные ссылки - Google AdWords - собственная программа контекстной рекламы по выбранным ключевым словам.
Результаты поиска по каталогу - используется каталог
Open Directory Project.
Частота ключевых слов - ключевые слова должны упоминаться в первой трети документа. Необходимо использование синонимов и слов по выбранной теме по всему сайту.

15 сентября 1997

 

 

 Локальные поисковые системы:

Название ресурса

Адрес ресурса

Краткая аннотация ресурса

Дата регистрации

Looksmart

http://www.looksmart.com

Об особенностях поиска По умолчанию используется AND. Возможности использования "+" или "-" не предусмотрено. Различных усечений фраз кажется нет, так что нужно использовать при запросах и множественное число (если нужно). Никакой зависимости от того, каким регистром букв сделан запрос, нет. Сортировка результатов Иногда такое впечатление, что результаты выдаются беспорядочно, хотя можно выбрать сортировку по релевантности

14 сентября 1996

Yandex

http://www.yandex.ru/

 

Русскоязычная поисковая система. На сегодняшний день имеет самую большую базу данных.
Объем индекса - 389,96 Гб
Проиндексировано страниц - более 86 миллионов.
Типы индексируемых файлов - html, php, asp, cgi, jsp.
Платные ссылки - собственная программа показа контекстной рекламы Yandex. Direct в зависимости от выбранных ключевых слов. Показы контекстной рекламы в середине страницы результатов поиска.
Результаты поиска по каталогу - используется собственный каталог, сайты в котором ранжированы в зависимости от количества ссылок на них.

23 сентября 1997

Rambler

http://www.rambler.ru/

 

Объем ее индекса - более 2 миллионов страниц, ежедневно добавляется и обновляется более 10 тысяч новых документов. На Rambler функционирует также рейтинговая система Rambler's Top 100, в которой можно найти наиболее посещаемые сайты по определенной тематике. Сайты при поиске выдаются в порядке соответствия запросу (релевантности) сайтов в целом, то есть всех страниц сайта; при этом первые позиции в списке найденного могут занимать сайты, найденные благодаря их аннотациям в Rambler's Тор100. Вы можете переключиться на режим ранжирования результатов поиска по релевантности отдельных страниц или по дате (сначала показываются более новые документы). Для этого надо воспользоваться одной из ссылок в строке "Сортировка по..." вверху страницы результатов поиска. Расширенный поиск позволяет заранее настроить показ страницы результатов поиска удобным для Вас образом.



Платные ссылки - возможны следующие виды рекламы "под ключевые слова" или "под тематику" (показывается при вводе пользователем запроса выбранной Вами тематики): • одна или несколько текстовых ссылок в "блоке перевязок" над результатами поиска - там, где по другим запросам показываются ссылки на ресурсы Рамблера; такие ссылки фактически равносильны "нулевой ссылке" в списке найденного, и даже эффективнее ее;
• текстовый блок с логотипом 50х100 в середине результатов поиска;
• верхний баннер 468х60 (эксклюзивный или неэксклюзивный показ);
• вертикальный HTML'ный блок или баннер в правом верхнем углу страницы результатов поиска размером до 160х800.

Последние новости: Начиная с марта 2003 г. поисковая машина компании Рамблер начала обрабатывать web-страницы, созданные с использованием технологии Macromedia Flash. Новая разработка Рамблера позволяет извлекать гиперссылки из flash-объектов и использовать их наравне со ссылками, полученными из обычных html-страниц. При этом сами flash-объекты пока не индексируются.

26 сентября 1996

Mail

http://www.mail.ru/

 

Каталог Mail.Ru , один из самых известных в РуНете. Для поиска по Интернету используется БД Google.
Выдача результатов поиска осуществляется в зависимости от категории: название сервера, краткое описание. Возможность сортировки серверов в каждой категории по алфавиту, по времени добавления, по переходам.

 

27 сентября 1997

Aport

http://www.aport.ru/

 

Апорт - полнотекстовая поисковая система. Это означает, что она индексирует все слова, которые бы увидел на экране человек, просматривая конкретную страницу сервера. В результате любое слово из текста может служить критерием последующего поиска. Для документов HTML кроме основного текста документа индексируются также: заголовок документа (TITLE), ключевые слова (META KEYWORDS), описания страниц (META DESCRIPTION) и подписи к картинкам (ALT). Кроме того, Апорт индексирует как принадлежащие документу, тексты гиперссылок на этот документ с других страниц, находящихся, как внутри сайта, так и за его пределами, а также составленные (или проверенные) редакторами описания сайтов из каталога.

Основные критерии, которые Апорт учитывает при сортировке документов (сайтов):

• количество искомых слов в тексте документа (в процентах) расстояние между поисковыми словами в тексте документа;
• место в тексте, где встречаются поисковые слова (заголовок, описание, мета-таг и т.п.);
• внешний вид шрифта, которым набраны в тексте искомые слова (размер, жирность, цвет);
• количество ссылок из Интернета на данный документ;

• использование искомого слова в тексте ссылок из Интернета на данный документ.

Платные ссылки - возможны контекстные показы баннера 468х60, нулевой ссылки, а также использование системы "Бегун".

1 октября 1997

Кирилл и Мефодий

http://www.km.ru/

 

 Поиск осуществляется по всему мультипорталу КМ, в том числе по мегаэнциклопедии, статьям и новостям, а также рефератам. Также  поиск осуществляется по файлам, которые находятся на самых разных ресурсах Интернет. Поиск ведется по http, что существенно расширяет его возможности. Вы можете искать в
сети музыку (mp3, wav), видео (avi, ram, mpg), программы (exe), архивы (rar, zip), документы (doc, xls, ppt) и другие файлы.

25 декабря 1996

Russia on the Net

http://www.ru/eng/index.html

Сервер Russia on the Net, принадлежащий компании "Демос"меется возможность поиска по ключевым словам в описаниях и адресах ресурсов. В декабре 1998 года база данных содержала сведения примерно о 3700 сайтах. Долгое время каталог велся только на английском языке, но в начале 1998 года появилась и русская версия.

25 июня 1998

About.com

http://www.about.com/

Англоязычный веб-сайт, онлайновый источник информации и советов для потребителей. В рейтинге Nielsen NetRatings он входит в верхнюю десятку веб-сайтов[1]. Сайт основан в 1996 году. В 2005 году был приобретён компанией «The New York Times Company» и с тех пор принадлежит Нью-Йорк таймс. Содержание About.com развивается динамически, в соответствии с новой информацией и изменениями интересов потребителей.

 

12 марта 1999

ЁПРСТ  

http://www.eprst.ru

 

17 августа 2001

Улитка

http://www.ulitka.ru/

Относительно новый справочник. Содержание пока ограничивается 4400 ресурсами. Иерархическая структура не лишена изъянов. Включены сведения не только о российских, но также и о некоторых зарубежных ресурсах.

2 марта 1998

 

Метапоисковые системы:

Название ресурса

Адрес ресурса

Краткая аннотация ресурса

Дата регистрации

MetaBot

http://www.metabot.ru/

На момент рождения Метабота в рунете не было больших мета-искалок (попытки создать что-то такое, конечно, были, но успехом они не увенчались), поэтому идея реализовать именно мета-поисковик напрашивалась сама собой.

Для публичного тестирования metabot.ru был открыт 1 января 2001-го года, то есть скоро будет уже шесть лет.

10 декабря 2001

MetaCrawler

http://www.metacrawler.com/

 

Посылает запрос одновременно на 9 поисковых машин: на Open Text, Lycos, WebCrawler, InfoSeek, Excite, Inktomi, Alta Vista, Yahoo, and Galaxy. Обычно поиск в MetaCrawler по одному или нескольким ключевым словам. Очень быстрый ответ на запрос можно получить в режиме скоростного поиска. Детальный поиск займет больше времени, а также даст большее количество результатов. В режиме расширенного поиска можно использовать слова AND и NOT.

26 февраля 1997

Excite

http://www.excite.com/ 

 

Стартовав позже других мощных систем - в конце 1995 года - система быстро завоевала популярность, поскольку предлагает множество средств поиска в самых разных информационных средах. Среди них - WWW, новости из электронных журналов и газет, E-mail адреса, географические карты и атласы дорог, погода, котировки акций, а также такие средства как поиск и резервирование мест в отелях, транспортных средствах и т.д.

19 сентября 1995

Hotbot

http://www.hotbot.com

Дебютировала в мае 1996 года и обрела множество поклонников благодаря качеству и охвату своих поисковых результатов, которые в то время обеспечивались Inktomi. HotBot также привлек внимание опытных пользователей Интернета и программистов, особенно благодаря необычным цветам и интерфейсу, которые и сегодня продолжают быть отличительной чертой поисковика.

HotBot обрел большую известность, когда стал использовать результаты поисковой системы Direct Hit в 1999 году.

10 апреля 1996

WebCrawler

http://www.webcrawler.com

WebCrawler использует инновационную метапоисковую технологию, чтобы искать в лучших
поисковых системах Интернета, включая Google, Yahoo!, Ask Jeeves, About, Looksmart и др. 
Одним кликом WebCrawler вместо результатов только одной поисковой системы ищет лучшие поисковые результаты из ведущих поисковых систем мира. Кроме того, WebCrawler позволяет уточнить поиск, что позволяет вам тут же найти подходящую информацию.

2 февраля 1999

 

 

Hosted by uCoz