Міжнародні пошукові системи. Коаліції великих міжнародних пошукових систем

Міжнародні пошукові системи. Коаліції великих міжнародних пошукових систем

Тест-залік з інформатики
«Інформаційно-комунікаційні технології роботи
в комп'ютерної мережі»

11 клас

Залік

    Комп'ютерна мережа – це …

    1. сукупність комп'ютерів та різних пристроїв, що забезпечують інформаційний обмін між комп'ютерами у мережі без використання будь-яких проміжних носіїв інформації

      об'єднання комп'ютерів, що розташовані на великій відстані, для загального використання світових інформаційних ресурсів

      об'єднання комп'ютерів, розташованих на невеликій відстані один від одного

    Протоколи – це …

    1. спеціалізовані засоби, що дозволяють у реальному часі організувати спілкування користувачів каналами комп'ютерного зв'язку

      сукупністю правил, що регулюють порядок обміну даними у мережі

      система передачі електронної інформації, що дозволяє кожному користувачеві мережі отримати доступ до програм та документів, що зберігаються на віддаленому комп'ютері

    Встановіть відповідність

1. Сервер

а) узгоджений набір стандартних протоколів, що реалізують їх програмно-апаратних засобів, достатній для побудови комп'ютерної мережі та обслуговування її користувачів

2. Робоча станція

b) спеціальний комп'ютер, який призначений для віддаленого запуску додатків, обробки запитів на отримання інформації з баз даних та забезпечення зв'язку із загальними зовнішніми пристроями

3. Мережева технологія

c) це інформаційна технологіяроботи в мережі, що дозволяє людям спілкуватися, оперативно отримувати інформацію та обмінюватися нею

4. Інформаційно-комунікаційна технологія

d) це персональний комп'ютер, що дозволяє користуватися послугами, що надаються серверами

    У якому році Росія була підключена до Інтернету?

    1. 1992

      1990

      1991

    Браузер – це …

    1. інформаційна система, основними компонентами якої є гіпертекстові документи

      програма для перегляду Web-сторінок

      сервіс Інтернету, що дозволяє обмінюватися між комп'ютерами через мережу електронними повідомленнями

    Всесвітня павутина – це система у глобальній мережі носить назву:

    1. WWW

      FTP

      BBS

      E-mail

    Встановіть відповідність

1. Локальна мережа

a) об'єднання комп'ютерів, що розташовані на великій відстані один від одного

2. Регіональна мережа

b) об'єднання локальних мережу межах однієї корпорації для вирішення спільних завдань

3. Корпоративна мережа

c) об'єднання комп'ютерів у межах одного міста, області, країни

4. Глобальна мережа

d) об'єднання комп'ютерів, розташованих на невеликій відстані один від одного

    Адреса електронної пошти записується за певними правилами. Заберіть зайве

    1. petrov_yandex.ru

      [email protected]

      [email protected]

      http://www.edu.ru

    Встановіть відповідність

1. Всесвітнє павутиння WWW

a) спеціалізовані засоби, що дозволяють у реальному часі організувати спілкування користувачів каналами комп'ютерного зв'язку

2. Електронна пошта e-mail

b) інформаційна система, основними компонентами якої є гіпертекстові документи

3. Передача файлів FTP

c) система пересилання кореспонденції між користувачами у мережі

4. Телеконференція UseNet

d) система передачі електронної інформації, що дозволяє кожному користувачеві мережі отримати доступ до програм та документів, що зберігаються на віддаленому комп'ютері

5. Системи спілкування "on line" chat, ICQ

e) система обміну інформацією між безліччю користувачів

    Які пошукові системи є міжнародними? Виберіть правильну відповідь

    1. http://www.yandex.ru

      http://www.rambler.ru

      http://www.aport.ru

      http://www.google.ru

Відповіді:

1

2

3

4

5

6

7

8

9

10

a

b

1-b
2-d
3-а
4-c

c

b

a

1-d
2-c
3-b
4-а

a, d

1-b
2-c
3-d
4-е
5-a

Список найбільш значимих пошукових систем та каталогів

Основні міжнародні пошукові системи та каталоги

Пошукові системи

1. Alta Vista- http://www.

AltaVista відкрита у грудні 1995, потім куплена компанією Compaq Computer Corporation (до цього була у віданні DEC), а після цього виділилася в самостійну компанію, яка зараз контролюється CMGI. Alta Vista по праву вважається найбільшою та авторитетною пошуковою системою. Для Росії представляє особливий інтерес, тому що дозволяє вести пошук не тільки англійською, а й російською, та багатьох інших мов.

2. Excite- http://www.

Одна з найбільших пошукових системв світі. Перебуває у партнерстві з Netscape. Запущена в 1995 році система швидко розвивалася, і в 1996 році Excite купив двох своїх конкурентів: Magellan і WebCrawler. Незважаючи на зміну власника, ці два пошукових серверапродовжують працювати як незалежні системи.

3. Hot Bot - http://www.

Система запущена у травні 1996 року. Є дітищем культового журналу Wired. У жовтні 1998 Lycos купив Wired Digital, але продовжував підтримувати HotBot як самостійний проект. У більшості випадків джерело першої сторінки результатів пошуку HotBot – Direct Hit, а подальших – Inktomi. Інформація для каталогу береться із проекту Open Directory. HotВot знаходиться у постійній конкурентній боротьбі з AltaVista. Потужна пошукова система, одна з тих, що видають хороші результати пошуку

4. Go / InfoSeek- http://www. /

Портал, запущений InfoSeek та Disney. Пропонує як безкоштовну пошту, так і можливості пошукових машин, запозичені від InfoSeek (відкрита на початку 1995 року, ця система мала дуже солідну репутацію). Здійснює якісний пошук завдяки алгоритму пошуку ESP, що використовується. Також містить вражаючий каталог веб-сайтів, зібраний командою спеціалістів. Офіційно Go (не плутати з GoTo) почав свою роботу у 1999 році.

5. Northern Light- http://www. /.

Система почала працювати з серпня 1997 року та в Наразістрімкими темпами індексує Мережа, що ставить її нарівні з провідними пошуковими системами. Northern Light має набір документів "спеціальної колекції", які зазвичай не доступні для спайдерів пошукових машин. Це документи із тисяч джерел, включаючи газети, журнали, різні бази даних. Пошук таких документів здійснюється безкоштовно, проте за їх перегляд необхідно заплатити до 4 доларів. Система, крім володіння величезними ресурсами, має можливість класифікувати документи на теми, що є ще одним позитивним моментом.

6. WebCrawler- http://www.

Існує з квітня 1994 року. Власник - відома AOL, і всім користувачам цього сервіс-провайдера була рекомендована саме ця пошукова система. У листопаді 1996 року WebCrawler був куплений своїм конкурентом - Excite, хоча і продовжує працювати як незалежна пошукова система. Має власну директорію рецензованих сторінок.

7. Ask Jeeves- http://www.

Ask Jeeves використовує серію питань для того, щоб звузити поле пошуку, потім видає відповідь на основі матеріалу, підготовленого групою редакторів. Це пошукова система, яка направляє користувача на ту сторінку, що відповідає на поставлене їм запитання. Якщо системі не вдається знайти необхідне посилання у своїй базі даних, вона звертається до іншим пошуковим машинам. Почала працювати у червні 1997 року.

8. Direct Hit- http://www. /

Direct Hit – компанія, яка працює з іншими пошуковими машинами для того, щоб покращити їхні результати. Це здійснюється шляхом моніторингу того, на які посилання результатів пошуку реагують користувачі. Сайти, посилання на які натискаються частіше, ніж інші, піднімаються вище в рейтингу Direct Hit. Отже, Direct Hit позиціонується як "двигун популярності". Подібна технологія добре продемонстрована на HotBot.

9. FAST Search- http://www. /

Раніше називався All The Web. FAST Search прагне охопити всю павутину. Став першою пошуковою машиною, яка перейшла 200-мільйонний рубіж проіндексованих сторінок. Norwegian company, власник FAST Search, також підтримує пошукову машину Lycos MP3. FAST Search розпочала роботу у травні 1999 року.

10. GoTo- http://www. /

На відміну від інших пошукових машин, GoTo продає свої списки. Компанії можуть заплатити, щоб мати можливість бути розміщеним на початку результатів пошуку. Неоплачені результати видає Inktomi. GoTo розпочала роботу у 1997 році.

11. Google- http://www. /

Google - пошукова машина, яка користується популярністю посилань як основний критерій ранжування веб-сайтів. Саме тому особливо добре в ній представлені ресурси з тем "автомобілі" та "подорожі".

12. Inktomi- http://www. /

Спочатку була пошуковою машиною Inktomi в UC Berkeley. Потім засновники сформували власну компанію під тим самим ім'ям. Наразі механізм Inktomi використовують різні компанії.

Каталоги

1. Yahoo!- http://www.

Існуючий з кінця 1994 року, Yahoo! - найпопулярніший та найстаріший з основних каталогів Інтернету. Секрет популярності Yahoo! - Люди. Це один із найбільших путівників по веб, створених вручну близько 150 авторами у спробі впорядкувати мережу. Yahoo! використовує результати пошукової машини Inktomi. Під час введення запиту Yahoo! здійснює пошук за своїм каталогом. Якщо результати незадовільні, запит автоматично перенаправляється до Inktomi. Містить понад мільйон веб-сторінок. На голову вище конкурентів за якістю результатів пошуку – кожен сайт каталогу пройшов фільтрацію працівниками системи.

2. Lycos- http://www.

Існуюча з кінця 1994 року пошукова система Lycos була найстарішою серед основних пошукових систем. Проте вона загубилася у потоці заявок, коли спробувала стати сайтом для широкого загалу. Тому в квітні 1999 року вона перетворилася на каталог, що діє подібно до Yahoo!. Основне джерело ресурсів - Open Directory project, Lycos також користується послугами Direct Hit або власним глобальним пошуком. У жовтні 1998 року Lycos було придбано конкуруючою пошуковою машиною HotBot.

3. LookSmart- http://

Це каталог веб-сайтів, створений вручну. Як самостійний каталог, Look Smart надає ресурси для MSN Search, Excite та багатьох інших своїх партнерів. AltaVista видає LookSmart додаткові результати пошуку. LookSmart почав незалежне існування в жовтні 1996 року, потім на рік був куплений Reader's Digest. LookSmart стає одним з основних конкурентів Yahoo! в категорії сайтів. Містить близько чверті мільйона сайтів, розділених на категорії.

4. Snap- http://www.

Каталог веб-сайтів створений майстрами CNET. Підтримується механізмом пошуку Inktomi. Як і LookSmart, намагається конкурувати з Yahoo! упорядкуванні Web. Snap був запущений наприкінці 1997 року і підтримується CNET і NBC. Містить огляди сайтів, посилання на партнерів, інші сайти CNET.

5. Open Directory- http://dmoz. org/

Відомий раніше як NewHoo, каталог розпочав роботу у червні 1998. У листопаді 1998 року був куплений Netscape, при цьому компанія заявила, що кожен зможе користуватися інформацією каталогу за відкритою угодою. Метою проекту Open Directory є створення каталогу Web із залученням широкого кола добровільних авторів. Це пов'язано з тим, що автоматизовані пошукові машини та каталоги не справляються з зростаючою кількістю ресурсів. Кожен користувач може зробити свій внесок у впорядкування ресурсів Мережі. Містить 1739097 сайтів, 262356 категорій, 24598 авторів. Lycos та AOL Search активно використовують дані Open Directory, у той час як AltaVista та HotBot включають ресурси Open Directory у свої результати пошуку.

6. iWon- http://www.

iWon, що підтримується американською телевізійною мережею CBS, містить каталог веб-сайтів, що генерується автоматично Inktomi. iWon роздає щоденні, щотижневі та щомісячні призи з маркетингового моделювання. Почав працювати восени 1999 року.

7. MSN Search- http://search. /

MSN Search компанії Microsoft - каталог веб-сайтів, що спирається на LookSmart та AltaVista. Також доступні дані RealNames та Direct Hit. Користувачам Internet Explorer 5 MSN Search також пропонує унікальну можливість зберігати результати попередніх пошуків.

8. Netscape Search - http:///

Результати Netscape Search"s базуються на Open Directory власної бази даних Netscape ("Smart Browsing"), в якій добре представлені офіційні веб-сайти. Також використовує Google. На порталі Netscape Netcenter представлені інші пошукові машини.

Як уже зазначалося вище, деякі пошукові системи мають при собі ще й каталог:

    Excite NetDirectory – http://www. Go (InfoSeek) – http://www. WebCrawler - http://www.

Нижче в таблиці представлені статистичні дані за квітень 2000 року за деякими каталогами та пошуковими машинами. Дані взяті із сайту Search Engine Watch(www.).

Служба

Кількість Web-сторінок, млн. прим.

Охоплено від усіх сторінок у web

Кількість користувачів на день, млн. чол.

AltaVista

Go (Infoseek)

NothernLight

AskJeeves

У вересні 1999 року Nielsen Net Ratings (www./reports/netratings.html) провела дослідження поведінки понад 20 млн користувачів мережі. Був оцінений середній час, який користувач проводить на кожній з пошукових машин і каталозі, а також охоплення аудиторії (частка активних користувачів, які відвідували кожну з пошукових систем) за місяць. Результати досліджень наведено нижче.

Кількість видавців

Кількість розділів

Кількість посилань

Open Directory

LookSmart

Go (Infoseek)

Служба

AltaVista

Go (Infoseek)

Nothern Light

Служба

Web Crawler

AskJeeves

Direct Hit

Кількість сторінок, переглянутих одним користувачем

Середній час відвідування (година: хв)

Служба

LookSmart

Кількість сторінок, переглянутих одним користувачем

Середній час відвідування (година: хв)

Служба

Netscape

Охоплення аудиторії

Вже давно стали невід'ємною частиною українського Інтернету. Пошукові системи зараз - це величезні і складні механізми, що є не тільки інструментом пошуку інформації, але й привабливими сферами для бізнесу.

Більшість користувачів пошукових систем ніколи не замислювалися (або замислювалися, але не знайшли відповіді) про принцип роботи пошукових систем, про схему обробки запитів користувачів, про те, з чого ці системи складаються і як функціонують.

Цей майстер-клас покликаний дати відповідь на питання про те, як працюють пошукові системи. Однак, Ви не знайдете тут факторів, що впливають на ранжування документів. І, тим більше, не варто розраховувати на докладне пояснення алгоритму роботи Яндекса. Його, за словами Іллі Сегаловича, - директора з технологій та розробки пошукової машини «Яндекс», можна дізнатися лише «під тортурами» самого Іллі Сегаловича…

2. Поняття та функції пошукової системи

Пошукова система - це програмно-апаратний комплекс, призначений для пошуку в мережі Інтернет і реагує на запит користувача, що задається у вигляді текстової фрази ( пошукового запиту), видачею списку посилань на джерела інформації, у порядку релевантності (відповідно до запиту). Найбільші міжнародні пошукові системи: "Google", "Yahoo", "MSN". У російському Інтернеті це - "Яндекс", "Рамблер", "Апорт".

Розглянемо докладніше поняття пошукового запиту з прикладу пошукової системи «Яндекс». Пошуковий запит повинен бути сформульований користувачем відповідно до того, що він хоче знайти максимально коротко і просто. Допустимо, ми хочемо знайти інформацію в «Яндексі» про те, як вибрати автомобіль. Для цього, відкриваємо головну сторінку"Яндекса", і вводимо текст пошукового запиту "як вибрати автомобіль". Далі, наше завдання зводиться до того, щоб відкрити надані на наш запит посилання на джерела інформації в Інтернет. Проте цілком можна і не знайти потрібну нам інформацію. Якщо таке сталося, то або потрібно перефразувати свій запит, або в базі пошукової системи дійсно немає жодної актуальної інформації по нашому запиту (таке може бути при заданні дуже «вузьких» запитів, як, наприклад, «як вибрати автомобіль в Архангельську»)

Першочергове завдання будь-якої пошукової системи – доставляти людям саме ту інформацію, яку вони шукають. Навчити користувачів робити «правильні» запити до системи, тобто. запити, які відповідають принципам роботи пошукових систем, неможливі. Тому розробники створюють такі алгоритми та принципи роботи пошукових систем, які б дозволяли знаходити користувачам інформацію, яку вони шукають.

Це означає, що пошукова система повинна "думати" так само, як думає користувач при пошуку інформації. Коли користувач звертається із запитом до пошукової машини, він хоче знайти те, що йому потрібно максимально швидко і просто. Отримуючи результат, він оцінює роботу системи, керуючись кількома основними параметрами. Чи знайшов він те, що шукав? Якщо не знайшов, то скільки разів йому довелося перефразувати запит, щоб знайти потрібне? Наскільки актуальну інформаціювін зміг знайти? Наскільки швидко опрацьовувала запит пошукова машина? Наскільки зручно було представлено результати пошуку? Чи був шуканий результат першим чи сотим? Як багато непотрібного сміття було знайдено нарівні із корисною інформацією? Чи знайдеться потрібна інформація при зверненні до пошукової системи, скажімо, через тиждень, або через місяць?

Для того, щоб задовольнити відповіді на всі ці питання, розробники пошукових машин постійно вдосконалюють алгоритми та принципи пошуку, додають нові функції та можливості, всіляко намагаються прискорити роботу системи.

3. Основні характеристики пошукової системи

Опишемо основні характеристики пошукових систем:

  • Повнота

    Повнота - одна з основних характеристик пошукової системи, що є відношенням кількості знайдених за запитом документів до загальної кількості документів у мережі Інтернет, що задовольняють даному запиту. Наприклад, якщо в Інтернеті є 100 сторінок, що містять словосполучення "як вибрати автомобіль", а за відповідним запитом було знайдено всього 60 з них, то повнота пошуку буде 0,6. Очевидно, що чим повніше пошук, тим менша ймовірність того, що користувач не знайде потрібний документ, за умови, що він взагалі існує в Інтернеті.

  • Точність

    Точність - ще одна основна характеристика пошукової машини, яка визначається мірою відповідності знайдених документів запиту користувача. Наприклад, якщо за запитом «як вибрати автомобіль» знаходиться 100 документів, у 50 з них міститься словосполучення «як вибрати автомобіль», а в інших просто ці слова («як правильно вибрати магнітолу і встановити в автомобіль»), то точність пошуку вважається рівною 50/100 (=0,5). Чим точніше пошук, Тим скоріше користувач знайде потрібні йому документи, тим менше різного роду «сміття» серед них буде зустрічатися, тим рідше знайдені документи не відповідатимуть запиту.

  • Актуальність

    Актуальність - не менш важлива складова пошуку, що характеризується часом, що проходить з моменту публікації документів у мережі Інтернет, до занесення їх до індексної бази пошукової системи. Наприклад, наступного дня після появи цікавої новини велика кількість користувачів звернулася до пошукових систем з відповідними запитами. Об'єктивно з моменту публікації новинної інформації на цю тему пройшло менше доби, проте основні документи вже були проіндексовані та доступні для пошуку завдяки існуванню у великих пошукових систем так званої «швидкої бази», яка оновлюється кілька разів на день.

  • Швидкість пошуку

    Швидкість пошуку тісно пов'язана з його стійкістю до навантажень. Наприклад, за даними ТОВ «Рамблер Інтернет Холдинг», на сьогоднішній день у робочі години до пошукової машини Рамблер надходить близько 60 запитів на секунду. Така завантаженість потребує скорочення часу обробки окремого запиту. Тут інтереси користувача та пошукової системи збігаються: відвідувач бажає отримати результати якнайшвидше, а пошукова машина повинна відпрацьовувати запит максимально оперативно, щоб не гальмувати обчислення наступних запитів.

  • Наочність

4. коротка історіярозвитку пошукових систем

У початковий період розвитку Інтернет, кількість його користувачів була невелика, а обсяг доступної інформації порівняно невеликий. Здебільшого доступ до мережі Інтернет мали лише співробітники науково-дослідної сфери. У цей час завдання пошуку інформації в Інтернеті не було таким актуальним, як нині.

Одним із перших способів організації доступу до інформаційним ресурсаммережі стало створення відкритих каталогів сайтів, посилання на ресурси у яких групувалися згідно з тематикою. Першим таким проектом став сайт Yahoo.com, що відкрився навесні 1994 року. Після того, як кількість сайтів у каталозі значно збільшилася, було додано можливість пошуку потрібної інформації з каталогу. У повному розумінні це ще не було пошуковою системою, тому що пошукова область була обмежена лише ресурсами, які є в каталозі, а не всіма Інтернет ресурсами.

Каталоги посилань широко використовувалися раніше, проте практично втратили свою популярність нині. Так як навіть сучасні, величезні за своїм обсягом каталоги, містять інформацію лише про мізерну частину мережі Інтернет. Найбільший каталог мережі DMOZ (його ще називають Open Directory Project) містить інформацію про 5 мільйонів ресурсів, тоді як база пошукової системи Googleскладається з понад 8 мільярдів документів.

У 1995 році з'явилися пошукові системи Lycos та AltaVista. Остання довгі роки була лідером у сфері пошуку інформації в мережі Інтернет.

У 1997 році Сергій Брін та Ларрі Пейдж створили пошукову машину Googleу рамках дослідницького проекту у Стендфордському університеті. Зараз Google – найпопулярніша пошукова система у світі!

У вересні 1997 року було офіційно анонсовано пошукову систему Yandex, що є найпопулярнішою в російськомовному Інтернеті.

В даний час існують три основні пошукові системи (міжнародні) - Google, Yahoo і , що мають власні бази та алгоритми пошуку. Більшість інших пошукових систем (яких налічується велика кількість) використовує у тому чи іншому вигляді результати трьох перелічених. Наприклад, пошук AOL (search.aol.com) використовує базу Google, а AltaVista, Lycos та AllTheWeb – базу Yahoo.

5. Склад та принципи роботи пошукової системи

У Росії основною пошуковою системою є «Яндекс», далі – Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причому зараз Mail.ru використовує механізм і базу пошуку «Яндекса».

Практично всі великі пошукові системи мають власну структуру, відмінну від інших. Однак, можна виділити загальні для всіх пошукових машин основні компоненти. Відмінності у структурі може лише у вигляді реалізації механізмів взаємодії цих компонентів.

Модуль індексування

Модуль індексування складається з трьох допоміжних програм (роботів):

Spider (павук) – програма, призначена для завантаження веб-сторінок. "Павук" забезпечує скачування сторінки та витягує всі внутрішні посилання з цієї сторінки. Завантажується HTML-код кожної сторінки. Для завантаження сторінок роботи використовують протоколи HTTP. Працює «павук» в такий спосіб. Робот на сервер передає запит "get/path/document" та деякі інші команди HTTP-запиту. У відповідь робот отримує текстовий потік, Що містить службову інформацію та безпосередньо сам документ.

  • URL сторінки
  • дата, коли сторінку завантажили
  • http-заголовок відповіді сервера
  • тіло сторінки (html-код)

Crawler («Павук, що подорожує») – програма, яка автоматично проходить по всіх посиланнях, знайдених на сторінці. Виділяє всі посилання на сторінці. Його завдання - визначити, куди далі має йти павук, спираючись на посилання або виходячи із заздалегідь заданого списку адрес. Crawler, слідуючи за знайденими посиланнями, здійснює пошук нових документів, ще невідомих пошуковій системі.

Indexer (робот-індексатор) - програма, яка аналізує веб-сторінки, завантажені павуками. Індексатор розбирає сторінку на складові та аналізує їх, застосовуючи власні лексичні та морфологічні алгоритми. Аналізують різні елементи сторінки, такі як текст, заголовки, посилання структурні та стильові особливості, спеціальні службові html-теги і т.д.

Таким чином, модуль індексування дозволяє обходити за посиланнями задану безліч ресурсів, завантажувати сторінки, що зустрічаються, витягувати посилання на нові сторінки з одержуваних документів і проводити повний аналіз цих документів.

База даних

База даних, або індекс пошукової системи - це система зберігання даних, інформаційний масив, в якому зберігаються спеціальним чином перетворені параметри всіх завантажених та оброблених модулем індексування документів.

Пошуковий сервер

Пошуковий сервер є найважливішим елементом усієї системи, оскільки від алгоритмів, які лежать в основі її функціонування, безпосередньо залежить якість та швидкість пошуку.

Пошуковий сервер працює наступним чином:

  • Отриманий від користувача запит піддається морфологічному аналізу. Генерується інформаційне оточення кожного документа, що міститься в базі (яке і буде згодом відображено у вигляді , тобто відповідної запиту текстової інформації на сторінці результатів пошуку).
  • Отримані дані передаються як вхідні параметри спеціальному модулю ранжування. Відбувається обробка даних за всіма документами, внаслідок чого для кожного документа розраховується власний рейтинг, що характеризує релевантність запиту, введеного користувачем, та різних складових цього документа, що зберігаються в індексі пошукової системи.
  • Залежно від вибору користувача цей рейтинг може бути скоригований додатковими умовами(Наприклад, так званий «розширений пошук»).
  • Далі генерується сніппет, тобто для кожного знайденого документа з таблиці документів вилучаються заголовок, коротка анотація, найбільш відповідна запиту і посилання на сам документ, причому знайдені слова підсвічуються.
  • Отримані результати пошуку передаються користувачеві як SERP (Search Engine Result Page) – сторінки видачі пошукових результатів.

Як видно, всі ці компоненти тісно пов'язані один з одним і працюють у взаємодії, утворюючи чіткий досить складний механізм роботи пошукової системи, що вимагає величезних витрат ресурсів.

6. Висновок

Тепер підсумуємо все вищесказане.

  • Першочергове завдання будь-якої пошукової системи – доставляти людям саме ту інформацію, яку вони шукають.
  • Основні характеристики пошукових систем:
    1. Повнота
    2. Точність
    3. Актуальність
    4. Швидкість пошуку
    5. Наочність
  • Першою повноцінною пошуковою системою став проект WebCrawler, що вийшов друком у 1994 році.
  • До складу пошукової системи входять компоненти:
    1. Модуль індексування
    2. База даних
    3. Пошуковий сервер

Сподіваємося, наш майстер-клас дозволить Вам ближче ознайомитися з поняттям ПС, краще дізнатися про основні функції, характеристики та принцип роботи пошукових систем.

Давайте розглянемо детальніше роботу з деякими пошуковими системами, для початку візьмемо міжнародні ПС:

AltaVista

Одна з найповніших, швидкодіючих та оновлюваних ПС. Дозволяє шукати інформацію і WWW, і Usenet будь-якою мовою. Під час завантаження з'являється вікно з рядком для введення запиту та кнопкою Search. (Рис. 1). Формат виразів для пошуку:

    слово малими літерами – інтернет- Виведе всі документи, де зустрічаються слова Інтернет, Інтернет, Інтернеті т.д.;

    слово із великими літерами – Інтернет- виведе всі сторінки, що містять слово Інтернет- Тобто. наявність великих буквзвужує пошук;

    вираз (словосполучення) у лапках – "московський провайдер інтернету"- Покаже сторінки, що містять фразу дослівно;

    знаки “ ” та “+” +інтернет-провайдер- обов'язкова наявність (+) або відсутність (-) зазначених слів;

    частина слова зі знаком “*” – інтер*- Пошук всіх сторінок, що містять цю частину слова - Інтернет, інтернаціонал, ...;

    ключове слово link: –link:home.microsoft.com– виведе список сторінок, що містять посилання на веб-сайт home.microsoft.com;

    ключове слово url:url:ru– сторінки, які мають у своїй інтернет-адресі домен ru.

Це т.зв. прості запити, що вводяться у рядку виразу для пошуку. Якщо цих конструкцій недостатньо, можна використати можливості розширеного запиту, що викликається під час натискання кнопки “Advanced”. Тут запити будуються за допомогою логічних операторів AND (“І”), OR (“АБО”), NOT (“НЕ”), а також NEAR

(“біля”). Наприклад, щоб знайти сторінку, що містить програму телеканалів ГРТ або РТР, потрібно використовувати таку конструкцію: програма AND телеканал* AND (ГРТ OR РТР)Після набору запиту потрібно натиснути клавішу Enter або кнопку Submit. Результати пошуку постають у вигляді назв сторінок, посилань на них та початку тексту, що міститься на сторінці, але відображення результатів можна налаштувати для себе. Основною складністю є таке формулювання запиту, щоб відсіяти якнайбільше непотрібних сторінок. За потреби запит можна уточнити для пошуку у результатах першого пошуку.


Не дивлячись на досить дивну назву (або завдяки саме йому), до сьогодні Yahoo залишається безумовним лідером за популярністю (і фінансовим благополуччям) серед пошукових систем Інтернету (рис.2). Основною перевагою є наявність "найтовстішого" вбудованого багатоступінчастого тематичного каталогу, що опитує найбільшу в Мережі базу даних (рис.2.1). Недарма серед персональних закладок багатьох користувачів можна знайти посилання на підрозділи каталогу Yahoo. Чималу частку популярності Yahoo серед широких мас привнесли можливості безкоштовного відкриття власної скриньки для роботи з електронною поштою та отримання солідного простору під розміщення веб-сторінок. Серед суттєвих недоліків Yahoo можна відзначити ігнорування багатьох неангломовних ресурсів, необхідність часом десятки разів реєструвати той самий ресурс, безліч застарілих посилань і, найчастіше, відсутність будь-яких коментарів до документа.


Інтерфейс пошукової системи Yahooпостійно модифікується та удосконалюється, зона пошуку постійно розширюється. Виникають нові версії пошукової машини для людей різного віку. Створено багато національних Yahoo-серверів. Друкується навіть спеціальний журнал як у віртуальній, так і глянсово-паперовій версіях. Однак основні методи пошуку залишаються незмінними: Ви або крок за кроком уточнюєте область пошуку, дотримуючись вказівників тематичного каталогу, або вписуєте ключові слова за стандартною схемою, вказаною нижче.

Необхідно усвідомити лише десяток нескладних правил: 1) для початку пошуку, після вказівки ключового слова (або фрази) необхідно натиснути на меню Search (Пошук) або клавішу Enter (Ввести) на клавіатурі, 2) якщо пошук ведеться за одним ключовим словом, пробіл після слова ставиться лише в тому випадку, якщо Ви бажаєте виключити з ймовірного списку ті документи, в яких до ключового слова примикають додаткові знаки (наприклад, розділові знаки), 3) при пошуку за відповідністю хоча б одного з перерахованих слів достатньо відокремити слова пробілами ( наприклад, best provider),

    при пошуку за відповідністю всіх слів необхідно перед другим, третім тощо.

словами поставити знак "+" (наприклад, best +provider).

    при необхідності виключити із загального списку документи, що містять слово, потрібно використовувати знак "-" (наприклад, best -provider).

8) для пошуку за відомим заголовком можна використовувати додатковий ключ "t:" (наприклад, t: best). 9) для пошуку слова серед доменних імен (URL) бажано вказати додатковий ключ "u:" (наприклад, u:best). 10) якщо Ви сумніваєтеся у правильності написання того чи іншого слова, використовуйте значок "*" (наприклад, pr*v*der).

Коли потрібно знайти "дуже конкретну" інформацію, є можливість використовувати "просунутий пошук" (advanced search).

Тут Ви можете вибрати специфічну логіку пошуку: за повною відповідністю ключової фрази (An exact phrase match), за участю в запиті всіх ключових слів(Matches on all words (AND)), за участю у запиті хоча б однієї з ключових слів (Matches on any word (OR)). Пошук може вестись як за базовим каталогом Yahoo (Yahoo Categories), так і за його межами (Web Sites). Як уже було сказано вище, Yahoo грішить індексуванням застарілого (морально та/або фізично) "сміття", тому іноді надзвичайно корисно мати можливість відсікти "стародавні" матеріали (Find only new listings added during the past ... years). Також можна вибрати кількість результатів пошуку, які відображаються на сторінці.

Методи введення ключових пошукових фраз особливо не відрізняються в різних пошукових системах, тому можете їх сміливо використовувати. Дуже часто на самому пошуковому сервері можна знайти опис його роботи, яким можна скористатися, якщо стандартні методи не підходять.

 

 

Це цікаво: