Правила пошуку в Інтернеті. Ефективний пошук інформації в інтернет

Правила пошуку в Інтернеті. Ефективний пошук інформації в інтернет

Проблема пошуку у Всесвітньому павутинні не в тому, що інформації мало, а в тому, що її багато. Пошук інформації в Інтернеті - наріжний камінь ефективної роботив мережі. Знання навичками пошуку робить Інтернет для користувача корисним як під час роботи, так і під час відпочинку.
Для організації пошуку Інтернету існують спеціалізовані служби, звані пошуковими системами.

Пошукові системи.

Пошукові системи – програмно-апаратний комплекс з web-інтерфейсом, що надає можливість пошуку інформації в Інтернеті.
Більшість пошукових систем шукають інформацію на сайтах Всесвітньої павутини, але існують також системи, які можуть шукати файли на FTP-серверах, товари в інтернет-магазинах, а також інформацію в групах новин Usenet. Для пошуку інформації за допомогою пошукової системи, користувач формулює пошуковий запит. На запит користувача пошукова система генерує сторінку результатів пошуку. Така пошукова видача може поєднувати різні типифайлів, наприклад: веб-сторінки, зображення, аудіофайли. Деякі пошукові системи також отримують дані з баз даних та каталогів ресурсів в Інтернеті.
Мета пошукової системи полягає в тому, щоб знаходити документи, що містять або ключові слова, або слова пов'язані з ключовими словами. Пошукова система краще, ніж більше документів, релевантних запиту користувача, вона буде повертати. Результати пошуку можуть ставати гіршими через особливості алгоритмів. Наприклад, на запит домашні тварини пошуковий сервер «Яндекс» (докладніше про нього див. нижче) видає більше 14 000 000 посилань на сторінки, що містять потрібні, на його погляд, відомості. Однак далеко не все так гладко: при відвідуванні деяких знайдених сторінок з'ясовується, що шуканої інформації на них недостатньо, а то й зовсім немає.
Щоб шукати з максимальною результативністю необхідно знати, як працюють пошукові сервери і правильно складати запит на пошук інформації.

Принципи роботи пошукових систем

Пошукові системи працюють, зберігаючи інформацію про багато веб-сторінок, які вони отримують з HTML сторінок. Основні складові пошукової системи: пошуковий робот, індексатор, пошуковик. Зазвичай, системи працюють поетапно. Спочатку пошуковий робот отримує контент, потім він переглядає вміст веб-сайтів. Тільки після цього індексатор генерує доступний для пошуку індекс. Індексатор - це модуль, який аналізує сторінку, попередньо розбивши її частини, застосовуючи власні лексичні і морфологічні алгоритми.
В основі роботи більшості сучасних пошукових систем лежить індекс цитування, який обчислюється індексатором в результаті аналізу посилань на поточну сторінку з інших сторінок Інтернету. Чим більше, тим вище індекс цитування аналізованої сторінки, тим вище ця сторінка буде відображена в результатах пошуку і тим вище сторінка буде представлена ​​в списку знайдених ресурсів.

Правила побудови пошукових запитів

Як уже зазначалося, в Інтернеті існує безліч пошукових серверів, вітчизняних та зарубіжних.
Російські пошукові сервери: Яндекс (www.yandex.ru); Рамблера (www.rambler.ru); Апорт (www.aport.ru) та Gogo (www.gogo.ru).

Закордонні пошукові сервери: Google ( www.google.com); Altavista (www.altavista.com) і Yahoo! (www.yahoo.com).
Для пошуку російською краще підходять російські сервери, іноземною - зарубіжні, хоча, Google непогано справляється з пошуком багатьма мовами. Незважаючи на заяви багатьох власників пошукових систем, що запити можуть бути написані практично мовою, яку люди використовують для спілкування між собою, це далеко не так. Завдяки впровадженню нових мовних технологій пошукові системи стали краще розуміти користувача. Пошуковики тепер шукають не тільки запитуване слово, але і його словоформи, що дозволяє робити результати пошуку більш точними. Наприклад, якщо в пошуковому запиті є слово розумний, то його результати будуть містити не тільки це слово, але і його похідні: розумного, розумна, а також розум і навіть розум. Природно, сторінки зі словоформами будуть у числі перших результатів пошуку, але елементи штучного інтелекту очевидні. Цей факт корисно враховувати під час побудови пошукових запитів.
Слід пам'ятати про те, що пошукові системи при обробці запиту не враховують регістр символів, а застосовувати розділові знаки в пошукових запитах зовсім не обов'язково, тому що вони також ігноруються пошуковими серверами. Однак при побудові складних розширених запитів, результати пошуку за якими зазвичай набагато ближче до очікуваних, використовують традиційні розділові знаки. Більшість пошукових систем може боротися з друкарськими помилками. Якщо пошуковому серверу здасться, що в слові допущена помилка або помилка, він попередить про це тією ж фразою: Можливо, ви шукали….

Слова для запиту на пошуковий сервер

Є вислів «Машина має працювати, людина – думати», і сказано воно якраз про таку ситуацію. Завдання користувача при складанні пошукового запиту - виділити ключові слова, завдання пошукового сервера - якнайкраще обробити введений запит. Розглянемо приклад, що ілюструє типові помилки користувачів-початківців при пошуку в Інтернеті. На запит «Загадки про музичні інструменти» пошукова система не видала корисних результатів. Тоді користувач вирішує виправити запит, доповнивши його і написавши: «Загадки для дітей про музичні інструменти» - результати пошуку виявилися ще гіршими від попереднього. Для цього хорошим рішенням став пошук за ключовим словом «загадки». В Інтернеті багато таких сайтів, а зайшовши на сам сайт і трохи пошукавши по його розділах, цілком можна знайти інформацію, що цікавить. Сформулюємо кілька правил складання запитів:

  • вибирайте тільки найважливіші ключові слова, що стосуються цієї теми;
  • слів не повинно бути надто багато, але й не надто мало;
  • при незадовільних результатах пошуку, використовуйте більш «м'які» умови для запиту або спробуйте пошукати в іншій системі пошуку, т.к. механізми роботи пошукових систем неоднакові, отже, результати також можуть відрізнятися.

Розширений пошук

Для більш ефективного пошуку в Інтернеті пошукові системи надають можливість розширеного пошуку, а також пошуку з використанням мови запитів. Розширений пошук - можливість пошуку із зазначенням безлічі різних параметрів. Для цього у пошукових системах передбачені окремі сторінки, на яких можна задати такі параметри. Принципи роботи розширеного пошуку схожі у більшості пошукових систем.
Розглянемо додаткові можливості пошуку на прикладах пошукових систем Яндекс і Google тому що Яндекс - найпопулярніший пошуковий сервер у російськомовному Інтернеті, а Google - найпопулярніший пошуковик у світі. При пошуку в Інтернеті «Яндекс» одним із перших став враховувати морфологію російської мови, тобто використовувати різні форми слова, про що йшлося вище. Зайшовши на сайт www.yandex.ru, користувач може ввести запит і відразу отримати результати пошуку, а можна використовувати посилання Розширений пошук, використовуючи піктограму, і перейти на відповідну сторінку (див. малюнок нижче), на якій тонко налаштувати параметри пошуку.

Сторінка розширеного пошуку «Яндекса»

Розглянемо додаткові можливості, які можна використовувати на сторінці розширеного пошуку: вказати власне місцезнаходження (Москва), вказати в якому вигляді має бути представлена ​​інформація (Тип файлу), період часу в якому шукаємо інформацію (за добу, за 2 тижні, за місяць, Від ..К), якою мовою повинна бути представлена ​​інформація (Російська, Англійська Ще), а також можна вказати URL-адресу сайту і т.д
Вибір (Точно як у запиті) вказується пошуковій системі для того, щоб морфологію слів запиту не змінювати, а шукати тільки ту форму слова, яка задана.

Мова запитів

Мова запитів – система команд, що дозволяє змінювати параметри запиту з основного рядка пошуку за допомогою спеціальних команд. Орієнтований на досвідчених користувачів.
Оскільки мова запитів досить складна та об'ємна, наведемо лише основні її конструкції, які можуть бути найбільш затребувані користувачами. Деякі команди мови запитів Яндекса представлені в таблиці.

Оператор

Опис

Синтаксис

Приклад запиту

Пошук документів, у яких обов'язково є виділене слово.

Допустимо використовувати кілька операторів + в одному запиті.

"слово 1+слово 2"

Буде знайдено документи, в яких обов'язково містяться слова «бульвар» та «Москва» і можуть бути слова «шолохів».

Пошук за цитатою.

Пошук документів, що містять слова запиту у заданій послідовності та формі.

"слово 1 слово 2 ... слово N"

Буде знайдено документи, що містять цю цитату.

Пошук за цитатою із пропущеним словом (словами).

Один оператор відповідає одному пропущеному слову.

Увага! Використовується лише у складі оператора.

"слово 1 * слово 2 ... слово N"

Оператор відокремлюється пробілами.

Буде знайдено документи, що містять цю цитату, включаючи пропущене слово.

Буде знайдено документи, що містять цю цитату, включаючи пропущені слова.

Повністю зі структурою мови запитів Яндекса можна познайомитися на сторінці Допомоги (http://help.yandex.ru/search/?id=481939). Мова пошукових запитів у Google відрізняється від Яндекса, хоча є деякі загальні моменти. Розгляньте деякі основні команди цієї мови, вивчивши таблицю (див.нижче)

Повністю структуру мови запитів Google можна знайти на сторінці Допомоги:

Отже, ви увійшли на пошуковий сервер, набрали потрібний рядок і ... не знаходиться нічого або майже нічого. Швидше за все, ви ввели надто докладний або специфічний запит. У цьому випадку я можу порадити вам правильно складати пошукову фразу. Наприклад, замість "Класифікація дерев хвойних порід у заповідниках середньої смуги" краще набрати "Хвойні породи заповідники". Запит стане загальнішим, але під нього потрапить більша кількість потенційно шуканих сторінок. Адже не обов'язково на сайті заповідника будуть слова «середня смуга», може бути просто позначено назву області, де він знаходиться.

Не обмежуйтесь одним пошуковим сервером.Справа в тому, що в основі будь-якого пошукача знаходиться програма-павук, яка постійно «блукає» за посиланнями та оновлює свою базу даних. Так ось, «павук» кожного із серверів робить це по-різному, і цілком може статися, що сторінка, не знайдена Рамблером чи Гуглом, буде люб'язно надана вам Апортом чи Яндексом. Якщо потрібна інформація — не російською мовою, то краще використовувати зарубіжні сервери, наприклад Yahoo, вони більше оптимізовані під англомовні сайти.

Більш типова, однак, інша ситуація - пошуковий сервер "завалив" Вас посиланнями, але серед них немає відповідної інформації. На цей випадок є рецепти.

Не обмежуйтесь першою сторінкою результатів.Справа в тому, що конкуренція за попадання на перші позиції за пошуковими запитами, які можуть принести прямий комерційний прибуток власникам сайту, дуже висока. І на перших позиціях там, як правило, знаходяться не найоб'єктивніше підходять під запит (релевантні) сайти, а сайти, чиї власники найбільш активно та успішно займаються просуванням своєї Інтернет-сторінки ( пошуковою оптимізацією- SEO). Тож нерідко варто йти далі. Адже відповідь на Ваш запит може бути на другій, третій, п'ятій і навіть десятій сторінках пошукової видачі.

Уточнюйте географію пошуку та предметну область.Зазвичай при пошуку будь-яких товарів чи послуг добра половина посилань вказує на фірми міста з найбільшою економічною активністю Москви. Тому мешканцям інших міст слід або вказати місто у рядку запиту, або уточнити регіон засобами самого пошукового сайту. Також корисно скористатися рубрикатором пошуковика і вказати предметну область — наприклад «Комп'ютери» або «Фото».

Шукайте у знайденому.Багато пошукових серверів дозволяють шукати в знайденому, тобто здійснювати ступінчастий пошук. Наприклад, пошукова фраза «Санаторії кавказькі мінеральні води» сформує початковий масив сторінок, присвячених санаторіям регіону Кавказьких мінеральних вод, а використовуючи функцію пошуку в знайденому разом з новим рядком «Кардіологія», можна виділити з нього тільки санаторії, які займаються серцевими хворобами.

Використовуйте переваги розширеного пошуку.Функції розширеного пошуку, які є у багатьох пошукових серверів, дуже допоможуть вам у відсіканні непотрібних документів. Вони, наприклад, дозволять шукати лише документи певною мовою або певного формату, або документи, створені в потрібному діапазоні дат. Останнє буває корисним, якщо ви шукаєте новини. Наприклад, при спробі отримати інформацію про придатність водойм Москви до купання за допомогою запиту «Водойми Москви купатися» працелюбний Яндекс видасть вам інформацію за минулий і позаминулий роки, але варто в розширеному пошуку обмежити дату документа останніми трьома місяцями, і ви гарантовано отримаєте дані поточного сезону .

Але навіть якщо ви наслідували всі ці поради і все одно не змогли знайти на просторах інтернету потрібну вам інформацію, то, швидше за все, її туди ще ніхто не помістив, буває і так. У вас є унікальна нагода зробити це першим.

Ось загалом і все на сьогодні. До нових зустрічей і вдалого вам пошуку!

Нескінченний перегляд сторінок Інтернету в пошуках потрібної інформації втомлює. За статистикою, 85% користувачів взагалі геть-чисто забуває, що вони взагалі шукали, захоплені іншими темами, куди наполегливо їх спрямовує пошуковик. Як результат – втрата часу та нульовий результат. Але якщо знати, як правильно скласти запит для ГУГЛА або ЯНДЕКСА, знайти потрібну інформацію можна практично моментально.

Добре, коли є вільний час і вам нема чого робити. Чому б і не полазити просторами всесвітньої мережі. З кожним днем ​​кількість різноманітної інформації в інтернеті зростає. Це музика та фільми, книги та журнали, всілякі сервіси, та й просто цікаві статті. І все більше людей просиджує в інтернеті величезну кількість часу на добу. Але прочитати чи переглянути все просто неможливо! А якщо у вас не так багато часу, та до того ж необхідно знайти певну статтю чи якийсь файл (наприклад, пісню), то знайти потрібне одразу проблематично.

Щоб полегшити пошук, сайт sovetiposekretu .ru відкриє деякі тонкощі та секрети пошуку googleабо ЯНДЕКСА, які збережуть ваші нерви і допоможуть взаєморозумінню між вами та пошуковими системами. Розглянемо пошук інформації на прикладі Google.

Крок 1

Якщо Ви точно знаєте, що хочете знайти (наприклад, друга), то звичайно ви знаєте його дані. Вписуємо поспіль слова в ГУГЛІ (припустимо вася пупкін в інтернеті)і начебто все. Але не так простий цей гугл, секрети пошуку цим не обмежуються.

Пошукові машини налаштовані так, що починають видавати більш розкручені сайти, на яких трапляється хоч одне слово із запиту, але того, що ми шукали, там може й не бути. Для того, щоб знайти потрібне, достатньо пошуковий запитукласти в лапки "вася пупкін в інтернеті", і пошук видасть саме ті сайти, на яких зустрічаються всі слова.

Крок 2

А якщо Вам необхідно знайти інформацію, а точної назви чи повну фразу з тексту ви не пам'ятаєте? І для цього можна застосувати деякі тонкощі складання запиту. Тоді пошук по сайту з допомогою googleздійснюємо наступним чином. Набираємо в пошуковій системі слова, які на нашу думку відносяться до інформації, яку ми шукаємо. Робимо це в будь-якому порядку, але при цьому між словами вставляємо символ &. Пошукова система шукатиме сайти, не ті, в яких зустрічається хоча б одне слово, а сайти, де всі набрані слова будуть в одному реченні.

Крок 3

Такий варіант: ви хочете знайти інформацію, в якій не повинно бути певного слова в пошуковій фразі, наприклад, Ви хочете знайти книгу, а ГУГЛ видає посилання на скачування файлу, наприклад у PDF форматі, але формат цей вам не подобається або якість у цьому форматі жахлива . У такому разі скористаємося знаком «-PDF» (без лапок) і пошуковик видасть усі формати крім PDF.

Крок 4

Але бувають ситуації, у яких файл повинен мати певне слово. Наприклад, ми хочемо завантажити караоке певної пісні. Щоб не переглядати всі запропоновані ГУГЛОМ сторінки, використовуємо знак «+ караоке» (без лапок), і ось Ми насолоджуємося списком посилань на завантаження музики тільки в форматі караоке.

Крок 5

Всі оператори пошуку Google за замовчуванням шукають Ваші слова з урахуванням морфології, тобто слова можуть схилятися. Але якщо вам необхідно, щоб у назві чи реченні знаходилося слово в тому вигляді, в якому ви його запросили, то прописуємо знак «!» (без лапок) безпосередньо перед словом, що шукається. При цьому між знаком і словом не повинно бути пропуску.

Крок 6

Іноді потрібно знайти файли, які знаходяться у певному форматі або спеціальному розширенні. Наприклад, як шукати на сайті через google музику у форматі MP3 або текст у doc. Для пошуку таких файлів існують спеціальні команди, при яких пошукові системи шукатимуть сайти, на яких присутні файли саме таких форматів (MP 3, doc ), а не просто назви в заголовках. У пошуковику ГУГЛ такою командою є написання слова "filetype:" (наприклад, завантажити пісню Москваfiletype:mp3), а для ЯНДЕКСА відповідно слово "mime:" (наприклад, завантажити книгу Донцової mime:pdf).

Ну і наприкінці кілька приколів від ГУГЛА:
1. Наберіть у пошуковому рядку do a barrel roll або zerg rusр або tilt і подивіться результат.
2. Увімкніть, враховуючи правила пошуку в гугле, будь-яке відео на YouTube. Натисніть паузу та швидко натисніть: кнопки вправо, потім вгору. Стара знаменита гра змійка на вашому екрані!
3. Набрид один і той же вид головної сторінкиГУГЛА? Влаштуйте невеликий безлад
4. Китайці пішли далі. За будь-яким запитом шукає картинки.
5. Стара забута гра Pac-Man, тепер є і в ГУГЛІ. Пограти
6. Якщо Вас дістали проханнями зробити правильний пошук в Google знайти щось, сміливо давайте посилання
7. Ну і наостанок – користувачам, хто користується RSS. Наберіть, перебуваючи в Google Reader, комбінацію клавіш: вгору, вгору, вниз, вниз, ліворуч, праворуч, ліворуч, праворуч, B, A. Раз – і перед Вами симпатичний ніндзя.
Використовуючи ці найпростіші поради, ви навчитеся, як правильно користуватися гуглом і вам не доведеться посвячувати знайомого програміста в таємні уподобання, наприклад перегляду журналу MAXIM.

Федеральне агентство з освіти

Смоленський державний університет

Технології пошуку інформації в Інтернеті.

Смоленськ


Вступ…………………………………………………………………………..

1.Класифікація пошукових систем …………………………………………...

2.Прийоми пошуку………………………………………………………………....

2.1.Простой поиск………………………………………………………………..

2.2.Розширений пошук………………………………………………………….

3.Тематичний каталог Yahoo.…………………………………………………

4.Автоматичний індекс Alta Vista……………………………………………

5.Пошук інформації в конференціях (Usenet)………………………………..

6. Вітчизняні пошукові служби …………………………………………..

6.1.Rambler……………………………………………………………………….

6.2.Яндекс………………………………………………………………………….

7.Пошук файлів …………………………………………………………………..

8.Джерела спеціалізованої інформації ………………………………

9.Пошук окремих людей у ​​мережі Internet ……………………………………...

10.Метапошук……………………………………………………………………..

11.Ефективний пошукінформації…………………………………………...

Заключение……………………………………………………………………….

Література………………………………………………………………………..

Вступ

Будь-хто, хто намагався колись знайти потрібну інформацію в Інтернеті, напевно погодиться з тим, що цей процес схожий на пошук голки в копиці сіна. Глобальна мережа Internet містить великий обсяг інформації, який швидко збільшується з кожним днем. Внаслідок цього часто виявляється, що завдання знаходження необхідної інформації в цьому інформаційному океані є надзвичайно складним і потрібно вміти ефективно використовувати різні пошукові системи (програми пошуку інформації в мережі). Необхідно врахувати, що "пошук – це мистецтво".

1. Класифікація пошукових систем

Існує багато різних пошукових систем, що належать різним компаніям. Насамперед, виділяють так звані тематичні каталоги (наприклад, Yahoo) та автоматичні індекси (наприклад, AltaVista), хоча необхідно мати на увазі, що ціла низка пошукових систем займає деяке проміжне положення між цими двома "полюсами", тобто вони містять елементи обох цих класів. Кожна з пошукових систем має свою велику базу даних про адреси (місце розташування) різних Web-документів, і пошук посилань на необхідну нам інформацію відбувається не в самих Web-документах, а саме в цій базі даних.

Тематичні каталоги та автоматичні індекси розрізняються, перш за все, по тому, як формуються та поповнюються їх бази даних: чи беруть у цьому процесі участь люди, чи все відбувається абсолютно автоматично.

Бази даних тематичних каталогів складаються та систематично поповнюються експертами у відповідних областях на підставі нових Web-документів, виявлених в Internet спеціальними пошуковими програмами. Тематичний каталог представляє користувачу Internet деяку деревоподібну структуру категорій (розділів та підрозділів), на верхньому рівні якої зібрані найзагальніші поняття, такі як Наука, Мистецтво, Бізнес тощо, а елементи найнижчого рівня є посилання на окремі Web-сторінки та сервери разом з коротким описом їхнього вмісту. Цим ієрархічним каталогом можна подорожувати, починаючи з більш загальних категорій (понять) до вужчих, спеціалізованих.

Наприклад, для знаходження інформації про стан наукових досліджень з теорії суперструн можна спуститися вниз наступною "сходами" понять:

Science (Наука)

Physics (Фізика)

Theoretical Physics (Теоретична фізика)

Theories (Теорії)

String Theories (Теоріструн)


В результаті буде одержано список сайтів, серед яких найбільший інтерес представляє сайт Superstrings. Клацнувши мишею на гіперпосиланні Superstrings, ми потрапляємо на home page сайту, з відповідним заголовком, на якому можна знайти on-line підручник з теорії суперструн, різні посилання для подальшого читання, глосарій з суперструн і т.д.

Головною перевагою тематичних каталогів є велика цінність інформації, що отримується користувачем, що забезпечується присутністю "людського фактора" в процесі аналізу та сортування нових Web-сторінок. З іншого боку, тематичні каталоги мають суттєвий недолік, пов'язаний знову ж таки з людським фактором, бо через обмежені можливості людини їх бази даних охоплюють лише невелику частину всього інформаційного Web-простору (менше 1 %). Таким чином, незважаючи на всю корисність тематичних каталогів, використання лише пошукових систем цього виду часто виявляється недостатнім.

Зведена таблиця вибраних предметних каталогів

List.Ru Апорт Яндекс Rambler Yahoo! About
Загальна характеристика 19 розділів верхнього рівня 14 розділів верхнього рівня 10 основних розділів, 7 комбінованих, додаткова класифікація 56 розділів 14 основних розділів 36 розділів
Сортування ресурсів усередині розділу Алфавіт, оцінка гідів, популярність (відвідуваність), дата Алфавіт, відвідуваність, ліга, оцінка кількості посилань на даний ресурс, думка користувачів Алфавіт, дата додавання, індекс цитування за відвідуваністю за алфавітом за оплаченістю посилань
Булівські оператори Використовується мова пошукової машиниАпорт Використовується мова пошукової машини Яndex Використовується мова пошукової машини Rambler Ні Ні
Пошук за фразою " " " "
Префікси +, - +, -
Ітеративний пошук (у результатах) Є пошук усередині категорії Після входу натисніть More…
заміна частини слова * * (Не завжди коректно)

На відміну від тематичних каталогів, бази даних для автоматичних індексів створюються і поповнюються повністю автоматично деякими спеціальними, внутрішніми пошуковими програмами-роботами, які в цілодобовому режимі переглядають Internet-вузли (сайти) у пошуках новостворених Web-документів. З кожного такого документа робот витягує всі посилання, що містяться в ньому, і додає їх у свою базу адрес, в результаті чого у програми-робота виникає можливість перегляду ще деякої кількості нових для нього Web-документів. У кожному новому Web-документі робот аналізує всі слова, що входять до нього, і в розділі бази даних, що відповідає кожному даному слову, запам'ятовується адреса (URL) документа, де це слово зустрілося. Таким чином, база даних, створювана автоматичним індексом, фактично зберігає відомості про те, у яких Web-документах містяться ті чи інші слова. На відміну від тематичних каталогів автоматичні індекси охоплюють до 25 % загального Web-простору.

Автоматичний індекс має окрему пошукову систему для забезпечення інтерфейсу користувача. Ця система може, переглядаючи базу даних, по заданому набору ключових слівзнаходити та видавати на екран користувача комп'ютера адреси та коротку інформацію про всі Web-сторінки, які містять даний набір ключових слів. Таким чином, автоматичний індекс складається з трьох частин: програми-робота, що збирається цим роботом бази даних та інтерфейсу для пошуку в цій базі даних. Саме з останньою складовою і працює користувач. В силу такої організації автоматичний індекс не робить будь-якої класифікації або оцінювання інформації.

Інтерфейс автоматичних індексів дозволяє користувачеві задати деякий набір ключових слів, які з його точки зору є характерними для шуканих ним документів, і дозволяють, таким чином, знайти досить обмежену кількість потенційно належать до справи Web-сторінок. Як такі слова можуть бути використані деякі специфічні терміни та його комбінації, досить рідкісні прізвища тощо.

Успіх пошуку потрібної інформації значною мірою визначається саме вдалим вибором ключових слів, бо в іншому випадку пошукова система може видати багато тисяч і мільйонів посилань на Web-документи, що не відносяться до справи.

Слід мати на увазі, що початківця підстерігає багато різних несподіванок, що іноді доходять до анекдотичних ситуацій.

Якщо для автоматичних індексів пошук за ключовими словами є єдиним засобом знаходження необхідної інформації, то в тематичних каталогах (наприклад, Yahoo!) цей засіб є альтернативним способомпошуку поряд із подорожжю по системі (дереву) вкладених один в одного категорій.

Деяким різновидом пошукових служб є рейтингові служби. Вони надають клієнту готовий список деяких посилань, до яких зверталися найчастіше інші користувачі мережі Internet. Коли йдеться про теми, які мають суспільний інтерес, такі як новини, музика тощо, такі рекомендації, отримані статистичним методом, є дуже зручними та корисними. Такі послуги, зокрема, надає вітчизняна служба Rambler.

2. Прийоми пошуку

2.1. Простий пошук

Кожна пошукова система (ПС) надає свої методи пошуку та має свої особливості у правилах запису комбінацій ключових слів. Проте є спільні елементи однаково справедливі більшість пошукових систем. Зазвичай, всі ПС допускають пошук Web-документів за ключовими словами, які є характерними для шуканого документа. Вибір таких слів часто є нетривіальним завданням.

Як правило, вказівка ​​одного ключового слова є недостатньою, і тоді виникає питання про те, як задавати їх відповідні комбінації. Нехай, наприклад, ми хочемо отримати інформацію про російський лауреат нобелівської премії 2000 р. Жореса Алфьорова. Вказівка ​​у полі пошуку лише прізвища

призведе до виявлення величезної кількості документів, більшість з яких ніякого відношення до фізика, що цікавить нас, не має. Задаючи ж у полі пошуку два ключові слова

розділених символом пропуску, ми повинні мати на увазі, що різні пошукові системи реагують на цей символ по-різному. Більшість ПС розглядають пропуск як знак логічної операції "або" (OR) (до них відносяться Yahoo, AltaVista і т. д.). Тому пошук комбінації слів Zhorez Alferov не скоротить, а, навпаки, збільшить кількість документів, знайдених пошуковою системою: будуть знайдені всі документи, де зустрічається або слово Zhorez, або слово Alferov, або обидва ці слова разом.

У таких випадках для більш адекватного пошуку можна використовувати укладання ключових слів у лапки, які визначають точну комбінацію ув'язнених у них символів:

"Жорез Альферов".

Однак, при цьому не буде знайдено документів, до яких входить комбінація цих слів в іншому порядку (Alferov Zhorez), бо все укладене в лапки є єдиним словосполученням, і пошукова система шукає в документах абсолютно точне збіг усіх символів цього словосполучення.

Для того, щоб знайти лише ті Web-сторінки, на яких одночасно присутні усі наші ключові слова, перед кожним із них потрібно поставити знак плюс. Наприклад,

Zhorez +Alferov

приведе до знаходження Web-документів, де обов'язково присутній і слово Zhorez, і слово Alferov, причому не тільки в будь-якому порядку, а й на будь-якій відстані один від одного (в останньому випадку в знайденому документі між цими словами може не бути ніякого логічного зв'язку) .

Знак мінус перед словом виключає всі документи, що його містять, що в ряді випадків може бути дуже корисним. Наприклад, якщо нам потрібно знайти різні роботи з геометричної, але не хвильової оптики, можна задати таку комбінацію ключових слів

Світло+оптика-хвиля

Необхідно мати на увазі, що багато слів можуть мати однакову основу, але різні закінчення (наприклад, вказівка ​​множини в англійською, відмінкового закінчення в російській і т. д.). У зв'язку з цим багато пошукових систем, отримавши запит у вигляді послідовності ключових слів, виробляють його нормалізацію: відкидають із цього запиту всі слова, що складаються менш ніж з чотирьох символів (наприклад, англійський привід of), а також відкидають різні закінчення та суфікси.

Наприклад, щоб не пропустити документ, до якого входить фраза "В геометричній оптиці світловий промінь...", пошукова система може наведений вище запит звести (нормалізувати) до вигляду

Світло+оптик*-хвиль* (1)

Тут символом зірочка (*) позначені будь-які комбінації символів після кореня відповідних слів.

Оскільки не всі ПС проводять таку початкову обробку запиту клієнта, доцільно самим запитувати у формі (1), тобто використовувати символ "зірочка" для вказівки можливих варіацій закінчень ключових слів.

Необхідно мати на увазі деяку відмінність при використанні великих (великих) і малих (маленьких) букв у ключових словах. Зазвичай пошук за маленькими буквами враховує збіги і коли в тексті стоїть велика літера, і коли маленька. Написання ключових слів великими літерами означає пошук документів, що містять слово саме в такому вигляді.

Дуже корисним може бути пошук ключових слів тільки в заголовках Web-сторінок, оскільки важливість заголовка документа зазвичай більша за важливість його тексту. У різних ПС пошук ключових слів лише в заголовках Web-сторінок, задається за допомогою різних службових слів: AltaVista це слово title:, Yahoo! - t: в Rambler - $ title:, і т.д.

2.2. Розширений пошук

Прийоми простого пошуку не завжди дозволяють з достатньою ефективністю знайти необхідні нам Web-документи, у зв'язку з чим пошукові системи надають клієнту можливість використовувати засоби так званого розширеного (advanced) пошуку. Запити для розширеного пошуку будуються з ключових слів, пов'язаних знаками логічних операцій, і мають вигляд аналогічний до булевських виразів, що використовуються в мовах програмування.

При цьому крім стандартних логічних операцій OR ("або"), AND ("і") та NOT (заперечення) використовується (і є дуже ефективною!) операція NEAR, що визначає ступінь близькості один до одного ключових слів у Web-документі.

При виконанні складних запитів важливо розуміти, в якому порядку виконуються наведені вище операції, тобто їх пріоритет. У послідовності OR, AND, NOT, NEAR пріоритет операцій зростає зліва направо. Порядок виконання окремих елементів складного запиту можна змінити за допомогою круглих дужок, як це заведено під час запису булевських виразів у програмуванні.

На відміну від засобів простого пошуку, засоби розширеного пошуку значно більш стандартизовані для різних пошукових систем. Великою перевагою розширеного пошуку є також гнучкість пропонованих клієнту можливостей побудови запиту, а істотним недоліком – значно повільніша його робота порівняно з простим пошуком.

OR (операція "або") виконує ту ж саму функцію, що і знак пробілу в запитах простого пошуку більшості ПС. Наприклад, запит

призводить до пошуку документів, у яких є або слово bush, або слово modes, або обидва ці слова одночасно.

AND (операція "і") призводить до знаходження документів, в яких обов'язково зустрічаються обидва пов'язані цією операцією слова, але при цьому вони можуть перебувати на будь-якій відстані один від одного. В результаті може виявитися, що в документі немає будь-якого логічного зв'язку між двома заданими ключовими словами. Наприклад, у відповідь на запит

пошукова система AltaVista видає посилання як на відповідні наукові роботи з нелінійної динаміці, а й у окремі глави відомого фантастичного роману Р. Уельса " Боротьба світів " , які, зрозуміло, немає жодного стосунку до предмета пошуку.

NOT - операція заперечення, що дозволяє виключити ті Web-документи, які містять непотрібне словосполучення (таким чином, ця операція у складному пошуку грає ту саму роль, що й знак "мінус" у простому пошуку).

NEAR (логічна операція, що вказує на ступінь близькості один до одного ключових слів) є однією з найзручніших команд розширеного пошуку. У різних пошукових системах поняття близькості слів різне. Наприклад, AltaVista вважає близькими слова, які розділені лише десятьма іншими словами. Деякі інші ПС допускають при записі операції NEAR вказівку ступеня близькості у явному вигляді, тобто дозволяють визначити максимально допустиму кількість сторонніх слів, які можуть стояти між двома ключовими словами, пов'язаними з цією операцією.

Запит виду


призведе до пошуку документів, у яких два зазначені ключові слова стоять досить близько один до одного, і, отже, швидше за все пов'язані за змістом. Наприклад, у тексті Web-сторінки може бути фраза: "Bushes of normal modes..".

Жорес NEAR Алфьоров

приведе до пошуку документів, в яких є словосполучення Жорес Іванович Алфьоров, Алфьоров Жорес Іванович і т. д. Зауважимо, що при використанні операції NEAR порядок проходження ключових слів у документі вказати неможливо, що, втім, є скоріше не недоліком, а перевагою, і це добре видно з щойно наведеного запиту.

Як було зазначено, з допомогою вищеописаних логічних операцій можна запитувати пошук у вигляді складного логічного висловлювання.

Незважаючи на існування деяких загальних принципіворганізації пошуку Web-документів, різні ПС можуть дуже відрізнятися один від одного за можливостями, що надаються клієнту, зовнішньому виглядусвоїх великих сторінок тощо. буд., з чого знайомитися із нею бажано за безпосередньої роботи у мережі Internet.

Як приклад нижче наведено дуже короткий, схематичний опис двох найбільш популярних в даний час ПС Yahoo (тематичний каталог) та AltaVista (автоматичний індекс).

3. Тематичний каталог Yahoo

Дана система з'явилася в Мережі однією з перших, і сьогодні Yahoo співпрацює з багатьма виробниками коштів інформаційного пошуку, а на різних її серверах використовується різне програмне забезпечення. Виклик пошукової системи Yahoo можна здійснити за адресою http://www.yahoo.com.

Зауважимо, що броузери зазвичай допускають можливість повного набору адреси. Наприклад, для виклику Yahoo можна набрати в поле адреси тільки слово Yahoo, а решта адреси дописується броузером автоматично.

Головна сторінка Yahoo надає клієнту можливість звертатися до двох основних методів роботи з цією пошуковою системою - до пошуку Web-документів за ключовими словами, поле набору яких знаходиться зліва від кнопки "Search" ("Пошук"), та до пошуку за допомогою ієрархічного дерева різних розділів (категорій), що розташований нижче.

Зауважимо, що і в тому, і в іншому випадку пошук посилання на потрібний Web-документ відбувається в одній і тій же базі даних, але різними способами.

Відкривши цікавий розділ тематичного каталогу клацанням миші за назвою, побачимо нову сторінку Yahoo, яка має таку саму структуру, як і заголовна сторінка: вона містить поле пошуку за ключовими словами і список підрозділів обраного нами розділу, і т.д.

На головній сторінці Yahoo можна побачити також рекламні оголошення, різні додаткові категорії, наприклад новини, які містять, зокрема, інформацію про погоду і т.д.

Якщо загальна кількість знайдених Yahoo посилань досить велика, список цих посилань розбивається на порції. За замовчуванням така порція містить 20 посилань, але це число можна змінити, якщо звернутися до сторінки опцій пошуку, кнопка запуску якої знаходиться поруч із кнопкою пошуку "Search". Там же можна перевизначити роль пробілу між ключовими словами (чи вважати його логічною операцією OR або логічною операцією AND), і т.д.

На сторінці вибору опцій також є перемикач, який дозволяє включити або вимкнути режим пошуку цілих слів. У режимі Substrings Yahoo знайде всі посилання, в яких вказане нами слово стоїть не тільки саме по собі, а й є частиною інших слів, наприклад, пошук слова "art" (мистецтво) спрацює і на слові "department" (відділ, кафедра тощо) д.). За замовчуванням встановлено режим Substrings, щоб користувач не був змушений вводити кожне іменник в однині і в множині (тобто, із закінченням "-s"), і т. д. Навпаки, в режимі Complete Words знаходяться замовлені нами ключові слова тільки в тому випадку, якщо вони обмежені з обох боків пробілами або розділовими знаками.

Пошукова система Yahoo шукає посилання на документи, що відповідають запиту, у кількох різних базах даних, насамперед це назви категорій та заголовки Web-сайтів. Якщо такі посилання не були знайдені, Yahoo автоматично організує пошук в базі даних індивідуальних Web-сторінок. Клієнт може замовити пошук в одній із цих баз даних клацанням миші на кнопках, які розташовані нижче поля введення ключових слів. Результати пошуку ПС Yahoo упорядковує відповідно до кількох критеріїв, які визначають рейтинг цього посилання. Більш високий рейтинг присвоюється документам, у яких ключові слова зустрічаються більше разів, у яких вони входять у заголовок або якщо посилання відповідає більш старшому розділу в ієрархічному дереві категорій.

Наприкінці сторінки з результатами пошуку Yahoo пропонує скористатися послугами кількох інших пошукових систем, якщо клієнт не задоволений результатами цього пошуку. Такі посилання зручні тим, що система Yahoo, при зверненні до них, сама впише наші ключові слова в бланк запиту, викликаної таким чином іншої пошукової системи. Зауважимо на закінчення, що Yahoo надає близько мільйонів посилань на Web-сторінки і це трохи більше 0,1% всього Web-простору.

4. Автоматичний індекс Alta Vista

Виклик цієї пошукової системи можна здійснити за адресою: http://altavista.digital.com (для багатьох броузерів достатньо при цьому набрати лише слово altavista).

Alta Vista має одну з найбільших баз даних у класі автоматичних індексів, і найпотужніші та гнучкіші правила побудови запитів. При цьому Alta Vista має систему простого пошуку (simple search), так і систему розширеного пошуку (advanced search), кнопка якої знаходиться нижче поля введення ключових слів.

Передбачена можливість пошуку інформації та за допомогою каталогу категорій, влаштованому аналогічно каталогу системи Yahoo, причому пошук за ключовими словами можна здійснити лише в рамках певної категорії.

Пошук Web-документів за ключовими словами можна здійснювати у базі даних для WWW-сторінок чи базі даних телеконференцій (Usenet). Для вибору однієї з цих баз даних - вмісту WWW або Usenet - служить список, що випадає, який можна викликати за допомогою кнопки, що знаходиться під панеллю заголовка цієї системи, на її заголовній сторінці.

При використанні простого пошуку системи Alta Vista необхідно враховувати його відмінність від відповідного засобу ПС Yahoo. Справді, за умовчанням Alta Vista, на відміну Yahoo, шукає входження цілих слів: замовлений термін повинен стояти у Web-документі окремо, а чи не бути частиною інших ланцюжків символів. Якщо необхідно знайти всі входження даного ключового слова, навіть коли воно є частиною інших слів, необхідно використовувати символ * (цей символ може стояти тільки в кінці ключового слова і замінювати не більше п'яти літер). Наприклад, запит виду Ада* призведе до знаходження документів, у яких є слова “Ада”, ”Адам”, ”Адажіо” тощо.

Пошукова система Alta Vista, як і більшість інших пошукових систем, пропонує клієнту та ряд додаткових можливостей, зокрема, дозволяє знаходити лише ті Web-документи, в яких задані ключові слова зустрічаються тільки в гіпертекстових посиланнях, заголовках документів, в їх URL-адресах (що дозволяє знаходити всі Web-сторінки, розташовані на сервері з даною адресою) і т.д. д. Для цього в Alta Vista використовуються спеціальні команди: Anchor, title і т. д. Такі можливості можна використовувати як порізно, так і разом один з одним.

Бланк розширеного пошуку (advanced search) відрізняється від бланка простого запитунаявністю двох полів. Друге з них - Results Ranking Criteria - повністю аналогічне до поля введення бланка простого пошуку, і в ньому можна використовувати ті ж спеціальні вирази, лапки і знаки +, -, *. Однак тут це поле відіграє лише допоміжну роль, визначаючи порядок сортування одержаних результатів: документи, що містять ключові слова з поля Ranking, стоятимуть у списку першими.

Ключові слова для власне пошуку повинні вводитися в першому з полів - Selection Criteria. Запити в цьому полі будуються за описаними раніше правилами з використанням операцій NEAR, NOT, AND, OR. Крім того, внизу бланка пошуку знаходиться поле для введення дат, що дозволяють задати проміжок часу, в який були створені або змінені цікаві для нас документи.

Про особливості пошуку в Alta Vista документів російською мовою зауважимо, що шукати документи за російськими ключовими словами в каталозі Yahoo сенсу немає, оскільки співробітники цієї служби російською мовою не говорять.

5. Пошук інформації у конференціях (Usenet)

WWW-сторінки є найбільш масштабним і цінним, але не єдиним джерелом інформації в Internet. Великий інтерес представляє система телеконференцій Usenet, в якій щодня публікується понад 100 тисяч повідомлень з усього світу.

Якщо клієнт цікавиться певною темою, він може просто підписатися на відповідну групу телеконференцій. Однак якщо він хоче не обговорювати свою проблему з живими людьми, а просто з'ясувати, що відомо з того чи іншого питання, можна скористатися системами автоматичного пошукуу вмісті Usenet. Alta Vista веде окремий індекс більш ніж за 10 тисяч телеконференцій, для пошуку в якому потрібно лише перекинути перемикач пошуку зі значення "the Web" у значення "Usenet" (всі правила складання запиту та встановлення опцій в обох цих випадках однакові). Результати пошуку є відсортованим списком заголовків статей, повний текст будь-якої з яких можна отримати клацанням миші по її заголовку.

У всьому світі вважається самим найкращим сервісомдля пошуку інформації у конференціях Usenet сервер DejaNews (http://www.dejanews.com). Серед російськомовних виділяється сервер RusNews (http://news.corvis.ru), що є також сервером новин, що містить більше 2000 новинних груп. Також має місце аналогічний російський сервер ТІЛА-пошук (http://tela.dux.ru/news.html).

Цілком унікальним джерелом інформації є документи з відповідями на питання, що часто ставляться (Frequently Asked Questions, FAQs). Такий жанр запитань і відповідей чудово вводить абсолютно непідготовленого читача в саму суть справи. Якщо спочатку списки відповідей питання існували лише груп телеконференцій, то зараз документи із заголовком " FAQ " використовуються клієнтам найрізноманітніших серверів і служб. У цьому жанрі пишуться статті та огляди, а фірми та організації пропагують свої цілі та устремління. Якщо клієнту потрібно в стислий термін ознайомитися з новою галуззю науки, техніки, культури чи політики, радиться розпочати з читання розділу "FAQ" відповідної телеконференції Usenet. І хоча таким чином не можна набути занадто фундаментальних знань, зате можна швидко освоїтися з термінологією, дізнатися про найактуальніші проблеми і нерідко отримати майже вичерпний список літератури.

6. Вітчизняні пошукові служби

Російський сектор Internet в даний час бурхливо розвивається, і хоча вітчизняні пошукові системи ще відстають від відповідних зарубіжних систем за обсягом своїх каталогів та індексів, за деякими показниками (насамперед щодо застосування нових технологій при обробці результатів пошуку) вони не поступаються своїм закордонним аналогам, а в ряді випадків і перевершують їх.

Вкажемо, перш за все, на автоматичний індекс Aport 2000 та тематичний каталог @Rus (Атрус), що розташовані за адресами: http://www.aport.ru/ та http://www.atrus.ru/, відповідно. Ці дві системи перебувають у партнерських відносинах. Дійсно, коли в результаті проведеного пошуку Aport 2000 виводить адресу деякої Web-сторінки, вона може супроводжуватися коротким описом відповідного Web-вузла, взятим з @Russ. З іншого боку, при заповненні каталогу Атрус активно використовуються засоби пошукової системи Aport. З погляду клієнта, проте, ці пошукові системи є незалежними засобами отримання інформації. Зазначимо деякі їхні переваги. Aport 2000 використовує найефективнішу в даний час систему рейтингування за кількістю посилань, що ведуть до ресурсу (за індексом цитування). Пошукова система Атрус надає клієнту зручний каталог-портал "Мій @Rus", який користувач може налаштувати на швидке отримання найбільш потрібної інформації. Засоби налаштування цього каталогу дозволяють також відключити все зайве на основній сторінці пошукової системи, що робить роботу з ним особливо швидкою та зручною.

6.1. Rambler ( http://www.rambler.ru )

Пошукова система Rambler має один з найбільших індексів у Росії, але основну популярність вона набула в першу чергу як рейтингова система. Вона дозволяє швидко виявити коло Web-вузлів, що постачають інформацію на задану тему, та оцінити їхню популярність за кількістю відвідувань різними клієнтами Internet за останню добу. Хоча кількість відвідувань даного Web-вузла далеко не завжди свідчить про справжню цінність наявної на ньому інформації, у разі тим, що представляють суспільний інтерес, такому рейтингу популярності можна довіряти.

За замовчуванням знаходяться лише ті документи, в яких зустрілися всі задані нами ключові слова, тобто пропуск між словами сприймається як логічна операція AND. Однак це значення пробілу можна перевизначити таким чином, щоб він відповідав логічній операції OR (як це має місце за умовчанням Yahoo або Alta Vista). Для цього у бланку розширеного пошуку потрібно вибрати опцію "Слова запиту: будь-яке".

Щоб виключити документи, які містять ті чи інші слова, останні потрібно вказати на відповідному полі бланку розширеного пошуку.

6.2. Яндекс ( http :// www . yandex . ru )

Пошукова система Яndex виділяється своїми потужними засобами розширеного пошуку, а також цілим рядом технологічних досягнень, наприклад, наявністю інтелектуального механізму морфологічного розбору слів, що особливо важливо для російської мови. Незалежно від того, в якій формі написали ключове слово у запиті, Яndex враховуватиме всі його форми. Наприклад, якщо ключовим є слово йти, є посилання на Web-документи, що містять слова йти, йде, і навіть йшов. Однак існує можливість пошуку і за точною словоформою, для чого перед цією словоформою треба поставити знак оклику “!”.

Декілька набраних у запиті слів, розділених пробілами, означає, що всі вони повинні входити в одну пропозицію документа, що шукається (тобто пробіл працює як знак логічної операції AND).

Слід пам'ятати, що у ПС Яndex операцію AND можна вказати й у явної формі з допомогою символу “&” (але з допомогою слова AND !). Подвоєння цього знака, тобто використання символу “&&”, призводить до поширення дії операції AND на весь документ (тобто пов'язані з допомогою && слова повинні обов'язково бути присутніми в межах всього документа). Символом операції OR у аналізованій пошуковій системі служить знак “|” (але не саме слово OR).

У ПС Яndex можна регулювати відстань, де знаходяться один від одного задані ключові слова в Web-документі. Наприклад, запит

фізична/(-2 4) освіта

означає, що слово фізичне може бути як ліворуч від слова освіту (на відстані максимум двох слів від нього), так і праворуч (на відстані максимум чотирьох слів від нього).

Компанія CompTek, що створила ПС Яndex, безкоштовно надає для корпоративних клієнтів(Організацій) полегшену версію програми Яndex.Site, яка виконує індексацію вмісту Web-вузла. Це зручно власникам Web-вузлів, які хотіли б організувати локальну систему для пошуку інформації в межах свого власного вузла.

Пошукова система Яndex має дуже гарний опис у розділі “Допомога”, який рекомендується подивитися перед використанням цієї системи.

7. Пошук файлів

Серед спеціальних систем пошуку файлів в Інтернеті є аналоги вже розглянутих раніше тематичних каталогів (типу Yahoo) та автоматичних індексів (типу Alta Vista). Зрозуміло, ці пошукові системи надають клієнту не самі файли, лише списки посилань ними.

Однією з найпопулярніших пошукових служб на кшталт тематичних каталогів для пошуку файлів є shareware.com за адресою http://www.shareware.com. Ця система класифікує файли лише за однією ознакою: для якої операційної системивони призначені, але зберігає описи всіх файлів, складені людьми. Головна сторінка shareware.com влаштована аналогічно сторінкам вже розглянутих нами пошукових систем. Вона пропонує клієнту різні види пошуку, причому ключові слова можуть містити символ *, що відповідає послідовності будь-яких символів. Пошук здійснюється як в іменах, так і в описі файлів. Можна вказати нижній часовий поріг пошуку, щоб отримати посилання на файли, створені не раніше заданої дати, і вибрати спосіб сортування результатів за датою або за алфавітним порядком імен файлів. Клацнувши на імені файлу у списку результатів, отримаємо ряд посилань на вузли Internet, на яких зберігаються копії цього файлу із зазначенням надійності роботи цих серверів та часу, необхідного для завантаження файлу залежно від пропускну здатністьнашого каналу.

На відміну від каталогу shareware.com, пошукова система Archie є автоматичним індексом, аналогічним Alta Vista. Список анонімних вузлів Archie доводиться вести людям (його можна знайти за адресою http://hoohoo.ncsa.uiuc.edu/ftp/). Пошук у базі даних сервера Archie здійснюється за допомогою ключових слів, які в даному випадкує просто імена файлів або фрагменти імен.

Час очікування зв'язку з популярними FTP-вузлами (такими, наприклад, як багато зборів програм для Windows (ftp://ftp.winsite.com)) може виявитися дуже великим, внаслідок чого в Інтернеті зазвичай є їх точні копії або "дзеркальні відображення" (mirrors), а пошукові системи видають адреси всіх цих дзеркал.

Каталог, що містить загальнодоступні файли, майже завжди називається pub. У більшості архівів у кожному каталозі є спеціальний файл з короткими - зазвичай не довше одного рядка - описом кожного файлу цього каталогу. Такий файл може називатися 0index, 00index і т. п. (нулі приписуються до імені файлу, щоб він завжди потрапляв на перше місце в відсортованому за алфавітом списку файлів).

8. Джерела спеціалізованої інформації

Існують інформаційні компанії, які забезпечують інформаційне електронне обслуговування. Наприклад, Knight-Ridder (KR) – це найбільша у світі інформаційна компанія, що надає доступ до своїх служб в інтерактивному режимі. Тут об'єдналися такі всесвітньо відомі служби, як DialogInformationService із США та DataStar із Європи. Використовуючи Інтернет як середовище для розповсюдження своїх послуг, KR зуміла автоматизувати ключові моменти своєї діяльності, покращити обслуговування клієнтів та, найголовніше, розширити ринок своїх послуг. Все це зрештою призвело до того, що KR стала світовим лідером у сфері доставки електронних документівта інформаційного сервісу.

Має власну систему інформаційного пошуку в Інтернеті фірма IBM – InfoMarket. У ній поєднуються засоби отримання інформації та управління платежами з правами доступу.

Проте на стадії освоєння простору Інтернету не обійтися без самостійного пошуку інформації. Тут дуже корисними можуть виявитися адреси Web-вузлів, які добре зарекомендували себе джерела ділової інформації:

www.kentis.com - це сервер компанії KentInformationSystem, співробітники якої допомагають професіоналам у галузі бухгалтерії та фінансів використовувати комп'ютерні технології, особливо Інтернет;

http://www.promotion.aha.ru- on-line журнал з маркетингу в мережі Інтернет;

http://www.inter.net.ru- журнал «Інтернет», що регулярно публікує матеріал з маркетингу та реклами в мережі Інтернет;

http://clickz.com- журнал, повністю присвячений питанням Інтернет-маркетингу.

9. Пошук окремих людей у ​​мережі Internet

Найбільш просто знайти інформацію про людину, якщо у неї є в мережі Internet своя особиста сторінка (personal home pages), на якій зазвичай є її фотографія, e-mail та поштова адреса, телефон і т. д. Нерідко така сторінка містить коротку біографіюавтора, його хобі тощо. буд. Одна з найбільших системдля пошуку особистих сторінок називається Who'sWho та розташована за адресою http://web.city.ac.uk/citylive/pages.html.

Існують також великі каталоги електронних адрес різних людей, які користуються електронною поштою(e-mail). Лідерство тут, мабуть, належить каталогу Four11 за адресою http://www.four11.com.

Відзначимо також каталог WhoWhere (http://www.whowhere.com), який здійснює пошук навіть за схожістю звучання або написання прізвищ (наприклад, "Kirsanov", "Kirsanoff" тощо).

Вітчизняний каталог електронних адрес розташовується за адресою http://www.botik.ru/~intermap/form.html.

Цілком унікальним є всеамериканський адресний довідник за адресою http://www.databaseamerica.com, який видає координати будь-якого з 90 млн. жителів США та будь-якої з 10 млн. американських компаній.

10. Метапошук

Бази даних різних пошукових систем значною мірою не перетинаються. Тому для пошуку досить рідкісної інформації доцільно звертатися не до однієї, а до кількох ПС. Проте правила оформлення запитів для різних ПС, взагалі, відрізняються один від одного. Для того, щоб не звертатися по черзі до різних пошуковим системамі не думати про специфічні правила оформлення запиту для кожної з них були створені так звані метапошукові системи.

Прийнявши замовлення клієнта, задане за допомогою ключових слів у відповідність до своїх власних правил його оформлення, метапошукова система сама пропише його в бланках різних пошукових систем, розішле ці бланки і чекатиме на відповідь. Коли всі пошукові системи надішлють результати пошуку, метапошукова програма зведе їх в один документ і відправить користувачу. До таких метапошукових систем відноситься MetaCrawler розташований за адресою (http://metacrawler.cs.washington.edu:8080), який розсилає запит на 9 різних пошукових систем (до них входить: Yahoo, Alta Vista, Lycos, Excite і т. д.). На випадок різної інтерпретації тих самих за змістом опцій у різних пошукових системах MetaCrawler передбачає навіть можливість перевірки результатів пошуку: перш ніж дати посилання користувачеві, він самостійно подивиться на документ і перевірить, чи відповідає він умовам запиту - оскільки їх розуміє MetaCrawler. Зрозуміло, цей режим перевірки сильно затримує отримання результатів, проте дозволяє захиститися як від непрацездатних посилань, так і від безглуздих результатів. Зауважимо, що на бланку запиту MetaCrawler можна задати час очікування: до списку будуть включені лише ті результати, які встигнуть прийти з різних пошукових систем на цей момент.

11. Ефективний пошук інформації

Після детального вивчення основних можливостей інструментів звернемося до проблеми ефективності пошуку. Основними параметрами ефективності пошуку є:

Повнота пошуку як відношення числа знайдених документів до загальної кількості релевантних документів;

Точність пошуку – відношення числа релевантних документів до загальної кількості отриманих документів;

Актуальність посилань на документи - існування знайдених документів у мережі зараз;

Швидкість пошуку.

У Internet існують різні інструменти пошуку, які мають різні функціональними можливостями. Якість пошуку, таким чином, залежить в першу чергу від параметрів конкретної пошукової системи, наприклад, розмірів індексу, від способу пошуку (уточнення тем або пошук за запитом) і т.д. p align="justify"> Далі, працюючи з конкретною пошуковою системою, потрібно мати уявлення про методи складання запитів, знати необхідні оператори.

Таким чином, можна виділити такі фактори, що впливають на ефективність пошуку:

Властивості та можливості пошукової системи;

Якість формулювання запиту користувачем.

Тепер розглянемо, як краще підготуватися до складання запиту. Насамперед необхідно провести всебічний лексичний аналіз інформації, яку необхідно знайти. Потім бажано скласти набір ключових слів (при необхідності, кількома мовами) у вигляді окремих термінів та словосполучень, специфічних для вашої предметної області.

Дії:

вибір пошукового інструменту;

Точне формулювання запитів з використанням операторів, що підтримуються цим пошуковим інструментом;

Надсилання тестових запитів;

Аналіз результатів пошуку (за кількістю та релевантністю посилань);

При необхідності коригування запиту;

Повторний пошук;

З вищевикладеного, можна назвати такі прийоми ефективного пошуку:

Пошук інформації загального характеру в пошукових системах-каталогах. - Пошук вузькоспеціальної інформації в пошукових машинах. Для більш широкого пошуку явно недостатньо використовувати лише системи-каталоги з обмеженою кількістю описаних ресурсів. Крім того, вузькоспеціальна інформація в каталогах може бути просто відсутній. Тому необхідно проводити пошук подібної інформації в пошукових машинах, що мають індекси великого обсягу.

Використання операторів або бланка розширеного запиту для звуження області пошуку. Для проведення якісного пошуку необхідно ознайомитись із мовою запитів конкретної пошукової машини. Ефективним та простим способомВирішення проблеми складання якісного запиту є використання режиму розширеного пошуку.

Використання функції пошуку серед знайдених ресурсів. Більшість пошукових систем підтримує можливість пошуку всередині отриманих результатів.

Використання метапошукових систем. Дані інструменти пошуку відправляють ваш запит одразу кільком пошуковим системам і від кожної системи отримують кілька найрелевантніших посилань.

Пошук відповідей на запитання у групах новин. За бажанням можна звернутися з конкретним питанням допомоги у спеціалізовану групу новин.

Передплата спеціалізованих списків розсилки і т.д.

Висновок

Насамкінець, можна сказати, що єдиної оптимальної технології пошуку в Інтернет не існує. Залежно від специфіки необхідної інформації для її пошуку повинні використовуватися відповідні пошукові служби. Необхідно пам'ятати, що чим грамотніше підібрані пошукові служби та складено запит на пошук інформації, тим якіснішими будуть результати пошуку.

Література

1. Інформатика та інформаційні технології/ За ред. Романової Ю.Д. М: Ексмо, 2008

2. Степанов О.М. Інформатики. СПб.: Пітер, 2002

3. Майєчак Б. Пошук інформації в мережі // Інтернет для дітей від 8 до 88. М.: Інтерексперт, 2002

4. Чечин Г. М., Положєнцев Є. В., Нижнікова С. В. Пошук інформації в мережі Internet. Ростов-на-Дону: РГУ, 2001

5. Диканський Є.Ю. Освоюємо Internet: Практичний курс з інформаційних та комунікаційних технологій для користувачів-початківців. М: Ілекса, 2001

6. http://www.dist-cons.ru/modules/searchinf/index.html

7. http://www.seonews.ru/masterclasses/detail/29812.php

8. http://www.gdenet.ru/bibl/technology/transmission/5.1.html

 

 

Це цікаво: