2 перерахувати види пошуку інформації. Технології пошуку інформації в мережі інтернет

2 перерахувати види пошуку інформації. Технології пошуку інформації в мережі інтернет

Урок 73. Технологія пошуку інформації у мережі Інтернет Цілі: освоїти основні засади організації пошукової діяльності у глобальній мережі; мати уявлення про можливості пошуку з використанням браузера та вбудованих можливостей пошукових систем.Хід уроку I. Організаційний момент ІІ. Які можливості пошуку інформації пропонує мережа Інтернет? (Є кілька можливостей пошуку інформації в мережі: створенням запиту в одній з пошукових машин; за допомогою каталогів і класифікаторів на одному з сайтів потрібної тематики; використовуючи засоби метапошуку.) - Перерахуйте назви російськомовних порталів, що надають засоби пошуку? (Найпопулярнішим сайтом є Yandex, окрім цього користується популярністю і Rambler.) - У чому різниця наявних пошукових систем? (Різні пошукові системи припускають різні підходидля пошуку інформації. Одні дозволяють знаходити інформацію за ключовими словами в тексті, інші пропонують систематизовані дані та пошук потрібних даних по запропонованих інструкціях і т.д.) - Назвіть критерії ефективності пошукових машин. (Ефективність пошукових машин визначається наступними характеристиками: обсяг індексу; період оновлення; подання документа при індексуванні; глибина індексування та обмеження на кількість сторінок одного домену; особливості організації введення запиту; ранжування документів; виведення додаткової інформації; обмеження; області дії пошукових роботів.) ІІІ. Теоретичний матеріал уроку Організувати пошук можна по-різному, і одна з проблем - це зниження рівня так званого інформаційного шуму. Необхідно відзначити, що пошук та відбір інформації в електронних засобах не відноситься до рядових умінь людини. Цьому треба спеціально навчати, допомогти не тільки учневі, а й вчителю, в першу чергу тим, для кого ці навички ще в новинку, технологіям пошуку, вмінням сформувати запит. Тут потрібно володіти основами математичної логіки, розуміти, що чим точніше сформульований запит - тим вище релевантність, тобто відповідність відповіді запиту і нижче рівень інформаційного шуму, на відсіювання якого можна витратити кілька днів роботи в Інтернеті. Для того, щоб знайти потрібний документ у безмежному океані інформації в мережі Інтернет, можна скористатися спеціалізованими сервісними службами, які дозволяють за ключовими словами знайти той чи інший документ. Їх називають пошуковими системами. Пошукова машина цих систем регулярно переглядає інформацію в мережі, пересуваючись за наявними посиланнями. У випадку, якщо будь-яка сторінка не має зовнішніх зв'язків за допомогою гіперпосилань, то пошуковик таку сторінку виявити не може. Крім пошукових систем є метапошукові системи. Вони не мають свої пошукові машини, а користуються можливостями інших пошукових систем. Результатом пошуку у разі роботи з метапошуковою системою є безліч документів, відображених на сторінках використовуваних пошукових систем. Пошукові системи представлені для користувачів у вигляді веб-сторінок зі зручною навігацією. Достатньо bi860™ адресу системи та потрібна сторінка буде надана вашим послугам. Інша можливість, вбудована в браузер, представлена ​​на Панелі інструментів у вигляді кнопки «ПОШУК», яка дає можливість не тільки внесення слова для пошуку через готову форму, але і дозволяє вибрати найбільш популярні пошукові служби. Щоб релевантність документа була висока, необхідно для всіх цих пошукових систем використовувати такі нюанси: 1. Тег keywords не повинен бути довшим за БДО символів; 2. До 40 слів (найкраще фраз – наприклад: пошукова система). Не більше 5 повторів. 3. Наголос на 2-3 ключові фрази. 4. Вони повинні бути в тегах keywords з маленької літери, в тегу description з великою, і в title (заголовку про> великий). Приклад: <иЧ1е>Пошукові системи: порівняльні характеристики <ЛШе> <1ит1>Визначення пошукових систем, основні характеристики пошукових системТепер релевантність щодо пошуковому запиту«Пошукова система» буде дуже висока, цей документ буде знаходитись iB top Ю» поки його не змістять новіші сайти з такими ж ключовими словами- Так> тільки не забудьте, що і в тілі сторінки повинні в різних місцях повторюватися ці слова. IV. Виконання практичного завдання 1. Увійти в документ, що стоїть першим у списку результатів пошуку за ключовим словом «Пошукова система» і визначити, скільки разів у тілі програми зустрічається слово пошукова система. 2. Підберіть ключові слова для пошуку інформації на тему "Можливості мережних технологій". Визначте релевантність знайдених документів. V. Підбиття підсумків уроку

Урок 74. Типи пошукових серверів та їх особливості

Цілі: мати уявлення про пошукові сервери та їх відмінні характеристики; навчитися користуватися пошуковими системами задоволення власних інформаційних потреб.

Хід уроку

I. Організаційний момент ІІ. Актуалізація знань - Які можливості надає пошукова система мережі Інтернет? (Пошукова система має потужні можливості: пошукову машину і базу даних. Пошукова машина сканує мережу і зберігає образи документів у своїй базі. Якщо документ був видалений або переміщений його можна переглянути в режимі збереженого документа.) - Що відображає релевантність запиту? (Релевантність - це характеристика, яка відображає відповідність знайдених документів запиту.) Щ. Теоретичний матеріал уроку Відсутність в мережі Інтернет чіткої централізованої структури вплинула на те, що її розвиток в цілому має хаотичний характер. З'являються все нові й нові сервери, де зберігаються величезні масиви інформації. Здійснювати пошук інформації за допомогою введення тільки готової адреси в адресний рядок неможливо. Тому питання пошуку інформації стають дуже актуальними, і з роками проблема буде тільки збільшуватися. Для здійснення пошуку в мережі використовуються пошукові системи, основне призначення яких - полегшення користувача процесу пошуку інформації, причому не тільки на серверах WWW, але і FTP, Usenet та інших ресурсах Інтернет. У всесвітньому павутинні Інтернет знаходиться кілька тисяч пошукових систем, серед яких є як ті, що вже добре зарекомендували себе, так і менш відомі. З найвідоміших пошукових машин можна назвати серед зарубіжних: AltaVista, Google, HotBot, InfoSeek, Lycos, WebCrawler, Yahoo та ін; серед російських: Rambler, АПОРТ, Яndех та ін У кожної пошукової системи є як достоїнства, так і недоліки. Критеріями вибору пошукової системи можуть бути такі характеристики як: принцип роботи пошукової машини; зручність використання; зовнішнє оформлення; складність мови запитів; наявністю різних розширених функцій (управління форматом і ранжуванням інформації, що виводиться, перекладом введених ключових слівіншою мовою і т.д.); швидкістю роботи; рівнем завантаженості в конкретні моменти часу і надійністю та ін. Вибір пошукової системи для конкретного застосування визначайся метою пошуку, характером шуканої інформації, бажаним форматом виведених даних і шириною охоплення відстежуваних адрес серверів в мережі Інтернет. Найбільш популярними пошуковими серверамина російськомовній території (у порядку зменшення кількості результатів пошуку) є Яndeх, Rambler, Google, АПОРТ, Yahoo і т.д. Існує 2 основних типи пошукових систем Інтернет: індексні та класифікаційні (каталогові). Індексні пошукові системи (наприклад, AltaVista, Google, HotPot, АПОРТ, Яndех та ін.), працюючи в автоматичному режимі оновлення своєї інформації, переглядають в мережі Інтернет вміст серверів, індексують всю інформацію, що міститься в них, і вносять інформацію про розташування слів на сторінках сайтів до своїх баз даних. Каталогові системи пошуку (наприклад, Rambler, Yahoo! та ін) містять тематично структурований каталог серверів, і найчастіше поповнюються вручну. Зазвичай на WWW-сторінці класифікаційної пошукової системи міститься і поле для введення ключових слів для ло-позову у власній базі даних. У каталоговій системі пошуку можна, почавши з більшої тематичної рубрики, поступово спускаючись далі по рубриках, прийти до посилання на потрібний сервер. В одних випадках буває зручніше скористатися першим типом пошукових систем, в інших - другим. Є пошукові системи, що поєднують у собі обидва принципи роботи. Зокрема більшість індексних пошукових систем мають і каталогову систему пошуку. Також пошукові машини можуть використовувати і деякі інші принципи методів пошуку. Багато пошукових систем перетворилися в Інтернет-портали, що поєднують у собі велику кількість ресурсів і сервісів. На сторінках таких порталів можна прочитати новини, програму телепередач, дізнатися про погоду, курси валют та багато іншого. Для пошуку інформації на російськомовних сайтах рекомендується користуватися російськими пошуковими системами, зважаючи на наявність російськомовного інтерфейсу, можливості пошуку за російськими словами, урахування особливостей (морфології) російської мови, близькості розташування серверів і т.д. Для пошуку одночасно в декількох пошукових системах можна скористатися так званими пошуковими метамашинами, які не мають своїх пошукових систем, а використовують можливості інших пошукових систем. Як відомо, пошукових систем в Інтернеті багато, і знайти потрібну інформацію вкрай непросто. Відсутність єдиного стандартуна специфікацію завдання пошуку в Мережі призводить до того, що на кожному вузлі пропонується власний спосіброзв'язання поставленого завдання. В результаті користувач, який не має необхідних навичок у створенні синтаксичних конструкцій запитів до пошукової системи, або не повністю використовує можливості кожного порталу, або, вивчивши функції конкретного вузла, постійно звертається лише до одного. Метапошукова система має й іншу перевагу, таке як використання єдиної мови запитів, в деяких системах навіть закладена можливість перекладу ключових слів на інші мови. Такі позовні системи, отримуючи результати запитів від інших пошукових систем, фільтрують отримані матеріали, прибирають дублюючі посилання, і сортують їх за релевантністю. Для пошуку зарубіжних ресурсів можна користуватися і російськими пошуковими метамашинами, що звертаються до інших пошукових засобів (у тому числі зарубіжних), тому що має в більшості випадків доступ до швидкісного каналу за кордон і т. д. Існують також пошукові системи, що спеціалізуються на пошуку з конкретної тематики (наприклад, за інформаційними технологіями, з музики, за ресурсами, присвяченими природі і т. д.). А найпростіший спосіб пошуку - це введення в адресний рядок назви фірми, оскільки всі великі форми в назві адреси використовують власне ім'я. Як підсумкові слова можемо сказати, що для отримання якісного результату пошуку, необхідно використовувати можливості різних пошукових систем. Регулярне використання лише однієї системи може погано позначитися на результатах пошуку. IV. Виконання практичного завдання Оцінити можливості трьох пошукових систем за певним запитом, за будь-якими критеріями, вибраними на свій смак. V. Підбиття підсумків уроку

Урок 75. Основні поняття та характеристики результатів пошуку

Цілі уроку:

знати основні характеристики результатів пошуку;

мати уявлення про способи збільшення релевантності результатів пошуку.

Хід уроку

I. Організаційний момент ІІ. Актуалізація знань – Назвіть характеристики пошукових систем. (При виборі пошукових систем необхідно звертати увагу на: принцип роботи пошукової машини, зручність використання, зовнішнє оформлення, складність мови запитів, наявність різних розширених функцій (управління форматом і ранжуванням виведеної інформації, перекладом ключових слів, що вводяться, на іншу мову) і т.д.), швидкість роботи, рівень завантаженості в конкретні моменти часу і надійність тощо) - Назвіть типи пошукових машин. (Розрізняють два типи пошукових машин: індексні та класифікаційні. У першому випадку, пошуковик автоматично переглядає вміст мережі та індексують всю інформацію. У другому - структурований каталог формується практично вручну.) - Які можливості надає метапошукова система? (Метапошукова система надає можливість використання єдиної мови запитів для кількох пошукових систем.) III. Теоретичний матеріал уроку Сукупність відомостей та даних, необхідних користувачеві Наразічасу називають інформаційною потребою. Якщо людина здатна розуміти чужу мову, виходячи з контексту, то технічні системиволіють працювати з формалізованими даними. Виникає необхідність представлення інформаційної потреби у вигляді набору певних понять, які повинні виступити як ключові поняття. При складанні даного набору значення мають як слова, а й відносини з-поміж них. Цю сукупність прийнято називати запитом. Після введення запиту пошукова система здійснює вибірку документів, з подальшим формуванням результату за певними критеріями, які внесені до параметрів пошуку. Сукупність документів, яка відповідає запиту (видача, відгук), характеризується властивістю релевантності, т. Е. Показником рівня відповідності відгуку запиту. Розрізняють смислову та формальну релевантність, коли відповідність розглядається або щодо інформаційної потреби споживача, або щодо запиту. Під час сканування сторінок пошукова машина визначає: кількість слів; частоту входження запиту до тексту; ключові слова; текст, розташований на початку; заголовок сторінки; тему сторінки Пошукова система може визначати лише формальну релевантність документа, коли наявність чи відсутність ключових слів у документі в заданому а) відношенні є основним параметром пошуку. Іншими важливими характеристикамирезультату пошуку є повна та точність. Повнота відбиває ставлення релевантних відгуків до кількості всіх можливих документів, які відповідають інформаційну потребу споживача. Точність виражає ставлення сукупно ста релевантних відгуків до кількості всіх виданих документів. Особливості здійснення пошуку інформації обумовлені особливостями самої мережі. Мережевий інформаційний простір є гнучкою, динамічною системою, що постійно змінює. Пошуковики, які проводять аналіз даних у заданому просторі (наприклад, в російськомовному Інтернеті), формують власну базу, де відображають вміст всіх документів. Причому пошукова машина на будь-який сайт може вийти лише у випадку, якщо якісь інші сайти мають посилання на цю сторінку. За відсутності перехресних посилань машина не в змозі виявити наявний в мережі документ Будь-яка пошукова система включає спеціальну базу даних, в якій зберігається опис документів на певний момент часу. Виходить, що пошук фактично здійснюється не у всій мережі, а наявній базі даних. Цікаві результати пошуку за одним запитом, але з використанням різних пошукових служб. Кожна служба дає власний набір даних. Що виявляє негативні тенденції, які необхідно враховувати під час здійснення пошуку. Це: база даних пошукової системи може містити не всі документи, що є в мережі; збережені документи можуть бути відсутніми в мережі. Пошук можна організувати по-різному. Наївніше простим способомє складання запиту як простого набору слів. Наприклад, педагогічна система технологія. Пошукова машина видасть адреси документів, де містяться три слова; але не набридати, що у всіх документах будуть зустрічатися всі три слова, тобто можу бути запропоновані сторінки, де зустрічаються слова або «педагогічна система», або «технологія», або просто «педагогічна». Тобто автор може бути більший, до тисячі сторінок більше. До золотих правил пошуку інформації в мережі можна віднести такі вимоги: 1. Враховувати особливості природної мови 2. Не допускати орфографічних помилок. 3. Уникати пошуку за одним словом, використовувати необхідний та достатній набір слів. 4. Не писати великими літерами. 5. Виключати з пошуку непотрібні слова. 6. Використовувати можливості розширеного пошуку. Два фактори впливають на результати пошуку, такі як: облік можливостей природної мови та використання засобів, що надаються пошуковими системами. До особливостей природної мови можна віднести: полісемію (смислове різноманіття слова або поєднання слів); Омонімію (різних за змістом, але слів, що однаково пишуться; 1 крок Виділити ключове слово для пошуку 2 крок Визначити найбільш вдале словосполучення з ключовим словом 3 крок Вибрати пошукову систему 4 крок Підключитися до мережі 5 крок Запустити головну сторінку порталу з пошуковою системою 6 крок Внести словосполучення у пошуковий рядок- 7 крок Проаналізувати рівень відповідності сторінок поставленій задачі 8 крок Відкрити посилання на задані сторінки 9 крок Збережіть сторінки для детального знайомства в робочій папці. V. Виконання практичного завдання 1. Створити папку «Результати пошуку» у власної папки, л ^ч л гтпянітт г к-яким ПОЛЬ- 2. Визначити за допомогою журналу адреси ь кордонів, ^ ки ^я. кухарі даного комп'ютерапрацювали за останній час» менті 3. Перерахувати п'ять останніх адрес у текстовому Д У «Блокнот»; 4. Виконати пошук документів із ключовим словом «Пошукова система». Визначити кількість знайдених документів - Завантажити перший документ. Опишіть відповідність знайденого документа вашим запитам. Урок 76. Поняття мови запитівЦілі: освоїти методи оптимального пошуку інформації в Інтернеті; мати уявлення про можливості пошуку з використанням мови запитів. Хід уроку I. Організаційний момент І. Актуалізація знань /Панель По- - Для чого призначена панель Пошук, pdK сс выиыиь \ им позов включає можливість пошуку datHHblx з исполъ,„„М1ЛУ „п„_ особистих пошукових систем вбудованих е браузеР по,квведеному в рядок пошуку. За замовчуванням браузер рс вбудованої метапошукової сторінки фірми Microsoft адресна - Для чого призначений адресний рядок браузера браузер дозволяє вийти на сайт по а^Ре у форматі URL або IP-адресу. - Які засоби пошуку надають сервісні w у ™ ,т.п*™м (Можна скористатися пошуковими м1аштами> структурованими каталогами та системами метапошуку-) Перерахуйте англомовні та російськомовні пошукові системи? Серед англомовних пошукових систем можна відзначити: Google, Yahoo, AltaVista, Lycos та ін. Найбільш популярними російськомовними системами є: Яndex, Rambler, Апорт та ін) - Якими властивостями повинен мати запит для обліку інформаційних потреб користувача? Основними властивостями результатів пошуку є релевантність, точність і повнота. Вони характеризують рівень відповідності відгуку на запит, відношення сукупності релевантних відгуків до кількості всіх виданих документів та відношення релевантних відгуків до кількості всіх можливих документів. ІІІ. Теоретичний матеріал уроку До засобів пошукових систем відноситься мова запитів, вона різна для різних системале має певні характерні особливості. Розглянемо мову запитів однієї з популярних системЯndeх. Характер і особливістю цієї пошукової машини є облік морфології мови, тобто пошук здійснюється за всіма формами слова або слів у запиті. Наприклад, якщо задано слово "лити", то в результаті пошуку будуть запропоновані документи зі словами "ллєт". Варто зазначити, що не всі пошукові системи мають таку «здатність». Синтаксис мови запитів

Синтаксис Значення приклад
Заборона перебору всіх словоформ педагогічна система (з пошуку будуть виключені слова педагогічні системи)
- Обов'язкова присутність слів у знайдених документах Педрада по +п'ятницях (мають бути обрані сторінки, де зустрічається слово не тільки пед-рада, а й обов'язкові умови наявності слова «п'ятниця»)
(Пишеться слино з іскрчає-мьцсло- Виняток слова з результату пошуку Методична система -технологія (будуть виключені документи, де разом зустрічаються всі три слова)
Обов'язкове входження слів в одну пропозицію Педагогічна система
Пошук будь-якого із заданих слів Методика технологія | методичний прийом
Вимога присутності першого слова у реченні без другого Педагогічна - система (результати пошуку не включатимуть документи, де в межах пропозиції зустрічаються обидва слова)
&<~~ Пошук у межах документа Педагогічна - система (результати пошуку не включатимуть сторінки, де в документі зустрічаються обидва слова)
Пошук стійких словосполучень «педагогічна система» (враховується строга послідовність слів, слово «педагогічна система» буде виключено)
Показник відстані між словами в реченні Тема /1 уроку (числа після значка вказує на якій відстані має знаходитися друге слово в реченні. Пропозиції «тема сьогоднішнього уроку» будуть виключені з пошуку)
Синтаксис мови Значення приклад
/(nm) Обмеження за відстанню, де п -мінімальна, а т -максимальна відстань Методика /(-4 3) технологія (слово «технологія» має перебувати в інтервалах від 4 слів зліва і до 3 слів праворуч)
0 Пошук виразів (методика, технологія) / +1 (навчання, вивчення) (результатами пошуку будуть документи, що включають вирази «методика навчання», «методика вивчення», «технологія навчання», «технологія вивчення»)
$title Пошук інформації щодо назв заголовків $title педагогічна система (результатом будуть документи, де як заголовок використовуються ці слова)
$anchor Пошук інформації щодо назви посилань $anchor педагогічна система (якщо в документах як гіперпосилання використовується даний набір)
$Address Пошук інформації щодо назв адрес $Address edu (буде запропоновано документи, де адреси сайтів включають слово «edu»)
~#UBL="url Виключення з пошуку певних сторінок, заданих URL Інформатика~#URL="wwwлnfoгmika.гu" (пошук буде здійснено скрізь, крім заданого сайту)
Wink="URL Пошук сайтів, де є посилання на заданий сайт #link=" " (результатом пошуку будуть сайти, де є посилання на задану адресу URL)
#image= «назва файлу» Пошук документом за іменами графічних файлів #image= «comp*» (запит дасть посилання на документи із зображеннями комп'ютерів)
# Abstract = «анотація» Пошук сайтів, де задана сукупність зустрічається в meta тегах #abstract=«KOMnbK>Tep» (будуть визначені сайти, де зустрічається задане слово при використанні meta тег)
#keywords= «ключове слово» Пошук сайтів, де задане слово виділено як ключове поняття #keywords=«KOMnbK>Tep» (будуть визначені сайти, де слово виділено будь-яким чином)
#Ип1=«підпис графічного файлу» Пошук підпису зображення, яке з'являється при підведенні мишки до активної частини екрану #hint=«computen> (будуть задані сайти, де зустрічаються не просто зображення комп'ютера, а мають заданий підпис)

Федеральне агентство з освіти

Смоленський державний університет

Технології пошуку інформації в Інтернеті.

Смоленськ


Вступ…………………………………………………………………………..

1.Класифікація пошукових систем …………………………………………...

2.Прийоми пошуку………………………………………………………………....

2.1.Простой поиск………………………………………………………………..

2.2.Розширений пошук………………………………………………………….

3.Тематичний каталог Yahoo.…………………………………………………

4.Автоматичний індекс Alta Vista……………………………………………

5.Пошук інформації в конференціях (Usenet)………………………………..

6. Вітчизняні пошукові служби …………………………………………..

6.1.Rambler……………………………………………………………………….

7.Пошук файлів …………………………………………………………………..

8.Джерела спеціалізованої інформації ………………………………

9.Пошук окремих людей у ​​мережі Internet ……………………………………...

10.Метапошук……………………………………………………………………..

11.Ефективний пошукінформації…………………………………………...

Заключение……………………………………………………………………….

Література………………………………………………………………………..

Вступ

Будь-хто, хто намагався колись знайти потрібну інформацію в Інтернеті, напевно погодиться з тим, що цей процес схожий на пошук голки в копиці сіна. Світова мережа Internet містить великий обсяг інформації, який швидко збільшується з кожним днем. Внаслідок цього часто виявляється, що завдання знаходження необхідної інформації в цьому інформаційному океані є надзвичайно складним і потрібно вміти ефективно використовувати різні пошукові системи (програми пошуку інформації в мережі). Необхідно врахувати, що "пошук – це мистецтво".

1. Класифікація пошукових систем

Існує багато різних пошукових систем, що належать різним компаніям. Насамперед, виділяють так звані тематичні каталоги (наприклад, Yahoo) та автоматичні індекси (наприклад, AltaVista), хоча необхідно мати на увазі, що ціла низка пошукових систем займає деяке проміжне положення між цими двома "полюсами", тобто вони містять елементи обох цих класів. Кожна з пошукових систем має свою велику базу даних про адреси (місце розташування) різних Web-документів, і пошук посилань на необхідну нам інформацію відбувається не в самих Web-документах, а саме в цій базі даних.

Тематичні каталоги та автоматичні індекси розрізняються, перш за все, по тому, як формуються та поповнюються їх бази даних: чи беруть у цьому процесі участь люди, чи все відбувається абсолютно автоматично.

Бази даних тематичних каталогів складаються та систематично поповнюються експертами у відповідних областях на підставі нових Web-документів, виявлених в Internet спеціальними пошуковими програмами. Тематичний каталог представляє користувачу Internet деяку деревоподібну структуру категорій (розділів та підрозділів), на верхньому рівні якої зібрані найзагальніші поняття, такі як Наука, Мистецтво, Бізнес тощо, а елементи найнижчого рівня є посилання на окремі Web-сторінки та сервери разом з коротким описомїхнього вмісту. Цим ієрархічним каталогом можна подорожувати, починаючи з більш загальних категорій (понять) до вужчих, спеціалізованих.

Наприклад, для знаходження інформації про стан наукових досліджень з теорії суперструн можна спуститися вниз наступною "сходами" понять:

Science (Наука)

Physics (Фізика)

Theoretical Physics (Теоретична фізика)

Theories (Теорії)

String Theories (Теоріструн)


В результаті буде одержано список сайтів, серед яких найбільший інтерес представляє сайт Superstrings. Клацнувши мишею на гіперпосиланні Superstrings, ми потрапляємо на home page сайту, з відповідним заголовком, на якому можна знайти on-line підручник з теорії суперструн, різні посилання для подальшого читання, глосарій з суперструн і т.д.

Головною перевагою тематичних каталогів є велика цінність інформації, що отримується користувачем, що забезпечується присутністю "людського фактора" в процесі аналізу та сортування нових Web-сторінок. З іншого боку, тематичні каталоги мають суттєвий недолік, пов'язаний знову ж таки з людським фактором, бо через обмежені можливості людини їх бази даних охоплюють лише невелику частину всього інформаційного Web-простору (менше 1 %). Таким чином, незважаючи на всю корисність тематичних каталогів, використання лише пошукових систем цього виду часто виявляється недостатнім.

Зведена таблиця вибраних предметних каталогів

List.Ru Апорт Яндекс Rambler Yahoo! About
Загальна характеристика 19 розділів верхнього рівня 14 розділів верхнього рівня 10 основних розділів, 7 комбінованих, додаткова класифікація 56 розділів 14 основних розділів 36 розділів
Сортування ресурсів усередині розділу Алфавіт, оцінка гідів, популярність (відвідуваність), дата Алфавіт, відвідуваність, ліга, оцінка кількості посилань на даний ресурс, думка користувачів Алфавіт, дата додавання, індекс цитування за відвідуваністю за алфавітом за оплаченістю посилань
Булівські оператори Використовується мова пошукової машини Апорт Використовується мова пошукової машини Яndex Використовується мова пошукової машини Rambler Ні Ні
Пошук за фразою " " " "
Префікси +, - +, -
Ітеративний пошук (у результатах) Є пошук усередині категорії Після входу натисніть More…
заміна частини слова * * (Не завжди коректно)

На відміну від тематичних каталогів, бази даних для автоматичних індексів створюються і поповнюються повністю автоматично деякими спеціальними, внутрішніми пошуковими програмами-роботами, які в цілодобовому режимі переглядають Internet-вузли (сайти) у пошуках новостворених Web-документів. З кожного такого документа робот витягує всі посилання, що містяться в ньому, і додає їх у свою базу адрес, в результаті чого у програми-робота виникає можливість перегляду ще деякої кількості нових для нього Web-документів. У кожному новому Web-документі робот аналізує всі слова, що входять до нього, і в розділі бази даних, що відповідає кожному даному слову, запам'ятовується адреса (URL) документа, де це слово зустрілося. Таким чином, база даних, створювана автоматичним індексом, фактично зберігає відомості про те, у яких Web-документах містяться ті чи інші слова. На відміну від тематичних каталогів автоматичні індекси охоплюють до 25 % загального Web-простору.

Автоматичний індекс має окрему пошукову систему для забезпечення інтерфейсу користувача. Ця система може, переглядаючи базу даних, за заданим набором ключових слів знаходити і видавати на екран комп'ютера користувача адреси і коротку інформацію про всі Web-сторінки, які містять даний набір ключових слів. Таким чином, автоматичний індекс складається з трьох частин: програми-робота, що збирається цим роботом бази даних та інтерфейсу для пошуку в цій базі даних. Саме з останньою складовою і працює користувач. В силу такої організації автоматичний індекс не робить будь-якої класифікації або оцінювання інформації.

Інтерфейс автоматичних індексів дозволяє користувачеві задати деякий набір ключових слів, які з його точки зору є характерними для шуканих ним документів, і дозволяють, таким чином, знайти досить обмежену кількість потенційно належать до справи Web-сторінок. Як такі слова можуть бути використані деякі специфічні терміни та його комбінації, досить рідкісні прізвища тощо.

Успіх пошуку потрібної інформації значною мірою визначається саме вдалим вибором ключових слів, бо в іншому випадку пошукова система може видати багато тисяч і мільйонів посилань на Web-документи, що не відносяться до справи.

Слід мати на увазі, що початківця підстерігає багато різних несподіванок, що іноді доходять до анекдотичних ситуацій.

Якщо для автоматичних індексів пошук за ключовими словами є єдиним засобом знаходження необхідної інформації, то в тематичних каталогах (наприклад, Yahoo!) цей засіб є альтернативним способомпошуку поряд із подорожжю по системі (дереву) вкладених один в одного категорій.

Деяким різновидом пошукових служб є рейтингові служби. Вони надають клієнту готовий список деяких посилань, до яких зверталися найчастіше інші користувачі мережі Internet. Коли йдеться про теми, які мають суспільний інтерес, такі як новини, музика тощо, такі рекомендації, отримані статистичним методом, є дуже зручними та корисними. Такі послуги, зокрема, надає вітчизняна служба Rambler.

2. Прийоми пошуку

2.1. Простий пошук

Кожна пошукова система (ПС) надає свої методи пошуку та має свої особливості у правилах запису комбінацій ключових слів. Проте є спільні елементи однаково справедливі більшість пошукових систем. Зазвичай, всі ПС допускають пошук Web-документів за ключовими словами, які є характерними для шуканого документа. Вибір таких слів часто є нетривіальним завданням.

Як правило, вказівка ​​одного ключового слова є недостатньою, і тоді виникає питання про те, як задавати їх відповідні комбінації. Нехай, наприклад, ми хочемо отримати інформацію про російський лауреат нобелівської премії 2000 р. Жореса Алфьорова. Вказівка ​​у полі пошуку лише прізвища

призведе до виявлення величезної кількості документів, більшість з яких ніякого відношення до фізика, що цікавить нас, не має. Задаючи ж у полі пошуку два ключові слова

розділених символом пропуску, ми повинні мати на увазі, що різні пошукові системи реагують на цей символ по-різному. Більшість ПС розглядають пропуск як знак логічної операції "або" (OR) (до них відносяться Yahoo, AltaVista і т. д.). Тому пошук комбінації слів Zhorez Alferov не скоротить, а, навпаки, збільшить кількість документів, знайдених пошуковою системою: будуть знайдені всі документи, де зустрічається або слово Zhorez, або слово Alferov, або обидва ці слова разом.

У таких випадках для більш адекватного пошуку можна використовувати укладання ключових слів у лапки, які визначають точну комбінацію ув'язнених у них символів:

"Жорез Альферов".

Однак, при цьому не буде знайдено документів, до яких входить комбінація цих слів в іншому порядку (Alferov Zhorez), бо все укладене в лапки є єдиним словосполученням, і пошукова система шукає в документах абсолютно точне збіг усіх символів цього словосполучення.

Для того, щоб знайти лише ті Web-сторінки, на яких одночасно присутні усі наші ключові слова, перед кожним із них потрібно поставити знак плюс. Наприклад,

Zhorez +Alferov

приведе до знаходження Web-документів, де обов'язково присутній і слово Zhorez, і слово Alferov, причому не тільки в будь-якому порядку, а й на будь-якій відстані один від одного (в останньому випадку в знайденому документі між цими словами може не бути ніякого логічного зв'язку) .

Знак мінус перед словом виключає всі документи, що його містять, що в ряді випадків може бути дуже корисним. Наприклад, якщо нам потрібно знайти різні роботи з геометричної, але не хвильової оптики, можна задати таку комбінацію ключових слів

Світло+оптика-хвиля

Необхідно мати на увазі, що багато слів можуть мати однакову основу, але різні закінчення (наприклад, вказівка ​​множини в англійською, відмінкового закінчення в російській і т. д.). У зв'язку з цим багато пошукових систем, отримавши запит у вигляді послідовності ключових слів, виробляють його нормалізацію: відкидають із цього запиту всі слова, що складаються менш ніж з чотирьох символів (наприклад, англійський привід of), а також відкидають різні закінчення та суфікси.

Наприклад, щоб не пропустити документ, до якого входить фраза "В геометричній оптиці світловий промінь...", пошукова система може наведений вище запит звести (нормалізувати) до вигляду

Світло+оптик*-хвиль* (1)

Тут символом зірочка (*) позначені будь-які комбінації символів після кореня відповідних слів.

Оскільки не всі ПС проводять таку початкову обробку запиту клієнта, доцільно самим запитувати у формі (1), тобто використовувати символ "зірочка" для вказівки можливих варіацій закінчень ключових слів.

Необхідно мати на увазі деяку відмінність при використанні великих (великих) і малих (маленьких) букв у ключових словах. Зазвичай пошук за маленькими буквами враховує збіги і коли в тексті стоїть велика літера, і коли маленька. Написання ключових слів великими літерами означає пошук документів, що містять слово саме в такому вигляді.

Дуже корисним може бути пошук ключових слів тільки в заголовках Web-сторінок, оскільки важливість заголовка документа зазвичай більша за важливість його тексту. У різних ПС пошук ключових слів лише в заголовках Web-сторінок, задається за допомогою різних службових слів: AltaVista це слово title:, Yahoo! - t: в Rambler - $ title:, і т.д.

2.2. Розширений пошук

Прийоми простого пошукуне завжди дозволяють з достатньою ефективністю знайти необхідні нам Web-документи, у зв'язку з чим пошукові системи надають клієнту можливість використовувати засоби так званого розширеного (advanced) пошуку. Запити для розширеного пошуку будуються з ключових слів, пов'язаних знаками логічних операцій, і мають вигляд аналогічний до булевських виразів, що використовуються в мовах програмування.

При цьому крім стандартних логічних операцій OR ("або"), AND ("і") та NOT (заперечення) використовується (і є дуже ефективною!) операція NEAR, що визначає ступінь близькості один до одного ключових слів у Web-документі.

При виконанні складних запитів важливо розуміти, в якому порядку виконуються наведені вище операції, тобто їх пріоритет. У послідовності OR, AND, NOT, NEAR пріоритет операцій зростає зліва направо. Порядок виконання окремих елементів складного запиту можна змінити за допомогою круглих дужок, як це заведено під час запису булевських виразів у програмуванні.

На відміну від засобів простого пошуку, засоби розширеного пошуку значно більш стандартизовані для різних пошукових систем. Великою перевагою розширеного пошуку є також гнучкість пропонованих клієнту можливостей побудови запиту, а істотним недоліком – значно повільніша його робота порівняно з простим пошуком.

OR (операція "або") виконує ту ж саму функцію, що і знак пробілу в запитах простого пошуку більшості ПС. Наприклад, запит

призводить до пошуку документів, у яких є або слово bush, або слово modes, або обидва ці слова одночасно.

AND (операція "і") призводить до знаходження документів, в яких обов'язково зустрічаються обидва пов'язані цією операцією слова, але при цьому вони можуть перебувати на будь-якій відстані один від одного. В результаті може виявитися, що в документі немає будь-якого логічного зв'язку між двома заданими ключовими словами. Наприклад, у відповідь на запит

пошукова система AltaVista видає посилання як на відповідні наукові роботи з нелінійної динаміці, а й у окремі глави відомого фантастичного роману Р. Уельса " Боротьба світів " , які, зрозуміло, немає жодного стосунку до предмета пошуку.

NOT - операція заперечення, що дозволяє виключити ті Web-документи, які містять непотрібне словосполучення (таким чином, ця операція у складному пошуку грає ту саму роль, що й знак "мінус" у простому пошуку).

NEAR (логічна операція, що вказує на ступінь близькості один до одного ключових слів) є однією з найзручніших команд розширеного пошуку. У різних пошукових системах поняття близькості слів різне. Наприклад, AltaVista вважає близькими слова, які розділені лише десятьма іншими словами. Деякі інші ПС допускають при записі операції NEAR вказівку ступеня близькості у явному вигляді, тобто дозволяють визначити максимально допустиму кількість сторонніх слів, які можуть стояти між двома ключовими словами, пов'язаними з цією операцією.

Запит виду


призведе до пошуку документів, у яких два зазначені ключові слова стоять досить близько один до одного, і, отже, швидше за все пов'язані за змістом. Наприклад, у тексті Web-сторінки може бути фраза: "Bushes of normal modes..".

Жорес NEAR Алфьоров

приведе до пошуку документів, в яких є словосполучення Жорес Іванович Алфьоров, Алфьоров Жорес Іванович і т. д. Зауважимо, що при використанні операції NEAR порядок проходження ключових слів у документі вказати неможливо, що, втім, є скоріше не недоліком, а перевагою, і це добре видно з щойно наведеного запиту.

Як було зазначено, з допомогою вищеописаних логічних операцій можна запитувати пошук у вигляді складного логічного висловлювання.

Незважаючи на існування деяких загальних принципіворганізації пошуку Web-документів, різні ПС можуть дуже відрізнятися один від одного за можливостями, що надаються клієнту, зовнішньому виглядусвоїх великих сторінок тощо. буд., з чого знайомитися із нею бажано за безпосередньої роботи у мережі Internet.

Як приклад нижче наведено дуже короткий, схематичний опис двох найбільш популярних в даний час ПС Yahoo (тематичний каталог) та AltaVista (автоматичний індекс).

3. Тематичний каталог Yahoo

Дана система з'явилася в Мережі однією з перших, і сьогодні Yahoo співпрацює з багатьма виробниками коштів інформаційного пошуку, а на різних її серверах використовується різне програмне забезпечення. Виклик пошуковий системи Yahooможна здійснити за допомогою http://www.yahoo.com.

Зауважимо, що броузери зазвичай допускають можливість повного набору адреси. Наприклад, для виклику Yahoo можна набрати в поле адреси тільки слово Yahoo, а решта адреси дописується броузером автоматично.

Головна сторінка Yahoo надає клієнту можливість звертатися до двох основних методів роботи з цією пошуковою системою - до пошуку Web-документів за ключовими словами, поле набору яких знаходиться зліва від кнопки "Search" ("Пошук"), та до пошуку за допомогою ієрархічного дерева різних розділів (категорій), що розташований нижче.

Зауважимо, що і в тому, і в іншому випадку пошук посилання на потрібний Web-документ відбувається в одній і тій же базі даних, але різними способами.

Відкривши цікавий розділ тематичного каталогу клацанням миші за назвою, побачимо нову сторінку Yahoo, яка має таку саму структуру, як і заголовна сторінка: вона містить поле пошуку за ключовими словами і список підрозділів обраного нами розділу, і т.д.

На головній сторінці Yahoo можна побачити також рекламні оголошення, різні додаткові категорії, наприклад новини, які містять, зокрема, інформацію про погоду і т.д.

Якщо загальна кількість знайдених Yahoo посилань досить велика, список цих посилань розбивається на порції. За замовчуванням така порція містить 20 посилань, але це число можна змінити, якщо звернутися до сторінки опцій пошуку, кнопка запуску якої знаходиться поруч із кнопкою пошуку "Search". Там же можна перевизначити роль пробілу між ключовими словами (чи вважати його логічною операцією OR або логічною операцією AND), і т.д.

На сторінці вибору опцій також є перемикач, який дозволяє включити або вимкнути режим пошуку цілих слів. У режимі Substrings Yahoo знайде всі посилання, в яких вказане нами слово стоїть не тільки саме по собі, а й є частиною інших слів, наприклад, пошук слова "art" (мистецтво) спрацює і на слові "department" (відділ, кафедра тощо) д.). За замовчуванням встановлено режим Substrings, щоб користувач не був змушений вводити кожне іменник в однині і в множині (тобто, із закінченням "-s"), і т. д. Навпаки, в режимі Complete Words знаходяться замовлені нами ключові слова тільки в тому випадку, якщо вони обмежені з обох боків пробілами або розділовими знаками.

Пошукова система Yahoo шукає посилання на документи, що відповідають запиту, у кількох різних базах даних, насамперед це назви категорій та заголовки Web-сайтів. Якщо такі посилання не були знайдені, Yahoo автоматично організує пошук в базі даних індивідуальних Web-сторінок. Клієнт може замовити пошук в одній із цих баз даних клацанням миші на кнопках, які розташовані нижче поля введення ключових слів. Результати пошуку ПС Yahoo упорядковує відповідно до кількох критеріїв, які визначають рейтинг цього посилання. Більш високий рейтинг присвоюється документам, у яких ключові слова зустрічаються більше разів, у яких вони входять у заголовок або якщо посилання відповідає більш старшому розділу в ієрархічному дереві категорій.

Наприкінці сторінки з результатами пошуку Yahoo пропонує скористатися послугами кількох інших пошукових систем, якщо клієнт не задоволений результатами цього пошуку. Такі посилання зручні тим, що система Yahoo, при зверненні до них, сама впише наші ключові слова в бланк запиту, викликаної таким чином іншої пошукової системи. Зауважимо на закінчення, що Yahoo надає близько мільйонів посилань на Web-сторінки і це трохи більше 0,1% всього Web-простору.

4. Автоматичний індекс Alta Vista

Виклик цієї пошукової системи можна здійснити за адресою: http://altavista.digital.com (для багатьох броузерів достатньо при цьому набрати лише слово altavista).

Alta Vista має одну з найбільших баз даних у класі автоматичних індексів, і найпотужніші та гнучкіші правила побудови запитів. При цьому Alta Vista має систему простого пошуку (simple search), так і систему розширеного пошуку (advanced search), кнопка якої знаходиться нижче поля введення ключових слів.

Передбачена можливість пошуку інформації та за допомогою каталогу категорій, влаштованому аналогічно каталогу системи Yahoo, причому пошук за ключовими словами можна здійснити лише в рамках певної категорії.

Пошук Web-документів за ключовими словами можна здійснювати у базі даних для WWW-сторінок чи базі даних телеконференцій (Usenet). Для вибору однієї з цих баз даних - вмісту WWW або Usenet - служить список, що випадає, який можна викликати за допомогою кнопки, що знаходиться під панеллю заголовка цієї системи, на її заголовній сторінці.

При використанні простого пошуку системи Alta Vista необхідно враховувати його відмінність від відповідного засобу ПС Yahoo. Справді, за умовчанням Alta Vista, на відміну Yahoo, шукає входження цілих слів: замовлений термін повинен стояти у Web-документі окремо, а чи не бути частиною інших ланцюжків символів. Якщо необхідно знайти всі входження даного ключового слова, навіть коли воно є частиною інших слів, необхідно використовувати символ * (цей символ може стояти тільки в кінці ключового слова і замінювати не більше п'яти літер). Наприклад, запит виду Ада* призведе до знаходження документів, у яких є слова “Ада”, ”Адам”, ”Адажіо” тощо.

Пошукова система Alta Vista, як і більшість інших пошукових систем, пропонує клієнту та ряд додаткових можливостей, зокрема, дозволяє знаходити лише ті Web-документи, в яких задані ключові слова зустрічаються тільки в гіпертекстових посиланнях, заголовках документів, в їх URL-адресах (що дозволяє знаходити всі Web-сторінки, розташовані на сервері з даною адресою) і т.д. д. Для цього в Alta Vista використовуються спеціальні команди: Anchor, title і т. д. Такі можливості можна використовувати як порізно, так і разом один з одним.

Бланк розширеного пошуку (advanced search) відрізняється від бланка простого запитунаявністю двох полів. Друге з них - Results Ranking Criteria - повністю аналогічне до поля введення бланка простого пошуку, і в ньому можна використовувати ті ж спеціальні вирази, лапки і знаки +, -, *. Однак тут це поле відіграє лише допоміжну роль, визначаючи порядок сортування одержаних результатів: документи, що містять ключові слова з поля Ranking, стоятимуть у списку першими.

Ключові слова для власне пошуку повинні вводитися в першому з полів - Selection Criteria. Запити в цьому полі будуються за описаними раніше правилами з використанням операцій NEAR, NOT, AND, OR. Крім того, внизу бланка пошуку знаходиться поле для введення дат, що дозволяють задати проміжок часу, в який були створені або змінені цікаві для нас документи.

Про особливості пошуку в Alta Vista документів російською мовою зауважимо, що шукати документи за російськими ключовими словами в каталозі Yahoo сенсу немає, оскільки співробітники цієї служби російською мовою не говорять.

5. Пошук інформації у конференціях (Usenet)

WWW-сторінки є найбільш масштабним і цінним, але не єдиним джерелом інформації в Internet. Великий інтерес представляє система телеконференцій Usenet, в якій щодня публікується понад 100 тисяч повідомлень з усього світу.

Якщо клієнт цікавиться певною темою, він може просто підписатися на відповідну групу телеконференцій. Однак якщо він хоче не обговорювати свою проблему з живими людьми, а просто з'ясувати, що відомо з того чи іншого питання, можна скористатися системами автоматичного пошукуу вмісті Usenet. Alta Vista веде окремий індекс більш ніж за 10 тисяч телеконференцій, для пошуку в якому потрібно лише перекинути перемикач пошуку зі значення "the Web" у значення "Usenet" (всі правила складання запиту та встановлення опцій в обох цих випадках однакові). Результати пошуку є відсортованим списком заголовків статей, повний текст будь-якої з яких можна отримати клацанням миші по її заголовку.

У всьому світі вважається самим найкращим сервісомдля пошуку інформації у конференціях Usenet сервер DejaNews (http://www.dejanews.com). Серед російськомовних виділяється сервер RusNews (http://news.corvis.ru), що є також сервером новин, що містить більше 2000 новинних груп. Також має місце аналогічний російський сервер ТІЛА-пошук (http://tela.dux.ru/news.html).

Цілком унікальним джерелом інформації є документи з відповідями на питання, що часто ставляться (Frequently Asked Questions, FAQs). Такий жанр запитань і відповідей чудово вводить абсолютно непідготовленого читача в саму суть справи. Якщо спочатку списки відповідей питання існували лише груп телеконференцій, то зараз документи із заголовком " FAQ " використовуються клієнтам найрізноманітніших серверів і служб. У цьому жанрі пишуться статті та огляди, а фірми та організації пропагують свої цілі та устремління. Якщо клієнту потрібно в стислий термін ознайомитися з новою галуззю науки, техніки, культури чи політики, радиться розпочати з читання розділу "FAQ" відповідної телеконференції Usenet. І хоча таким чином не можна набути занадто фундаментальних знань, зате можна швидко освоїтися з термінологією, дізнатися про найактуальніші проблеми і нерідко отримати майже вичерпний список літератури.

6. Вітчизняні пошукові служби

Російський сектор Internet в даний час бурхливо розвивається, і хоча вітчизняні пошукові системи ще відстають від відповідних зарубіжних систем за обсягом своїх каталогів та індексів, за деякими показниками (насамперед щодо застосування нових технологій при обробці результатів пошуку) вони не поступаються своїм закордонним аналогам, а в ряді випадків і перевершують їх.

Вкажемо, перш за все, на автоматичний індекс Aport 2000 та тематичний каталог @Rus (Атрус), що розташовані за адресами: http://www.aport.ru/ та http://www.atrus.ru/, відповідно. Ці дві системи перебувають у партнерських відносинах. Дійсно, коли в результаті проведеного пошуку Aport 2000 виводить адресу деякої Web-сторінки, вона може супроводжуватися коротким описом відповідного Web-вузла, взятим з @Russ. З іншого боку, при заповненні каталогу Атрус активно використовуються засоби пошукової системи Aport. З погляду клієнта, проте, ці пошукові системи є незалежними засобами отримання інформації. Зазначимо деякі їхні переваги. Aport 2000 використовує найефективнішу в даний час систему рейтингування за кількістю посилань, що ведуть до ресурсу (за індексом цитування). Пошукова система Атрус надає клієнту зручний каталог-портал "Мій @Rus", який користувач може налаштувати на швидке отримання найбільш потрібної інформації. Засоби налаштування цього каталогу дозволяють також відключити все зайве на основній сторінці пошукової системи, що робить роботу з ним особливо швидкою та зручною.

6.1. Rambler ( http://www.rambler.ru )

Пошукова система Rambler має один з найбільших індексів у Росії, але основну популярність вона набула в першу чергу як рейтингова система. Вона дозволяє швидко виявити коло Web-вузлів, що постачають інформацію на задану тему, та оцінити їхню популярність за кількістю відвідувань різними клієнтами Internet за останню добу. Хоча кількість відвідувань даного Web-вузла далеко не завжди свідчить про справжню цінність наявної на ньому інформації, у разі тим, що представляють суспільний інтерес, такому рейтингу популярності можна довіряти.

За замовчуванням знаходяться лише ті документи, в яких зустрілися всі задані нами ключові слова, тобто пропуск між словами сприймається як логічна операція AND. Однак це значення пробілу можна перевизначити таким чином, щоб він відповідав логічній операції OR (як це має місце за умовчанням Yahoo або Alta Vista). Для цього у бланку розширеного пошуку потрібно вибрати опцію "Слова запиту: будь-яке".

Щоб виключити документи, які містять ті чи інші слова, останні потрібно вказати на відповідному полі бланку розширеного пошуку.

6.2. Яндекс ( http :// www . yandex . ru )

Пошукова система Яndex виділяється своїми потужними засобами розширеного пошуку, а також цілим рядом технологічних досягнень, наприклад, наявністю інтелектуального механізму морфологічного розбору слів, що особливо важливо для російської мови. Незалежно від того, в якій формі написали ключове слово у запиті, Яndex враховуватиме всі його форми. Наприклад, якщо ключовим є слово йти, є посилання на Web-документи, що містять слова йти, йде, і навіть йшов. Однак існує можливість пошуку і за точною словоформою, для чого перед цією словоформою треба поставити знак оклику “!”.

Декілька набраних у запиті слів, розділених пробілами, означає, що всі вони повинні входити в одну пропозицію документа, що шукається (тобто пробіл працює як знак логічної операції AND).

Слід пам'ятати, що у ПС Яndex операцію AND можна вказати й у явної формі з допомогою символу “&” (але з допомогою слова AND !). Подвоєння цього знака, тобто використання символу “&&”, призводить до поширення дії операції AND на весь документ (тобто пов'язані з допомогою && слова повинні обов'язково бути присутніми в межах всього документа). Символом операції OR у аналізованій пошуковій системі служить знак “|” (але не саме слово OR).

У ПС Яndex можна регулювати відстань, де знаходяться один від одного задані ключові слова в Web-документі. Наприклад, запит

фізична/(-2 4) освіта

означає, що слово фізичне може бути як ліворуч від слова освіту (на відстані максимум двох слів від нього), так і праворуч (на відстані максимум чотирьох слів від нього).

Компанія CompTek, що створила ПС Яndex, безкоштовно надає для корпоративних клієнтів(Організацій) полегшену версію програми Яndex.Site, яка виконує індексацію вмісту Web-вузла. Це зручно власникам Web-вузлів, які хотіли б організувати локальну систему для пошуку інформації в межах свого власного вузла.

Пошукова система Яndex має дуже гарний опис у розділі “Допомога”, який рекомендується подивитися перед використанням цієї системи.

7. Пошук файлів

Серед спеціальних систем пошуку файлів в Інтернеті є аналоги вже розглянутих раніше тематичних каталогів (типу Yahoo) та автоматичних індексів (типу Alta Vista). Зрозуміло, ці пошукові системи надають клієнту не самі файли, лише списки посилань ними.

Однією з найпопулярніших пошукових служб на кшталт тематичних каталогів для пошуку файлів є shareware.com за адресою http://www.shareware.com. Ця система класифікує файли лише за однією ознакою: для якої операційної системивони призначені, але зберігає описи всіх файлів, складені людьми. Головна сторінка shareware.com влаштована аналогічно сторінкам вже розглянутих нами пошукових систем. Вона пропонує клієнту різні види пошуку, причому ключові слова можуть містити символ *, що відповідає послідовності будь-яких символів. Пошук здійснюється як в іменах, так і в описі файлів. Можна вказати нижній часовий поріг пошуку, щоб отримати посилання на файли, створені не раніше заданої дати, і вибрати спосіб сортування результатів за датою або за алфавітним порядком імен файлів. Клацнувши на імені файлу у списку результатів, отримаємо ряд посилань на вузли Internet, на яких зберігаються копії цього файлу із зазначенням надійності роботи цих серверів та часу, необхідного для завантаження файлу залежно від пропускну здатністьнашого каналу.

На відміну від каталогу shareware.com, пошукова система Archie є автоматичним індексом, аналогічним Alta Vista. Список анонімних вузлів Archie доводиться вести людям (його можна знайти за адресою http://hoohoo.ncsa.uiuc.edu/ftp/). Пошук у базі даних сервера Archie здійснюється за допомогою ключових слів, які в даному випадкує просто імена файлів або фрагменти імен.

Час очікування зв'язку з популярними FTP-вузлами (такими, наприклад, як багато зборів програм для Windows (ftp://ftp.winsite.com)) може виявитися дуже великим, внаслідок чого в Інтернеті зазвичай є їх точні копії або "дзеркальні відображення" (mirrors), а пошукові системи видають адреси всіх цих дзеркал.

Каталог, що містить загальнодоступні файли, майже завжди називається pub. У більшості архівів у кожному каталозі є спеціальний файл з короткими - зазвичай не довше одного рядка - описом кожного файлу цього каталогу. Такий файл може називатися 0index, 00index і т. п. (нулі приписуються до імені файлу, щоб він завжди потрапляв на перше місце в відсортованому за алфавітом списку файлів).

8. Джерела спеціалізованої інформації

Існують інформаційні компанії, які забезпечують інформаційне електронне обслуговування. Наприклад, Knight-Ridder (KR) – це найбільша у світі інформаційна компанія, що надає доступ до своїх служб в інтерактивному режимі. Тут об'єдналися такі всесвітньо відомі служби, як DialogInformationService із США та DataStar із Європи. Використовуючи Інтернет як середовище для розповсюдження своїх послуг, KR зуміла автоматизувати ключові моменти своєї діяльності, покращити обслуговування клієнтів та, найголовніше, розширити ринок своїх послуг. Все це зрештою призвело до того, що KR стала світовим лідером у сфері доставки електронних документівта інформаційного сервісу.

Має власну систему інформаційного пошуку в Інтернеті фірма IBM – InfoMarket. У ній поєднуються засоби отримання інформації та управління платежами з правами доступу.

Проте на стадії освоєння простору Інтернету не обійтися без самостійного пошуку інформації. Тут дуже корисними можуть виявитися адреси Web-вузлів, які добре зарекомендували себе джерела ділової інформації:

www.kentis.com - це сервер компанії KentInformationSystem, співробітники якої допомагають професіоналам у галузі бухгалтерії та фінансів використовувати комп'ютерні технології, особливо Інтернет;

http://www.promotion.aha.ru- on-line журнал з маркетингу в мережі Інтернет;

http://www.inter.net.ru- журнал «Інтернет», що регулярно публікує матеріал з маркетингу та реклами в мережі Інтернет;

http://clickz.com- журнал, повністю присвячений питанням Інтернет-маркетингу.

9. Пошук окремих людей у ​​мережі Internet

Найбільш просто знайти інформацію про людину, якщо у неї є в мережі Internet своя особиста сторінка (personal home pages), на якій зазвичай є її фотографія, e-mail та поштова адреса, телефон і т. д. Нерідко така сторінка містить коротку біографіюавтора, його хобі тощо. буд. Одна з найбільших системдля пошуку особистих сторінок називається Who'sWho та розташована за адресою http://web.city.ac.uk/citylive/pages.html.

Існують також великі каталоги електронних адрес різних людей, які користуються електронною поштою(e-mail). Лідерство тут, мабуть, належить каталогу Four11 за адресою http://www.four11.com.

Відзначимо також каталог WhoWhere (http://www.whowhere.com), який здійснює пошук навіть за схожістю звучання або написання прізвищ (наприклад, "Kirsanov", "Kirsanoff" тощо).

Вітчизняний каталог електронних адрес розташовується за адресою http://www.botik.ru/~intermap/form.html.

Цілком унікальним є всеамериканський адресний довідник за адресою http://www.databaseamerica.com, який видає координати будь-якого з 90 млн. жителів США та будь-якої з 10 млн. американських компаній.

10. Метапошук

Бази даних різних пошукових систем значною мірою не перетинаються. Тому для пошуку досить рідкісної інформації доцільно звертатися не до однієї, а до кількох ПС. Проте правила оформлення запитів для різних ПС, взагалі, відрізняються один від одного. Для того, щоб не звертатися по черзі до різних пошукових систем та не думати про специфічні правила оформлення запиту для кожної з них, було створено так звані метапошукові системи.

Прийнявши замовлення клієнта, задане за допомогою ключових слів у відповідність до своїх власних правил його оформлення, метапошукова система сама пропише його в бланках різних пошукових систем, розішле ці бланки і чекатиме на відповідь. Коли всі пошукові системи надішлють результати пошуку, метапошукова програма зведе їх в один документ і відправить користувачу. До таких метапошукових систем відноситься MetaCrawler розташований за адресою (http://metacrawler.cs.washington.edu:8080), який розсилає запит на 9 різних пошукових систем (до них входить: Yahoo, Alta Vista, Lycos, Excite і т. д.). На випадок різної інтерпретації тих самих за змістом опцій у різних пошукових системах MetaCrawler передбачає навіть можливість перевірки результатів пошуку: перш ніж дати посилання користувачеві, він самостійно подивиться на документ і перевірить, чи відповідає він умовам запиту - оскільки їх розуміє MetaCrawler. Зрозуміло, цей режим перевірки сильно затримує отримання результатів, проте дозволяє захиститися як від непрацездатних посилань, так і від безглуздих результатів. Зауважимо, що на бланку запиту MetaCrawler можна задати час очікування: до списку будуть включені лише ті результати, які встигнуть прийти з різних пошукових систем на цей момент.

11. Ефективний пошук інформації

Після детального вивчення основних можливостей інструментів звернемося до проблеми ефективності пошуку. Основними параметрами ефективності пошуку є:

Повнота пошуку як відношення числа знайдених документів до загальної кількості релевантних документів;

Точність пошуку – відношення числа релевантних документів до загальної кількості отриманих документів;

Актуальність посилань на документи - існування знайдених документів у мережі зараз;

Швидкість пошуку.

У Internet існують різні інструменти пошуку, які мають різні функціональними можливостями. Якість пошуку, таким чином, залежить в першу чергу від параметрів конкретної пошукової системи, наприклад, розмірів індексу, від способу пошуку (уточнення тем або пошук за запитом) і т.д. p align="justify"> Далі, працюючи з конкретною пошуковою системою, потрібно мати уявлення про методи складання запитів, знати необхідні оператори.

Таким чином, можна виділити такі фактори, що впливають на ефективність пошуку:

Властивості та можливості пошукової системи;

Якість формулювання запиту користувачем.

Тепер розглянемо, як краще підготуватися до складання запиту. Насамперед необхідно провести всебічний лексичний аналіз інформації, яку необхідно знайти. Потім бажано скласти набір ключових слів (при необхідності, кількома мовами) у вигляді окремих термінів та словосполучень, специфічних для вашої предметної області.

Дії:

вибір пошукового інструменту;

Точне формулювання запитів з використанням операторів, що підтримуються цим пошуковим інструментом;

Надсилання тестових запитів;

Аналіз результатів пошуку (за кількістю та релевантністю посилань);

При необхідності коригування запиту;

Повторний пошук;

З вищевикладеного, можна назвати такі прийоми ефективного пошуку:

Пошук інформації загального характеру в пошукових системах-каталогах. - Пошук вузькоспеціальної інформації в пошукових машинах. Для більш широкого пошуку явно недостатньо використовувати лише системи-каталоги з обмеженою кількістю описаних ресурсів. Крім того, вузькоспеціальна інформація в каталогах може бути просто відсутній. Тому необхідно проводити пошук подібної інформації в пошукових машинах, що мають індекси великого обсягу.

Використання операторів або бланка розширеного запиту для звуження області пошуку. Для проведення якісного пошуку необхідно ознайомитись із мовою запитів конкретної пошукової машини. Ефективним та простим способом вирішення проблеми складання якісного запиту є використання режиму розширеного пошуку.

Використання функції пошуку серед знайдених ресурсів. Більшість пошукових систем підтримує можливість пошуку всередині отриманих результатів.

Використання метапошукових систем. Дані інструменти пошуку відправляють ваш запит одразу кільком пошуковим системам і від кожної системи отримують кілька найрелевантніших посилань.

Пошук відповідей на запитання у групах новин. За бажанням можна звернутися з конкретним питанням допомоги у спеціалізовану групу новин.

Передплата спеціалізованих списків розсилки і т.д.

Висновок

Насамкінець, можна сказати, що єдиної оптимальної технології пошуку в Інтернет не існує. Залежно від специфіки необхідної інформації для її пошуку повинні використовуватися відповідні пошукові служби. Необхідно пам'ятати, що чим грамотніше підібрані пошукові служби та складено запит на пошук інформації, тим якіснішими будуть результати пошуку.

Література

1. Інформатика та інформаційні технології/ За ред. Романової Ю.Д. М: Ексмо, 2008

2. Степанов О.М. Інформатики. СПб.: Пітер, 2002

3. Майєчак Б. Пошук інформації в мережі // Інтернет для дітей від 8 до 88. М.: Інтерексперт, 2002

4. Чечин Г. М., Положєнцев Є. В., Нижнікова С. В. Пошук інформації в мережі Internet. Ростов-на-Дону: РГУ, 2001

5. Диканський Є.Ю. Освоюємо Internet: Практичний курс з інформаційних та комунікаційним технологіямдля користувачів-початківців. М: Ілекса, 2001

6. http://www.dist-cons.ru/modules/searchinf/index.html

7. http://www.seonews.ru/masterclasses/detail/29812.php

8. http://www.gdenet.ru/bibl/technology/transmission/5.1.html

В даний час в мережі Інтернет розміщено кілька мільярдів Web-сторінок та файлів і з кожним днем ​​продовжує збільшуватися. Можливість здійснення пошуку у величезному інформаційному просторі мережі Інтернет надають пошукові системи.

Пошукові системи можна поділити на каталоги, класифікатори, пошукові машини (роботи індексів), системи метапошуку. Підставою для такої класифікації може бути спосіб реалізації пошуку та методи поповнення бази даних.

Різні принципи систем пошуку

Інформаційно-пошукові машини - це служби, що включають величезні бази даних, які автоматично поповнюються за допомогою пошукового робота ( спеціальна програма, що сканує зміст Інтернету).

Робот звертається до Web-сторінок, вивчає вміст цих сторінок й у залежність від закладеної програми, може зберегти всю сторінку у себе базі даних, або формує і прописує, до бази даних, ключові слова зі сторінок. Такі дії називають індексуванням.

Якщо сторінки сайту не пов'язані за допомогою гіперпосилань з іншими сайтами, можливість виявлення даної сторінки дуже мала. Також існує механізм ручної індексації в базі даних пошукової системи: власники сайтів можуть самі поставити свої сторінки в чергу на індексування.

Каталоги є величезною базою даних URL-адрес сайтів різної тематики. Каталоги може бути влаштовані по-різному, тобто. мають або лінійну, або ієрархічну структуру.

Спочатку здійснюється пошук на загальну тематику, потім запит більш конкретизується. Відмінною ознакою каталогу є те, що вся інформація заноситься людиною. Тому характерними особливостями каталогу є мала швидкість поповнення і невеликий, у порівнянні з пошуковою системою, обсяг, хоча ця характеристика сприяє збільшенню точності пошуку.

Організація роботи з каталогом досить проста. На сторінці Web-сайту зазвичай представлений список певних рубрик, кожна з яких з'єднана гіперпосиланням з іншими посиланнями, де знаходяться або список підрубрик, або список документів, які відповідають заданій рубриці.

До найпопулярніших російських каталогів можна віднести:

· Один з найбільших російськомовних каталогів List.ru ( http://www.list.ru);

· Російський варіант Yahoo ( http://www.yahoo.ru).

Класифікатори. Виконують аналогічні функції, як і каталоги. Є сукупність URL-адрес, тільки систематизовані за окремою тематикою, або за певною рубрикою. Часто класифікатори називають просто каталоги.

Системи метапошуку. Система, яка надсилає запит основним пошуковим системам і повертає їх звіти, вона має власних пошукових інструментів і створює власну базу даних. Основною перевагою метапошукових систем є можливість надання користувачеві ресурсів відразу кількох пошукових систем, без зусиль з його боку.

Технологія пошуку інформації у мережі Інтернет

Організувати пошук можна по-різному, і одна з проблем – зниження рівня непотрібної інформації. Необхідно відзначити, що пошук та відбір інформації не відноситься до рядових умінь людини, цьому необхідно спеціально навчати. Тут потрібно володіти основами математичної логіки, розуміти, що чим точніше сформульований запит - тим вище відповідність інформації, що подається у відповіді на запит.

Правила пошуку за ключовими словами

Щоб розпочати пошук, потрібно ввести ключові слова. Ці слова повинні максимально точно відображати суть запиту. Не можна задавати якесь одне ключове слово, що має загальний зміст, наприклад, "інформатика" або "історія". Краще звузити область пошуку за допомогою додаткових ключових слів.

Основне завдання користувача: правильно встановити поєднання ключових слів, щоб пошук не був надзвичайно широким і привів до потрібного результату. При цьому слід дотримуватись певних правил, які встановлюються пошуковою системою.

Також, при пошуку необхідно дотримуватися таких вимог:

1. Враховувати особливості природної мови:

· Полісемія - смислове різноманіття слова або поєднання слів;

· Омонімія - різні за змістом, але однаково пишуться слова;

· Синоніми - розрізняються за написанням і вимовою слова, але тотожні за змістом;

2. Не допускати орфографічних помилок.

3. Уникати пошуку за одним словом, використовувати необхідний та достатній набір слів.

4. Не писати великими літерами.

5. Виключати з пошуку непотрібні слова.

6. Використовувати можливості розширеного пошуку.

Після завдання ключових слів потрібно натиснути кнопку Пошук, розташовану поруч із текстовим полем.

Види пошукових систем

У всесвітньому павутинні знаходиться кілька тисяч пошукових систем, серед яких є як ті, що вже добре зарекомендували себе, так і менш відомі. З найвідоміших можна назвати серед закордонних: AltaVista, Google, HotBot, InfoSeek, Lycos, WebCrawler, Yahoo! та ін.; серед російських Яndex, Rambler, Апорт! та ін.

Кожна пошукова система має як переваги, так і недоліки. Критеріями вибору, якою пошуковою системою користуватися, можуть бути такі характеристики як:

· Принцип роботи пошукової машини;

· зручність використання;

· Зовнішнє оформлення;

· Складність мови запитів;

· Наявністю різних розширених функцій (управління форматом і порядком виведеної інформації, перекладом слів на іншу мову та ін.)

· швидкість роботи;

· Рівнем завантаженості в конкретні моменти часу, надійністю та ін.

Існує 2 основних типи пошукових систем мережі Інтернет: індексні та класифікаційні (каталогові).

Індексні пошукові системи, працюючи в автоматичному режимі оновлення своєї інформації, переглядають у мережі Інтернет вміст серверів, індексують всю інформацію, що міститься в них і вносять інформацію про розташування слів на сторінках сайтів до своїх баз даних.

Каталогові системи пошуку містять тематично структурований каталог серверів і найчастіше поповнюються вручну. У каталоговій системі пошуку можна, почавши з більшої тематичної рубрики, поступово спускаючись далі рубриками, дійти посилання потрібний сервер. В одних випадках буває зручніше скористатися першим типом пошукової системи, в інших – другим типом.

Є пошукові системи, що поєднують у собі обидва принципи роботи. Зокрема більшість індексних пошукових систем мають і каталогову систему пошуку. Багато пошукових систем перетворилися на Інтернет-портали, що поєднують у собі велику кількість ресурсів і сервісів. На сторінках таких порталів можна прочитати новини, програму телепередач, дізнатися про погоду, курси валют та багато іншого.

Існують також спеціалізовані пошукові системи, що дозволяють шукати інформацію в інших інформаційних "шарах" Інтернету: серверах файлових архівів, поштових серверахта ін Для пошуку файлів на серверах файлових архівів існує спеціалізовані системи двох типів: пошукові системи на основі використання баз даних та каталоги файлів. Для пошуку файлу в системі з використанням бази даних достатньо ввести ім'я файлу в полі пошуку та пошукова система видасть URL-адресу місць зберігання даного файлу. Якщо ім'я файлу невідоме, але відомо його призначення (наприклад, музичний файл), можна скористатися тематичним каталогом музичних файлів.

Для отримання якісного результату пошуку необхідно використовувати можливості різних пошукових систем.

Висновок

Локальні та глобальні мережі знаходять широке застосування у діяльності юриста. Що стосується глобальних мереж, то слід зазначити, що Інтернет - світова криниця інформації, в тому числі і тісно пов'язаної з юриспруденцією. Так в інтернеті мають свої сторінки та сайти юридичні агенції, спільноти та, нарешті, державні органи, які безпосередньо здійснюють нормотворчість. За допомогою інтернету можна влаштовувати конференції, спілкуватися в реальному режимі, переписуватись, відвідувати сайти, що містять довідкову правову інформацію. Наприклад, є агентство www.lexaudit.ru, яке серед іншого займається безкоштовним щоденним розсиланням новин на навколоюридичну тематику, що безумовно полегшує роботу юриста, економить його час.

Найчастіше наявність сторінки в інтернеті може зашкодити престижу фірми (юриста). Дуже зручно містити сторінку в інтернеті і з метою реклами, і для поширення інформації, залучення до співпраці.

В Інтернеті багато сайтів правової тематики, що відображає важливість права в житті особистості, суспільства і держави. До правових інформаційним ресурсамВеб можна застосувати різні критерії класифікації.

1. За національно-територіальною ознакою.

2. За видами власників сайту – державні організації, комерційні організації, громадські об'єднання, освітні установи, приватні особи тощо.

3. По галузях права – теорія держави й права, громадянське право, право інтелектуальної власності, інформаційне право тощо.

4. За характером змісту (контенту) – каталоги правових посилань, наукові публікації, правові бази даних, збірники нормативних документів, пропозиція юридичних послугта ін.

5. За охопленням передбачуваної аудиторії – міжнародні, федеральні, регіональні та місцеві ресурси.

6. За популярністю ресурсу, кількістю відвідувачів сайту (рейтингу).

Багато сайтів важко віднести до тієї чи іншої категорії за змістом, оскільки вони містять комбінацію різних варіантів. Так, наприклад, сайт можуть містити і добірку нормативних документів, статті різних авторів, і добірку посилань, і форум, словом все те, що забажає і зможе зібрати автор сайту. Зрозуміло, що той самий сайт може потрапляти одночасно в кілька категорій класифікації.

Використовуючи пошукові системи, можна отримати списки посилань на правові ресурси. у численних пошукових каталогахзазвичай, є відповідні розділи правової тематики.

Для того, щоб «налагодити зв'язок», з усіма вищезгаданими інформаційними системами, юрист, повинен володіти необхідними засобами, а також потрібними навичками необхідними для ефективного поводження з ними та оперування отриманою інформацією.

 

 

Це цікаво: