Як працює пошукова машина яндекса. Як влаштований Яндекс

Як працює пошукова машина яндекса. Як влаштований Яндекс

Перше, що необхідно засвоїти: пошукові системи розшукують нові ресурси за допомогою роботів. Останні переходять із посилання посилання і, виявивши черговий ресурс, вносять його у чергу індексацію. Головні пошукові системимають у своєму розпорядженні власні форми для додавання нових сайтів - « аддурилками(від англійської « add url»). Саме на цих адресах вебмайстра можуть зареєструвати сайт. Ми зібрали міні-довідник із контактами основних пошуковиків.

Як додати сайт в Яндекс?

Найбільш популярним пошукачем на території РФ вважається Яндекс. Його аддурилку ви зможете знайти ось за цією адресою ( http://webmaster.yandex.ru/). Якщо сайт не матиме проблем з унікальністю контенту, він потрапить в індекс за кілька днів. Хоча відомі випадки, коли майстри чекали індексації місяцями. Щоб максимально скоротити час очікування, спробуйте розмістити посилання на сайт у сторонніх ресурсах, наприклад на форумі або на сайті оголошень.

Як відбувається реєстрація сайту Гугл?


Головна перевага цієї пошукової системи – про неї знають усі. Add urlу Гуглі можна, перейшовши ось за цією адресою http://www.google.com/addurl/.Майте на увазі: додаючи свій сайт у форму, ви не отримуєте жодних гарантій, що ресурс виявиться в індексі. Можливо, як і у випадку з Яндексом, вам доведеться зачекати кілька тижнів або навіть місяців. Хоча додавання сайту в Google має свої переваги. Наприклад, щоб ресурс швидше з'явився в індексі, помістіть посилання на сайт на одному з форумів або перевірених ресурсів, де часто з'являється пошуковий робот.

Закріплюємо позицію сайту в пошуковій системі Rambler



Це – другий за популярністю пошуковик Рунету. Знайти його аддурилку можна ось тут ( http://www.rambler.ru/doc/add_site_form.shtml). Ресурс буде зареєстровано лише в тому випадку, якщо він знаходиться у російських доменах або на території країн СНД. Час, необхідний для переіндексації документів - близько двох тижнів.

Реєстрація сайту в інших пошукових системах

  • Щоб додати сайт до одного з найпопулярніших українських пошуковиків Meta.ua, зареєструйтесь на МетаПаспорті. Аддурилка пошуковика розташована ось тут ( http://meta.ua/webmaster/addurl.asp). Крім того, на сайті ви знайдете пункт "На допомогу вебмайстру". Там усі бажаючі можуть залишати заявки на зміну опису ресурсу у реєстрі або, наприклад, змагатися за місця у рейтингу Мети.
  • Якщо ви хочете додати сайт до пошукової системи Апорт, відразу переходьте до її аддурилки ( http://catalog.aport.ru/rus/add/AddUrl.aspx). Як обіцяє сама система, сайт перебуває в індексі за 2 тижні. Ви також можете помістити свій ресурс у каталозі Апорт, заповнивши ще одну форму з коротким описомпроекту.
  • Багато сеошників вважають за краще додати сайт в Yahoo. Ця пошукова система претендує на друге місце за популярністю серед користувачів по всьому світу, та й взагалі, вважається одним з піонерів серед пошукових систем. Аддурилку його ви знайдете за цією адресою http://siteexplorer.search.yahoo.com/submit. Реєстрація в закордонному пошуковику вимагатиме від вас Yahoo! ID та логіна. До речі, після того, як ваш сайт внесуть до індексу Yahoo, він автоматично з'явиться і в пошуковій системі AltaVista(теж дуже популярному).

Насамкінець зазначимо, що в Google та Яндекс є також розділ пошуку по блогах. Тому власники блогів з можливістю передплати RSS можуть додати ресурс, використовуючи форму в сервісах ППБ. Для Гугла це http://blogsearch.google.com/ping, для Яндекса - http://www.blogs.yandex.ru/add.xml.

Тоді ми торкнулися лише самого процесу додавання і я згадав вам про важливість вказівки пошукових систем головного дзеркала вашого блогу, давайте сьогодні розглянемо це докладніше.

По-перше, що таке дзеркало блогу або сайту? У пошукових системах дзеркалом сайту вважається як повне так і часткове відображення або простіше кажучи копія того чи іншого сайту.

Тепер давайте розглянемо, як це може торкнутися вашого сайту. Наприклад адреса вашого сайту має такий вигляд, при його наборі в адресний рядок браузера відвідувач потрапляє на головну сторінкувашого сайту і те саме станеться якщо набрати. Але пошуковики це вважають двома різними сайтами, але з повністю одним і тим же вмістом, тобто повне копіювання один одного (дубль). Думаю всім зрозуміло, що це все може вилитися.

І тому при додаванні сайту в пошукову систему дуже важливо обов'язково вказати головне його дзеркало, тобто з www або без.

Ніякої переваги www перед адресою вашого сайту не дає та йде з глибин створення всесвітньої мережі. Розшифровується, як всесвітнє павутиння. Тому сьогодні немає жодного сенсу його використовувати, але вибір, звичайно, за вами.

І так, якщо ви визначилися з тим, яке головне дзеркало буде у вашого сайту. Вам потрібно повідомити його пошукові системи Яндекс та Google. Почнемо з першого.

Як вказати Яндексу на головне дзеркало сайту



Як бачите, нічого складного немає.

Тепер проведемо цю операцію для Google.

І ось тут можна зіткнутися з трудом, давайте докладніше.





Тобто ми повинні пройти всю процедуру додавання сайту до Google. Що ми робили у вже згаданій мною колишній статті.

Тобто, як би додати новий сайт і якщо я минулого разу додавав сайт з адресою: сайт то тепер його потрібно вказати при додаванні, як сайт з www.

І так проходимо усю процедуру знову. При цьому також підтверджуємо права користування доменом з www. Звичайно вам не потрібно буде завантажувати на новий файл підтвердження, оскільки ми це зробили минулого разу, тому відразу натискаємо підтвердити.

І якщо минулого разу ми мали повідомлення такого виду.

Тепер воно буде ось таким:



Тепер повертаємось на головну сторінку «інструменти веб-майстра», вибираємо сайти по черзі, версію з www та без. У кожному випадку клацаємо по картинці у вигляді шестерні, як показано на малюнку вище і вибираємо налаштування сайту. Де вказуємо бажане дзеркало.

Як бачите, все вийшло.

Для остаточного перенаправлення на ваш сайт, вам необхідно ще зробити за допомогою файл.htaccess. Це ми також обговоримо в найближчих статтях підписуйтесь обов'язково на оновленнята до нових зустрічей!

Кожен із нас вважає себе унікальним. Кожен із нас думає, що чудово знає себе. Кожна відповідь пошукової системи на будь-який запит доводить зворотне

Ми не такі унікальні, як думаємо: мільйони людей до нас спантеличували і мільйони після нас спантеличать пошуковик майже однаковими питаннями. З іншого боку, ми надто непередбачувані: на формулювання нашого запиту впливає величезна кількість неусвідомлюваних факторів. І хоча б тому запит кожного з нас, яким би банальним він не був, потребує індивідуального підходу.

Фактично вся робота пошукача «Яндекс» зводиться до двох простих речей: зрозуміти, що насправді хоче дізнатися людина, і за кілька секунд знайти для неї серед мільярдів документів у Мережі підходящі.


Зняти відбитки

Система роботи пошукача чимось схожа на «Матрицю», а пошуковий робот (створена нею складна програма, яка самостійно приймає рішення) — на агента Сміта.


1997 року, коли «Яндекс» тільки відкрився, для роботи вистачало одного сервера. Через три роки компанія орендувала чотири стійки, де розміщувалося близько 40 комп'ютерів. Ці кілька десятків стали основою першого дата-центру. Сьогодні у «Яндекса» розгалужена та незалежна від офісів мережа центрів, в яких розміщено кілька тисяч серверів. Фото: ЯНДЕКС

Щоб не обшукувати весь Інтернет щоразу, коли комусь треба дізнатися, пошуковик робить частину роботи заздалегідь — перевіряє, що є в Мережі і де це лежить, за допомогою тисяч пошукових роботів. Вони бувають двох типів: основний та швидкий. Основний обходить і обробляє Інтернет загалом, а швидкий — документи, що з'явилися хвилину або кілька секунд тому. Завдання програм-роботів - відібрати придатну та корисну для користувачів інформацію, переробити її, відсіявши все застаріле та непотрібне. У чомусь це нагадує сортування сміття: папір в один контейнер, скло в інший, пластик у третій, харчові відходи у четвертий...

Зібрана роботами інформація утворює так званий зліпок Інтернету. Він зберігається на тисячах серверів Яндекса і постійно оновлюється. Зліпок схожий на список, де зазначено, де яку інформацію можна знайти. У цьому списку у кожного ключового словавказано не одну, а мільйони «сторінок». Щоб усі оновлення зліпка були доступні користувачам, їх переносять із сховища на базовий пошук. Дані від основного робота переносяться разів у кілька днів, як від швидкого робота — у час.

Вивести на чисту воду

Шукаючи відповідь на задане питанняу підготовленій базі машина стикається з двома основними складнощами. Перша складність – мова. Перш ніж шукати відповідь на питання, машині важливо зрозуміти якою мовою це робити. Наприклад, для російськомовної людини на запит «дружина князя Ігоря» пошук знайде документи з інформацією про військо, а для українця на «дружина князя Ігоря» видасть також документи, які згадують княгиню Ольгу, його дружину, бо українською «дружина» — це "дружина". Та й у багатій російській одне й те саме слово чи його похідні можуть означати різні речі. Наприклад, слово "сталі" - це одна з форм іменника "сталь" і дієслова "стати". Друга складність – людська психологія. Вводячи запит, ми очікуємо швидкої і точної відповіді, не переймаючись, природно, про відповідність формулювання запиту принципам математичного аналізу, якими працює мозок машини. Наприклад, ввівши в пошуковий рядок слово «наполеон», що людина хоче отримати: рецепт торта чи біографію французького імператора, купити коньяк чи знайти адресу психіатричної лікарні?

У таких ситуаціях у справу вступають одразу кілька технологій. Можна видати вам під рядком пошуку кілька підказок, які конкретизують запит. Мовляв, виберіть, що вам потрібно: "Наполеон - рецепти" або "Наполеон - Бонапарт". Якщо користувач не реагує на прохання машини і не додає до «наполеона» слів, то справі допомагає технологія «Спектр»: не сподіваючись на допомогу, машина відразу шукає інформацію за кількома категоріями (і про торт, і про імператора, і про коньяк). .). Крім того, зрозуміти користувача допомагають механізми персоналізації - знання машини про те, що цей користувач шукав зі свого комп'ютера день-два-три-місяць тому: якщо ви часто ставили «Яндексу» питання про кулінарію, то машина спочатку покаже вам результати, що говорять, що наполеон – торт.

Комбінації: клуби за інтересами

Завдання пошукової машини не зводиться до того, щоб просто відібрати документи, в яких зустрічаються слова та словосполучення з пошукового запиту. Машина має зрозуміти, які документи відповідають нашим суперечливим вимогам та чому вони їм відповідають. Чи хочемо ми отримати інформацію про наполеон-тістечко, чи, можливо, ми кілька років відвідували фітнес-клуб з пафосною назвою, а то й зовсім стурбовані комплексами людей невисокого зростання. У будь-якому випадку вирішення завдання потребує нетривіального підходу.

Творці пошукової програми"Яндекс" знайшли такий підхід, делегувавши право вибору машині. З одного боку, бездушна, але дуже швидка і розумна машина не знає і не хоче нічого знати про нас як про особистості, а з іншого — вона намагається з'ясувати про кожного якнайбільше.

Крім географічного положення користувача та лінгвістичного аналізу його запитів, пошукова машинавикористовує кілька тисяч критеріїв, абсолютно неочевидних для людини.

Фокус у тому, що ці критерії машина розробляє та оновлює самостійно.

Вона просто використовує дані про переваги та користувальницьку поведінку мільйонів людей і пов'язує це «середнє арифметичне» з історією наших запитів. Принципи, якими керується «Матриця» у собі, зіставляючи тисячі розроблених нею категорій користувальницьких інтересів, часто вкладаються у традиційні людські уявлення у тому, якими у принципі може бути «інтереси». Їхні десятки тисяч. Вони створюють один з одним різні, часом кумедні, комбінації. Наприклад, однією з таких комбінацій може бути відповідність результатів пошуку інтересам людини, яка розводить тритони. При цьому людина не просто цікавиться тритонами, а вже розводить їх, а лише перший рік.

Оцінка. Руки допомоги

«Матриця», звісно, ​​сама вирішує (з допомогою вищої математики), що у якій послідовності потрібно показати користувачам виходячи з десятків тисяч критеріїв. Але живих людей «Матриця» теж використовує — 1000 співробітників «Яндекса», так званих асессорів, оцінюють результати пошуку за тим чи іншим запитом (звісно, ​​не кожен запит оцінюється, і робиться це не в режимі реального часу) на їхню відповідність очікуванням звичайного користувача: не такого раціонального, як машина, не такого точного у формулюваннях, суперечливого та емоційного

Просування сайту своїми руками є одночасно простим і складним завданням. Для людини досвідченого в цій темі розкручування є набір простих і чітких кроків, що зводяться, більшою мірою, до механічних дій. Але для новачка, який тільки вчора дізнався слово SEO і ще не розібрався в його значенні, перемогти пошукові системи та конкурентів практично нереально.

Перш ніж приступити до просування, необхідно зрозуміти, як працюють пошукові системи Яндекс та Google. Можете вважати цю статтю вступною для мого курсу з просування сайтів"Безкоштовний трафік з Пошуковиків", тому рекомендую дочитати її до кінця, перш ніж почнете його вивчати.

Завдання пошукових систем

Інтернет безперервно зростає і розвивається, разом з ним еволюціонують і, але їхнє головне завдання залишається незмінним – вони повинні допомогти користувачеві знайти найкращу відповідь на запит, який він ввів у поле для пошуку. Чим якісніші результати у видачі показує пошуковик, тим більше йому довіряють люди. Чим більше людей йому довіряють, тим більше грошей він може заробити на контекстній рекламі, але це я вже пішов убік.

Пошукові системи постійно аналізують терабайти інформації, розміщеної на мільйонах веб-сторінок, намагаючись при цьому визначити, які сайти заслуговують на потрапляння в ТОП видачі, а які є найкращими кандидатами для потрапляння в бан.

Як діє пошукова система?

Пошуковик – це набір складних програм та баз даних, які діють за певним алгоритмом. Спрощено цей алгоритм можна розбити на 3 етапи.

Етап 1. Пошук нових сторінок

Всупереч помилці багатьох чайників, пошукові системи видають інформацію не про сторінки, що знаходяться в інтернеті, а про сторінки, що знаходяться в базі даних пошукової машини. Тобто якщо сайт невідомий Яндексу чи Goоgle, то й у видачі він не з'явиться.

Завдання пошуковика на цьому етапі полягає у пошуку всіх можливих адрес сторінок в інтернеті. Виконує цю роботу так званий робот «павук». Інтернет це посилання, посилання та ще раз посилання і цей «павук» просто переходить по різних посиланнях, записуючи в свою базу адреси всіх знайдених сторінок.

Потрапив на головну сторінку сайту, на ній знайшов посилання на сторінки рубрик, на сторінках рубрик знайшов посилання на сторінки зі статтями, картками товарів, посилання на файли або іншою інформацією. На якихось із відвіданих сторінок одного сайту він знайшов посилання на інші сайти – пошукова система переходить по них і сканує все, що знайшла там.

Прекрасно допомагають роботам для орієнтування файли Robots.txt та карти сайту Sitemap.xml, їх треба обов'язково зробити, особливо якщо сайт має багато сторінок. Тут дивіться, а про налаштування Sitemap розповім трохи пізніше.

Завдання робота створити адресний довідник на кшталт — Місто, Вулиця, Будинок, Квартира.

Як я вже написав вище – у пошукову видачу потрапляє інформація не з сайтів, що знаходяться в інтернеті, а інформація з бази даних пошукової системи. І наступна програма пошукача займається додаванням інформації в базу. Вона подорожує всіма відомими адресами сайтів і сторінок, копіюючи їх вміст на склади пошукової системи.

Називається цей процес індексація – потрапляння інформації до індексу пошукової системи.

Перший і другий процеси протікають безперервно і часто одночасно. Постійно поповнюється база адрес сторінок та база інформації з цих сторінок.

До речі, у процесі індексації пошукові системи оцінюють якість сторінок, і інформація деяких із них не потрапляє до індексу. Як би пошуковик знає про їхнє існування, але з якихось причин вважає їх марними для користувача, тому не додає у видачу — найчастіше це не унікальний контент чи службові сторінки. Як перевірити тексти на .

Етап 3. Визначення релевантності та ранжування

Якщо те, що ми обговорили в попередніх пунктах, працює безперервно і незалежно від зовнішніх факторів (дій людини), то третій етап алгоритму роботи пошукових систем починає діяти тільки під впливом людини.

Коли в пошуковій системі задається запит, система починає шукати на нього відповідь у наповненій базі знань за критеріями, заданими людиною в цьому запиті (як ).

Спочатку система робить вибірку, визначаючи всі релевантні запиту сторінки з відомих (Релевантні – значить відповідні, відповідні. Як перевірити релевантність сторінок сайту я писав). Наприклад, для запиту "купити холодильник Норд" релевантними будуть сторінки, що містять слова "купити", "холодильник", "Норд". Усі сторінки, що містять одне або кілька цих слів, потраплять у видачу пошукової системи.

Наступне завдання пошуковика, визначити, в якій послідовності користувач побачить усі ці сторінки – їх необхідно ранжувати. Факторів, які будуть впливати на порядок видачі багато, але якщо по-простому, то спочатку користувач побачить сторінки, які містять «купити холодильник Норд», якщо таких немає, то йому буде запропоновано «купити холодильник» або «холодильник Норд» і в самому кінці будуть сторінки зі словами "купити", "холодильник", "Норд".

Чинники, що впливають на ранжування

Як я вже сказав вище, факторів, що впливають на порядок розміщення сторінок сайтів у видачі пошукової системи багато, за словами керівників Яндекс, їх понад 700. Цифра значна і розкрити їх все неможливо. Більше того, всі ці фактори невідомі жодному сеошнику, оскільки пошуковики тримають їх таємно. Але загалом ці чинники можна розділити втричі групи.

1. Внутрішні фактори

До цієї групи належать фактори, на які здатний вплинути сам вебмайстер. До них входить сам текст, розміщений на сторінці, його оформлення (абзаци, заголовки та інша розмітка) - читайте . До них відносяться картинки всередині тексту та оформлення самого сайту. Посилання, які розміщуються всередині сайту на різні сторінки (внутрішня перелінковка), також відносяться до внутрішніх факторів.

2. Зовнішні чинники

Загалом ця група факторів визначає популярність конкретного сайту на думку інших ресурсів Інтернету. Ця популярність визначається кількістю і якістю сайтів, на яких проставлені посилання на різні сторінки вашого сайту, а також згадки про нього в тексті. Пошукові системи оцінюють цю авторитетність за складною схемою, яка враховує дуже велику кількість факторів.

Крім того, до внутрішніх факторів пошукові системи зараховують різні соціальні сигнали, типу ретвіти, лайки, фейсбуки або однокласники (про те, як безкоштовно накрутити лайки в ВК я писав).

3. Поведінкові фактори

Поведінка користувачів в інтернеті пошукові системи вміли відстежувати не завжди. Популярність ця група чинників почала набирати порівняно недавно. Різні лічильники статистики та спеціальні бари у браузерах збирають масу інформації про поведінку людей на сайтах. За даними Яндекс і Google визначають ступінь значущості сайтів для живих людей. Якщо на сторінках вашого сайту низький показник відмов — надовго затримуються відвідувачі, уважно читають якісні статті, переходять за внутрішніми посиланнями та роблять різні інші речі, отже він людям подобається і гідний розміщення на вищих позиціях пошукової видачі.

Чому Яндекс довго індексує сайти

Багато хто з вас звертав увагу на те, що індексація нових сторінок Яндексом зазвичай займає більше часу, ніж у Google. Пов'язано це з тим, що нові сторінки, знайдені пошуковими роботами потрапляють спочатку в загальну базу сторінок і тільки після обробки та фільтрації вона опиняється у видачі користувача.

Google намагається проводити процес перенесення нових документів у видачу безперервно. У свою чергу Яндекс накопичує нові сторінки, обробляє їх і потім однією загальною пачкою відправляє в видачу користувача. Відбувається це один раз на кілька днів (у середньому тиждень) і називається процедура апдейт (АП). Майже завжди, апдейти проходять вночі, коли навантаження на сервер пошукової системи мінімальна.

За таким алгоритмом Нова сторінкапотрапляє в базу даних пошуковика (на це може піти кілька днів), далі ця сторінка чекає своєї черги, поки інформація на ній буде оброблена і пройде ранжування за релевантними запитами (проходить ще один апдейт) і тільки на наступний апдейт видачі новий документз'являється переважно індексі.

Таким чином, деякі сторінки можуть чекати на свою чергу досить довго.

Тепер ви знаєте, як функціонують пошукові системи та можете приступати до роботи над вашими сайтами. Створіть релевантну потрібний запит сторінку, дайте пошукачеві її проіндексувати і допоможіть ранжувати ваші сторінки вище конкурентів.

Інші корисні статті блогу:



Кожен із нас вважає себе унікальним. Кожен із нас думає, що чудово знає себе. Кожна відповідь пошукової системи на будь-який запит доводить зворотне.

Ми не такі унікальні, як думаємо: мільйони людей до нас спантеличували і мільйони після нас спантеличать пошуковик майже однаковими питаннями. З іншого боку, ми надто непередбачувані: на формулювання нашого запиту впливає величезна кількість неусвідомлюваних факторів. І хоча б тому запит кожного з нас, яким би банальним він не був, потребує індивідуального підходу.

Фактично вся робота пошукача «Яндекс» зводиться до двох простих речей: зрозуміти, що насправді хоче дізнатися людина, і за кілька секунд знайти для неї серед мільярдів документів у Мережі підходящі.

Система роботи пошукача чимось схожа на Матрицю, а пошуковий робот (створена нею складна програма, що самостійно приймає рішення) - на агента Сміта.


1997 року, коли «Яндекс» тільки відкрився, для роботи вистачало одного сервера. Через три роки компанія орендувала чотири стійки, де розміщувалося близько 40 комп'ютерів. Ці кілька десятків стали основою першого дата-центру. Сьогодні у «Яндекса» розгалужена та незалежна від офісів мережа центрів, в яких розміщено кілька тисяч серверів. Фото: ЯНДЕКС

Щоб не обшукувати весь Інтернет щоразу, коли комусь щось потрібно дізнатися, пошуковик робить частину роботи заздалегідь – перевіряє, що є в Мережі та де це лежить, за допомогою тисяч пошукових роботів. Вони бувають двох типів: основний та швидкий. Основний обходить і обробляє Інтернет загалом, а швидкий - документи, що з'явилися хвилину чи навіть кілька секунд тому. Завдання програм-роботів - відібрати придатну та корисну для користувачів інформацію, переробити її, відсіявши все застаріле та непотрібне. У чомусь це нагадує сортування сміття: папір в один контейнер, скло в інший, пластик у третій, харчові відходи у четвертий...

Зібрана роботами інформація утворює так званий зліпок Інтернету. Він зберігається на тисячах серверів Яндекса і постійно оновлюється. Зліпок схожий на список, де зазначено, де яку інформацію можна знайти. У цьому списку у кожного ключового слова вказано не одну, а мільйони сторінок. Щоб усі оновлення зліпка були доступні користувачам, їх переносять із сховища на базовий пошук. Дані від основного робота переносяться разів у кілька днів, як від швидкого робота - у час.

Вивести на чисту воду

Розшукуючи відповідь на поставлене запитання у підготовленій базі, машина стикається з двома основними складнощами. Перша складність – мова. Перш ніж шукати відповідь на питання, машині важливо зрозуміти якою мовою це робити. Наприклад, для російськомовної людини на запит «дружина князя Ігоря» пошук знайде документи з інформацією про військо, а для українця на «дружина князя Ігоря» видасть також документи, які згадують княгиню Ольгу, його дружину, бо українською «дружина» - це "дружина". Та й у багатій російській одне й те саме слово чи його похідні можуть означати різні речі. Наприклад, слово "сталі" - це одна з форм іменника "сталь" і дієслова "стати". Друга складність – людська психологія. Вводячи запит, ми очікуємо швидкої і точної відповіді, не переймаючись, природно, про відповідність формулювання запиту принципам математичного аналізу, якими працює мозок машини. Наприклад, ввівши в пошуковий рядок слово «наполеон», що людина хоче отримати: рецепт торта чи біографію французького імператора, купити коньяк чи знайти адресу психіатричної лікарні?


У таких ситуаціях у справу вступають одразу кілька технологій. Можна видати вам під рядком пошуку кілька підказок, які конкретизують запит. Мовляв, оберіть, що вам потрібно: Наполеон-рецепти або Наполеон - Бонапарт. Якщо користувач не реагує на прохання машини і не додає до «наполеона» слів, то справі допомагає технологія «Спектр»: не сподіваючись на допомогу, машина одразу шукає інформацію за кількома категоріями (і про торт, і про імператора, і про кінь як). ..). Крім того, зрозуміти користувача допомагають механізми персоналізації - знання машини про те, що цей користувач шукав зі свого комп'ютера день-два-три-місяць тому: якщо ви часто задавали «Яндексу» питання про кулінарію, то машина спочатку покаже вам результати, що говорять, що наполеон – торт.

Комбінації: клуби за інтересами

Завдання пошукової машини не зводиться до того, щоб просто відібрати документи, в яких зустрічаються слова та словосполучення пошукового запиту. Машина має зрозуміти, які документи відповідають нашим суперечливим вимогам та чому вони їм відповідають. Чи хочемо ми отримати інформацію про наполеон - тістечко, або, можливо, ми кілька років відвідували фітнес-клуб з пафосною назвою, а то й зовсім стурбовані комплексами людей невисокого зростання. У будь-якому випадку вирішення завдання потребує нетривіального підходу.


Автори пошукової програми «Яндекс» знайшли такий підхід, делегувавши право вибору машині. З одного боку, бездушна, але дуже швидка та розумна машина не знає і не хоче нічого знати про нас як про особистості, а з іншого – вона намагається з'ясувати про кожного якнайбільше.

Крім географічного положення користувача та лінгвістичного аналізу його запитів, пошукова машина використовує кілька тисяч критеріїв, зовсім не очевидних для людини.

Фокус у тому, що ці критерії машина розробляє та оновлює самостійно.
Вона просто використовує дані про переваги та користувальницьку поведінку мільйонів людей і пов'язує це «середнє арифметичне» з історією наших запитів. Принципи, якими керується Матриця в собі, зіставляючи тисячі розроблених нею категорій користувальницьких інтересів, часто вкладаються у традиційні людські уявлення у тому, якими у принципі може бути «інтереси». Їхні десятки тисяч. Вони створюють один з одним різні, часом кумедні, комбінації. Наприклад, однією з таких комбінацій може бути відповідність результатів пошуку інтересам людини, яка розводить тритони. При цьому людина не просто цікавиться тритонами, а вже розводить їх, а лише перший рік.

Оцінка. Руки допомоги

Матриця, звісно, ​​сама вирішує (з допомогою вищої математики), що у якій послідовності потрібно показати користувачам виходячи з десятків тисяч критеріїв. Але живих людей Матриця теж використовує - 1000 співробітників «Яндекса», так званих асесорів, оцінюють результати пошуку за тим чи іншим запитом (звичайно, не кожен запит оцінюється, і робиться це не в режимі реального часу) на їхню відповідність очікуванням звичайного користувача : не такого раціонального, як машина, не такого точного у формулюваннях, суперечливого та емоційного

 

 

Це цікаво: