Яка система штучного інтелекту обробляє «дуже велику частину» запитів в секунду та як це відбувається?

     Google обробляє «дуже велику частину» запитів в секунду за допомогою самонавчання системи штучного інтелекту під назвою RankBrain. І це відбувається вже кілька місяців. Але вперше про новий алгоритмі Google повідав тільки днями.

 

     Зі статті на Bloomberg стало відомо, що щодня RankBrain обробляє 15% запитів, за добу він здатний обробляти мільярди сторінок, аналізуючи їх на відповідність запиту. У тому випадку якщо RankBrain бачить незнайоме слово або фразу, система здогадується про значення  навколишнього тексту і потім успішно підбирає релевантний результат під пошуковий запит. На думку Google, RankBrain дуже добре справляється з неоднозначними або запитами, які раніше не зустрічалися.

 

     Відзначається, що RankBrain - лише один із сотень сигналів, на основі яких алгоритм Google ранжує сайти у видачі. Однак компанія робить на новий алгоритм велику ставку. Це підтверджують слова представника Google Грега Коррадо про те, що «на сьогоднішній день RankBrain займає третє місце за значимістю серед сигналів ранжирування Google».

 

     Краще розібратися в RankBrain допоможуть питання і відповіді по нововведенню Google, підготовлені виданням SearchEngineLand.

Коли був запущений RankBrain?

 

     За інформацією Google, поступовий запуск алгоритму RankBrain стартував на початку 2015 року та був повністю закінчений кілька місяців тому по всьому світу.

Що саме робить RankBrain?

 

      RankBrain використовується переважно для інтерпретації пошукових запитів в разі, коли на релевантних запиту сторінках не присутні точні входження слів з цього запиту.

 

Як RankBrain допомагає визначати запити?

 

     Щодня Google обробляє три мільярди пошукових запитів. При цьому близько 15% з них (450 млн запитів в день) пошукова система бачить вперше. Серед них можуть бути складні багатослівні, низькочастотні запити, так звані «запити довгого хвоста». RankBrain покликаний допомогти алгоритмам Google правильно інтерпретувати їх, щоб знайти такими запитами найбільш релевантні сторінки.

 

     RankBrain може виявляти закономірності між, начебто, непов'язаними між собою складними запитами і визначати, схожі вони один з одним. Самонавчання дозволить алгоритму краще розуміти майбутні складні запити.

 

    Що найважливіше, RankBrain здатний зв'язувати ці групи пошукових запитів з результатами видачі, які, за версією алгоритму, є найбільш популярними серед користувачів.

 

     Чи справді RankBrain постійно навчається?

 

     Весь процес навчання RankBrain відбувається офлайн. Алгоритм отримує на обробку групи історичних запитів і на їх прикладах вчиться будувати прогнози.

Отримані прогнози в обов'язковому порядку перевіряються. Якщо запити оброблені правильно, запускається нова версія RankBrain. Потім цей цикл повторюється.

RankBrain - це новий спосіб ранжирування результатів пошуку Google?

 

     Ні. RankBrain - частина пошукового алгоритму Google, комп'ютерна програма, яка використовується для визначення найбільш релевантних сторінок під конкретні запити.

 

     Як називається основний пошуковий алгоритм Google?

 

     Він називається «Колібрі» (Hummingbird). Довгий час у основного алгоритму Google не було офіційної назви. Однак в середині 2013 року Google повністю переробив його і назвав «Колібрі».

 

     RankBrain - частина пошукового алгоритму «Колібрі»?

 

     Редакція SearchEngineLand вважає, що це так. «Колібрі» - основний алгоритм Google, що включає в себе безліч різних елементів. Найновішим з них є RankBrain.

     Відзначимо, що основний пошуковий алгоритм «Колібрі» складається з добре відомих SEO-галузі алгоритмів, а саме:

  • Panda і Penguin;
  • Pigeon - алгоритм локального пошуку;
  • Mobile-friendly алгоритм;
  • Payday, розроблений для боротьби з «переспамленнимі запитами»;
  • Top Heavy, понижуючий у видачі ресурси, на сторінках яких занадто багато рекламного контента;
  • і Pirate, покликаний боротися з порушенням авторських прав.

 

     Що таке «сигнали», які Google використовує в ранжируванні?

 

     На основі сигналів Google визначає, яку позицію привласнити сторінці у видачі. Всі перераховані вище алгоритми передають сигнали основного пошуковому алгоритму і вже на підставі всіх даних «Колібрі» визначає сторінки, найбільш релевантні запиту користувача.

Дані PageRank також використовується як сигнал.

 

     Скільки сигналів ранжирування використовує Google?

 

     Представники Google неодноразово заявляли про те, що пошуковик використовує понад 200 основних сигналів ранжирування, в свою чергу вони можуть мати до 10 000 допоміжних сигналів. У публікації Bloomberg йдеться про «сотні» основних сигналів.

 

     Якщо RankBrain - третій за важливістю сигнал, які сигнали є першими?

 

     На думку Денні Салліван (SearchEngineLand), найважливішим сигналом залишаються посилання, а другим за значимістю - «слова», починаючи зі слів на сторінці і, закінчуючи тим, як Google інтерпретує слова, що містяться в запитах, що вводяться в пошуковий рядок.