Як працює SGE і до чого тут RAG — пошуково-доповнена генерація by Michael King
Як працює SGE і до чого тут RAG — пошуково-доповнена генерація by Michael King
В статті наводиться методологія розрахунку потенційних втрат трафіку через SGE. Наприклад, для сайту Nerdwallet розрахункові втрати становлять 30,81% від існуючого трафіку. Тому читайте її всю.
Коротко про інші основні моменти 👇
RAG дозволяє поєднати пошукові і генеративні моделі для покращення відповідей і зменшення галюцинацій. Ця модель може використовувати зовнішні дані. Тобто якщо ChatGPT використовує тільки той датасет, на якому його тренували, то за допомогою RAG можна інтегрувати в відповідь нову інформацію. Так працює модуль Bing в ChatGPT або сам Bing Chat.
3 підходи RAG від Google: 🟢 REALM — модель, що навчена передбачати масковані токени в реченнях та знаходити релевантні документи з корпусу. Дозволяє генерувати більш точні тексти. 🟢 RETRO — модель схожа на REALM, але використовує інший механізм уваги до документів. Генерує більш плавні і зв'язні тексти. 🟢 RARR — не генерує текст з нуля, а вибирає найкращі уривки з корпусу. Дозволяє створювати точніші тексти, але вимагає більше обчислень.
SGE використовує комбінацію моделей PaLM 2, MuM та аспектів пошуку Google. Це означає, що індекс документів Google та Knowledge Vault можуть використовуватися для вдосконалення відповідей.
Чим SGE загрожує пошуку: 🟢 SGE змінить розподіл пошукового попиту. Запити стануть довшими і природнішими. 🟢 Модель CTR зміниться через AI snapshot. 🟢 Контекстні вікна дадуть персоналізовані результати пошуку. 🟢 Трекінг позицій по запитам або видимості дуже ускладниться.