Про ембедінги або вбудовування для SEOшників простими словами

За мотивами дописів Andrea Volpini [1, 2].
Ембедінги — це переклад слова на мову комп'ютера. А саме в числовий вектор, щоб комп'ютер міг розуміти значення цього слова. Числовий вектор — це список чисел з позицією в просторі. Якщо машина бачить, що два слова часто зустрічаються в текстах разом, то вона вирішить, що їх позиції у просторі мають бути близькими. Наприклад, "борщ" і "сметана" 🍜.
Деякі приклади, де і як це можна використовувати в SEO:
-
Оптимізація контенту: аналізуємо сторінки в топі по певним запитам, щоб виявити їх теми. І можемо порівняти зі своїми сторінками.
-
Дослідження ключових слів і кластеризація: ми можемо використовувати ембедінги для знаходження запитів, які семантично пов'язані з цільовим ключовим словом, але можуть бути неочевидними синонімами, а також їх кластеризувати.
-
Моделі ранжування: ми можемо використовувати ембедінги для прогнозування, наскільки добре сторінка заранжується за певним ключовим словом.
-
Перелінковка: порівнюємо ембедінги сторінок сайту, щоб визначити семантично пов'язані сторінки, сторінки з одного кластеру і перелінкувати їх.
-
Міграція сайтів: особливо, коли треба з'єднати два різних вебсайти разом. Про це докладніше тут.
-
Динамічні сторінки 404: наприклад, для ecommerce з рекомендаціями по продуктам на сторінках, які були видалені.
-
Для тренування на своєму контенті або контенті конкурентів: зазвичай з метою генерації контента. Приклад теж буде згодом опублікований.
-
Лінкбілдінг через ембедінги часто згадують як можливий метод, але на практиці я поки що не спостерігала випадків, коли цей підхід був би вдало реалізований. Це може бути теоретично цікаво, але поки без реальних прикладів.
Візуалізація зроблена за цим кодом в колабі. Як реально обчислити ембедінги, а не просто намалювати, трохи згодом.