Короткі SEO-замітки за квітень 2023: Google, LLM
17 коротких дописів з Telegram-каналу @SEOBAZA за квітень 2023, об'єднані тут замість окремих сторінок. Основні теми: Google, LLM, технічне SEO.
Виявилось, що далеко не всі знають, як використовувати GPT-4 одразу на контенті в браузері. Тобто…
Виявилось, що далеко не всі знають, як використовувати GPT-4 одразу на контенті в браузері. Тобто не копіювати туди-сюди в ChatGPT, а використовувати прямо тут і зараз.
Браузер Edge -> Bing Discover (кружочок в верхньому правому кутку) -> три крапки з More Options -> App and notification settings -> Page context (просто активуйте)
Використовуйте контент тієї сторінки, де знаходитесь, для його обробки в чаті Bing.
Sebastien Bubeck з Microsoft на лекції в MIT
-
Не слухайте тих, хто каже, що GPT-4 це просто статистична модель, яка передбачає слова на основі тих даних, які в неї вклали. Так, її так тренували, але це не означає, що це все, на що вона здатна і що вона не може бути розумною або усвідомлювати.
-
Публічний інструмент обмежений. Ви не зможете відтворити наші приклади, тому що ми навмисно обмежили публічну модель з питань безпеки.
-
Ви кажете, що GPT-4 недостатньо розумна. Давайте поглянемо, як ми визначаємо розумність і перевіримо GPT-4 за всіма критеріями. З них вона не вміє тільки планувати і навчатися новому (навчатися новому може тільки в рамках окремої сесії).
-
GPT-4 вміє користуватися інструментами, навчатися ними користуватися і виконувати складні завдання. Наприклад, можна попросити GPT-4 навчитися використовувати StableDiffusion і намалювати єдинорога. Але та версія, яка доступна публічно, це не зможе зробити через обмеження.
-
GPT-4 робить помилки, але його можна налаштувати робити пошук по базам даних для більш актуальних новин, а також використовувати формули для математичних розрахунків.
-
GPT-4 — це не кінець. Це тільки початок.
Цікава історія сталась з одним з найяскравіших борців зі спамом в мапах Google. За рік він подав…

Цікава історія сталась з одним з найяскравіших борців зі спамом в мапах Google. За рік він подав понад тисячу скарг на різні бізнеси в локальному пошуку і мапах. Але ось отримав ручні санкції на власний сайт за контент-спам (неякісний, тонкий контент).
Ручні санкції не пов'язані з апдейтом. Їх видають, якщо не знають, як підкрутити алгоритм. Але часто вони йдуть слідом за апдейтом, коли гуглери бачать, що алгоритмічно сайт не прибити.
Останній березневий апдейт зачепив і локальний пошук. Можливо, що послабили негативний фактор знаходження бізнесів в одній ніші за однією адресою, навіть і з одним номером телефону. Тепер їх частіше помічають в пошуку.
В 2022 році Google ідентифікував в 5 разів більше спамних сайтів порівняно з 2021 роком. Все це за…
В 2022 році Google ідентифікував в 5 разів більше спамних сайтів порівняно з 2021 роком. Все це за допомогою SpamBrain. Також за його допомогою ідентифіковано в 50 разів більше сайтів посилального спаму і в 10 разів покращили виявлення зламаних для спаму веб-сайтів.
Відтепер спам можуть виявляти скоріше, ще на етапі сканування. І просто не індексувати сторінку.
Новий анти-скам алгоритм дозволяє знизити кліки на шахрайські сайти на 50%.
Написав Duy Nguyen — аналітик якості пошуку в Google. Той самий, який минулого року сказав, що у Google вже на той час були алгоритми виявлення контенту, згенерованого за допомогою ШІ з іншого контенту. Ці алгоритми також понижують виявлений контент в видачі.
Google Office Hours. Квітень 2023 Відео. Текст.
Деякі витяги з добірки:
-
Для поцілення існуючого англомовного веб-сайту на країни ЄС можна використовувати website.com/eu з декількома hreflang (en-fr, en-de, en-nl тощо), не створюючи окремих сайтів. Рекомендується додати динамічний банер для кращого спрямування користувачів до потрібної їм версії.
-
Можна використовувати відгуки з інших сайтів для вашого продукта для розширених результатів пошуку. Необхідно, що ці відгуки були доступні для ознайомлення, належали до цього одного продукту, а не до всій категорії.
-
Нібито пошук Google не підтримує анотації, які не зазначено в цій документації. Зокрема, використання URI з NALT thesaurus не допоможе в SEO під Google, стверджує John Mueller. На самому кінці додає — through rich results — для розширених результатів пошуку.
-
Для Googlebot редирект 308 є еквівалентом 301.
-
Швидкість індексації нібито залежить також від якості вашого контенту, стверджує Gary Illyes. Це саме стосується міграції домену.
-
Заохочуйте інших згадувати ваш веб-сайт, щоб він з'являвся в результатах пошуку.
Олексій Матузний — автор каналу Python для SEO (Sneex) — про автоматизацію в SEO
- що і як автоматизувати 🟢 як вам в цьому допоможе ChatGPT 🟢 приклад шаблону programmatic SEO 🟢 звичайно, що одразу захочете навчитись Python, а тут вам посилання на курси 🟢 після курсів ви вирішите когось все ж таки найняти, то Олексій розповів, скільки це коштує і де шукати людей.
*** ==== ***
Спонсор відео: seo.domains
-15% знижки за промокодом SEOBAZA15 SEO.DOMAINS*** ==== ***
Відео [44:27]. Презентація.
Google розбудовує новий пошукач і буде доповнювати вже існуючий новими функціями на базі ШІ.
Новий пошукач має бути більш персоналізованим, давати користувачу попередньо визначені опції для придбання товарів, отримання інформації. А також бути більш розмовним. Коли його випустять, ще не відомо.
Проект Magi
Над доповненям існуючого пошукача Google працює 160 людей. І перший результат буде доступним для тестування вже за місяць. Magi буде допомагати користувачам завершувати транзакції покупки, будь то взуття або квиткі на літак.
Також користувачі зможуть отримувати відповіді на питання для написання коду. Під цими відповідями Google планує додавати рекламу.
Інші заплановані проекти
- Пошук музики за допомогою чатботу 🟢 GIFI — генерація зображень в результатах пошуку 🟢 Tivoli Tutor — навчання користувача нової мови за допомогою ШІ 🟢 Searchalong — віджет в браузері Chrome для запитань до чатботу під час навігації по сайтам.
Джерело: Search Engine Land
Google почав відображати інформацію про доставку і повернення в результатах пошуку для сторінок з…
Google почав відображати інформацію про доставку і повернення в результатах пошуку для сторінок з розміткою Product.
Якщо у вас немає специфікації щодо доставки і повернення в розмітці, ви побачите некритичну помилку в консолі Google і при перевірці в валідаторі. Ця помилка не впливає на відображення інших елементів Product в розширеному сніппеті. Додати відповідну інформацію можна так.
Також раніше Google повідомив, що прибирає прев'ю відео для сторінок, де відео не є основним контентом, з результатів пошуку. Замість них можуть відображати зображення.
Це відобразилось в відео-звітах консолі Google. У деяких сайтів перегляди і кліки зійшли на нуль.
Google запустив Reader Revenue Manager — новий продукт, спрямований на централізацію контента за…
Google запустив Reader Revenue Manager — новий продукт, спрямований на централізацію контента за підпискою. Тепер в пошуку, якщо ви є підписником якогось сайту, вам його результат буде підсвічуватись. Також можна підписатись прямо з Google. Видавці можуть зареєструватись, щоб отримувати платних підписників.
На каналі Holly Starks вийшло інтерв'ю з власниками славнозвісного Conch House (він до речі знов є…

На каналі Holly Starks вийшло інтерв'ю з власниками славнозвісного Conch House (він до речі знов є в індексі, але вже так не ранжується):
- вони побудували свій дор на тематичному авторитеті 🟢 кожного дня публікували по 5тис сторінок 🟢 поцілювали на long-tails 🟢 спеціально обрали старий домен з історією і великою кількістю проіндексованих сторінок, на нових доменах ніякого результату вони ніколи не досягали 🟢 до успіху цього сайту вони протестували 100 інших доменів 🟢 conch-house.com придбали на dan.com за $2800, але більшість доменів вони беруть на аукціонах GoDaddy, також рекомендують Namejet 🟢 контент був згенерований за допомогою ШІ
Washington Post провели розслідування, які веб-сайти попали в датасет відомих моделей ШІ. Є дані,…
Washington Post провели розслідування, які веб-сайти попали в датасет відомих моделей ШІ. Є дані, що вони використовувались для тренування моделей Google і Meta. Немає доказів, що саме цей датасет використовував OpenAI. Але вірогідність дуже висока.
-
Дані патентів випереджають Wikipedia. На третьому місці знаходиться scribd.com, який доступний тільки за підпискою 😉.
-
Щонайменше 27 сайтів в датасеті — піратські або фальсифікат.
-
Є форуми гравців, якісь сумнівні сайти, а також закриті сайти з приватними даними, наприклад, з реєстраційними даними голосувань.
-
Є сайти, які заробляють на підписному контенті, зокрема patreon. Вони не давали згоду на те, що їх контент буде використовуватись для тренувань. Взагалі в використаному в датасеті контенті позначка копірайта зустрічається 200 млн разів.
-
Звичайно, що багато новинних сайтів, які також не давали згоду на використання їх контенту.
-
З релігійних сайтів домінуюча більшість християнські.
-
Журналістів зачепило, що в датасеті є сайти, які не підтримують LGBTQ і трансів, а також 4chan.org
Топ-1000 сайтів з розслідування Washington Post в таблиці Google:…
Топ-1000 сайтів з розслідування Washington Post в таблиці Google: https://docs.google.com/spreadsheets/d/1F4KtBPDPSgc0Y_lzg7tlYKSR5O60uJ1pFcgmZswsYEE/edit?usp=sharing — зробив Nick Wilsdon.
Якщо хочете пошукати, чи ви згадуєтесь десь в усьому цьому масиві , то тут: https://c4-search.apps.allenai.org/
Ну що, є ви там?
Gary Ilyes повідомив, що вони додали ще +2 файла JSON з діапазонами IP-адрес, що використовуються…
Gary Ilyes повідомив, що вони додали ще +2 файла JSON з діапазонами IP-адрес, що використовуються іншими їх сканерами, а не googlebot.
Мовляв, робіть з цією інформацію, що хочете, але це вам допоможе краще ідентифікувати сканер (автоматичний або ініційований людиною), звісно, якщо дозволите його в своїх налаштуваннях брандмауера.
Google зробив декілька змін в документації стосовно зручності сторінок для користувачів (page…
-
Перелік змін опублікований в Google Search Central Blog
-
В інструкцію щодо корисного контенту додали розділ про зручність сторінки. Нічого нового там немає, вони рекомендують не зосереджуватися тільки на чомусь одному, а працювати над взаємодією зі сторінкою на всіх рівнях.
-
Трішки оновили саму інструкцію зі зручності сторінок. До чеклісту з CWV, оптимізації під мобільні пристрої, безпеки, великої кількості реклами і нав'язливих елементів додали ще два питання про основний контент сторінки — наскільки легко його знайти і відрізнити від іншого.
-
Звіт про зручність сторінки в консолі Google (Page Experience report) буде змінено. Звіти про CWV і HTTPs залишаться.
-
Звіт про сумісність із мобільними пристроями приберуть з консолі. Також видалять такий інструмент і API. Англійською — "Mobile Usability" report, Mobile-Friendly Test tool і Mobile-Friendly Test API. Нібито Lighthouse нам буде достатньо.
-
Barry Schwartz помітив, що з переліку значних систем ранжування видалили дані про все, що стосується зручності сторінки.
На Amazon знайдено відгуки, явно створені з допомогою ChatGPT. Такі відгуки знайдено навіть від…
На Amazon знайдено відгуки, явно створені з допомогою ChatGPT. Такі відгуки знайдено навіть від учасників Vine Program — програми, спрямованої на підтвердження справжності відгуків. Це звичайно заборонено правилами Amazon.
Попереднього року Amazon вже позивалися на групи в Facebook за створення фейкових відгуків. Цікаво, що вони будуть робити зараз.
Також нагадую, що після останнього оглядового апдейту саме такі компанії як Amazon виграли найбільше.
Kevin Indig поділився кейсами переходу на SSR з CSR і впливом на SEO
- invideo.io — органічний трафік виріс на 35% exprealty.com exprealty.com — небрендові запити зросли з 0 до 200тис на місяць 🟢 silkfred.com — перенесли пагінацію з CSR на SSR і подвоїли трафік, але точних цифр не надали 🟢 airtable.com — трафік виріс приблизно на 40-50%
Після тижневих насмішок в Твітері з боку деяких SEOшників Google зробив пояснення про Page…
-
Ми не казали, що зручність сторінок (Page Experience) більше не використовується, або її треба ігнорувати.
-
Системи ранжування відрізняються від сигналів ранжування. Раніше на сторінці зі списком систем ранжування були і сигнали ранжування. Ми їх прибрали, але це не значить, що вони перестали бути сигналами.
-
Сигнали, пов'язані зі зручністю сторінок, потрапили на сторінку систем ранжування, коли її заповнювали, відштовхуючись від оновлень алгоритму.
-
Google має на меті винагороджувати контент, забезпечений зручною взаємодією зі сторінкою, на якій він знаходиться.