Після смерті Bill Slawski так і не з'явилась людина, яка вміє так само ефективно розбирати патенти.…
Після смерті Bill Slawski так і не з'явилась людина, яка вміє так само ефективно розбирати патенти. Це відносно старе відео, але в ньому Bill дуже детально розповідає, як правильно аналізувати інформацію в патентах і який вплив вони мають на пошук.
З цікавого:
🌻 Найважливіша частина патенту — Claims. Вона описує, що саме захищає патент. Також, коли Google оновлює патент, то саме тут позначає, що змінилось.
🌻 На прикладі патенту, за яким Google ранжує новини, можна побачити в Claims, що вони змінювали алгоритм декілька разів. Прочитав детальний опис, можна зрозуміти, як вони можуть ранжувати новини зараз.
🌻 Як потрапити до каруселі Google? Як в ній ранжуватись ближче до початку? На це є теж відповідь в патенті Generating Ranked Lists of Entities.
🌻 Як BERT переписує запити користувача — Retrieval-augmented language model pre-training and fine-tuning.
🌻 Як Google екстрактує сутності і як присвоює їм вагу в графі знань (confidence score), від яких факторів це залежить. Наприклад:
- час — якщо щось було досить недавно або частіше згадується останнім часом
- надійність — коли важливо, щоб інформація надходила з найбільш надійного джерела
- популярність — коли важливі більш популярні джерела
- близькість — або локальність.
🌻 Як будується сторінка пошуку з її елементами: featured snippet, PAA, панель знань, пов'язані сутності і т. і. А також як з'ясовується канонічний запит. Providing search results using augmented search queries.
🌻 Як полегшити читання патенту:
- видаліть надлишковий контент
- додавайте мітки.
🌻 Досліджуйте, хто написав патент, чим взагалі займається ця людина, які в неї є дослідження і т. і.
🌻 Google часто уникає публічно називати алгоритми або їх частини так, як вони зазначені в їх патентах і намагається повністю змінити публічну термінологію, це потрібно враховувати.