Jak umělá inteligence rozhoduje, které značky doporučí: od vztahových souvislostí k tematické viditelnosti

Výsledky AI nakupování jsou založené na datech z Google nákupů
AI doporučuje na základě vztahových souvislostí, nejen obsahu. Zjistěte, proč vaše značka není vidět a jak to změnit.

Zeptejte se ChatGPT nebo Claude, ať doporučí produkt ve vašem oboru. Pokud se vaše značka v odpovědi neobjeví, máte problém, který žádná optimalizace klíčových slov nevyřeší.

Většina SEO specialistů si v takové chvíli okamžitě pomyslí na obsah: více stránek, více klíčových slov, lepší on-page signály. Jenže důvod, proč vaše značka chybí v doporučeních AI, nemusí mít s obsahem ani klíčovými slovy nic společného. Souvisí s něčím, čemu se říká relační znalost.

Studie, kterou většina marketérů přehlédla

V září 2019 publikovali Fabio Petroni a jeho kolegové z Facebook AI Research a University College London práci Language Models as Knowledge Bases? na konferenci EMNLP 2019, jedné z nejvýznamnějších konferencí v oblasti zpracování přirozeného jazyka.

Jejich otázka byla jednoduchá: ukládá předtrénovaný jazykový model BERT skutečně faktické znalosti? Ne jazykové vzorce nebo gramatická pravidla, ale fakta o světě. Například, že Dante Alighieri se narodil ve Florence nebo že iPod Touch vyrábí Apple.

Aby to ověřili, vytvořili testovací nástroj nazvaný LAMA (LAnguage Model Analysis). Vzali tisíce známých faktů z databází Wikidata, ConceptNet a SQuAD a každý z nich převedli do doplňovací věty. Například: „Dante Alighieri se narodil v ___.“ Poté požádali BERT, aby doplnil chybějící slovo.

BERT, bez jakéhokoli dodatečného doladění, dokázal vybavit faktické znalosti na úrovni srovnatelné se specializovanou znalostní databází. Tato databáze přitom byla vytvořena pomocí systému pro extrakci vztahů s oracle-based entity linkerem, tedy měla přímý přístup k větám obsahujícím správné odpovědi. Jazykový model, který „jen“ přečetl obrovské množství textu, dosahoval téměř stejně dobrých výsledků.

Model odpovědi nevyhledával. Během tréninku si osvojil asociace mezi entitami a pojmy a tyto vazby dokázal znovu vybavit. BERT si vytvořil interní mapu toho, jak spolu věci ve světě souvisejí.

Po této studii začala výzkumná komunita brát vážně myšlenku, že jazykové modely fungují jako úložiště znalostí, nejen jako nástroje pro rozpoznávání vzorců.

Co znamená „relační znalost“

Fabio Petroni zkoumal to, čemu on a další vědci říkali relační znalost: fakta vyjádřená jako trojice subjekt – vztah – objekt. Například: (Dante Alighieri, [narozen v], Florence). (Kenya, [diplomatické vztahy s], Uganda). (iPod Touch, [vyrobeno společností], Apple).

To, co je na tom zajímavé pro viditelnost značek (a AIO), je zjištění týmu Petroniho: schopnost modelu vybavit si konkrétní fakt silně závisí na strukturálním typu vztahu. Identifikovali tři typy vztahů a rozdíly v přesnosti mezi nimi byly výrazné.

Vztahy 1:1: jeden subjekt, jeden objekt

Jde o jednoznačná fakta. Například: „Hlavním městem Japonska je ___.“ Existuje jen jedna správná odpověď: Tokio. Pokaždé, když model během tréninku narazil na spojení Japonsko a hlavní město, objevil se stejný objekt. Asociace se tak opakovaným výskytem postupně upevňovala.

BERT správně odpověděl v 74,5 % případů, což je vysoká úspěšnost u modelu, který nikdy nebyl výslovně trénován na zodpovídání faktických otázek.

Vztahy N:1: více subjektů, jeden objekt

Zde více různých subjektů sdílí stejný objekt. Například: „Úředním jazykem na Mauriciu je ___.“ Správná odpověď je angličtina, ale angličtina je zároveň správnou odpovědí i pro desítky dalších zemí. Model už mnohokrát viděl vzorec (země → úřední jazyk → angličtina), takže dobře rozumí struktuře této odpovědi. Někdy ale místo správné odpovědi pro konkrétní subjekt zvolí objekt, který je statisticky nejčastější.

Přesnost klesla přibližně na 34 %. Model chápe kategorii, ale plete se v rámci jednotlivých možností.

Vztahy N:M: více subjektů, více objektů

Tady se situace komplikuje. Například: „Patrick Oboya hraje na pozici ___.“ Jeden fotbalista může podle kontextu nastupovat jako záložník, útočník nebo křídlo. A zároveň mnoho různých hráčů sdílí každou z těchto pozic. Vazba je tedy volná v obou směrech.

BERT zde dosahoval přesnosti jen kolem 24 %. Model obvykle odhadne správný typ odpovědi (uvede například herní pozici, nikoli město), ale nedokáže se spolehlivě rozhodnout pro konkrétní odpověď, protože tréninková data obsahují příliš mnoho konkurenčních signálů.

Co se stalo od roku 2019

Práce Fabia Petroni ukázala, že jazykové modely ukládají relační znalosti. Přirozeně následovala další otázka: kde přesně jsou tyto znalosti uloženy?

V roce 2022 publikovali Damai Dai a jeho kolegové z Microsoft Research studii Knowledge Neurons in Pretrained Transformers na konferenci ACL 2022. Představili metodu, jak v modelu BERT najít konkrétní neurony ve feed-forward vrstvách, které jsou zodpovědné za reprezentaci konkrétních faktů. Když tyto „znalostní neurony“ aktivovali, pravděpodobnost, že model správně vybaví daný fakt, vzrostla v průměru o 31 %. Když je naopak potlačili, klesla o 29 %.

Toto není metafora. Faktické vazby jsou skutečně zakódované v konkrétních neuronech modelu. Lze je identifikovat, a dokonce i měnit.

Později téhož roku publikovali Kevin Meng a jeho kolegové z MIT studii Locating and Editing Factual Associations in GPT na konferenci NeurIPS 2022. Tato práce rozvinula stejné myšlenky, ale aplikovala je na modely typu GPT, tedy architekturu, na které stojí ChatGPT, Claude a další AI asistenti, které lidé skutečně používají, když žádají o doporučení.

Tým Kevina Menga zjistil, že dokáže přesně určit konkrétní komponenty uvnitř modelu GPT, které se aktivují ve chvíli, kdy si model vybavuje fakt spojený s určitým subjektem.

Ještě důležitější bylo, že tyto faktické vazby dokázali změnit. Mohli upravit to, čemu model o určité entitě „věří“, aniž by museli přetrénovat celý systém.

To je zásadní i pro SEO specialisty. Pokud by asociace uvnitř těchto modelů byly pevně dané a neměnné, nebylo by co optimalizovat. Jenže nejsou. Formují se podle toho, co model během tréninku absorboval, a mění se při dalším přetrénování na nových datech. Webový obsah, technická dokumentace, komunitní diskuse i analytické reporty, které existují v době dalšího tréninku, určují, které značky si model spojí s konkrétními tématy.

Vývoj mezi lety 2019 a 2022 tedy vypadá takto: Fabio Petroni ukázal, že modely ukládají relační znalosti. Damai Dai ukázal, kde jsou uloženy. Kevin Meng ukázal, že je lze měnit.

A právě ten poslední bod by měl zajímat každého, kdo se snaží ovlivnit, jak AI doporučuje značky.

Co to znamená pro značky ve vyhledávání pomocí AI

Převeďme si tři typy vztahů podle Fabia Petroni do situací souvisejících s positioningem značek.

Značka typu 1:1: silná a jednoznačná asociace

Představte si Stripe a online platby. Tato asociace je konkrétní a napříč webem opakovaně posilovaná. Vývojářská dokumentace, fintech diskuse, startupové poradenské články i integrační návody: všechny spojují Stripe se stejným konceptem.

Když se někdo zeptá AI: „Jaká je nejlepší platforma pro zpracování plateb pro vývojáře?“, model vrátí Stripe s vysokou jistotou, protože tento relační vztah je jednoznačný.

To je přesně Petroniho vztah 1:1. Silný signál, žádný konkurenční šum.

Značka typu N:1: ztracená v kategorii

Teď si představte, že jste jedním z patnácti dodavatelů kyberbezpečnostních řešení spojovaných s „ochranou koncových zařízení“ (endpoint protection). Model tuto kategorii dobře zná. Viděl tisíce diskusí o endpoint protection. Když má ale doporučit konkrétního dodavatele, často sáhne po značce s nejsilnějším asociačním signálem.

Obvykle je to ta, která se nejčastěji objevuje v autoritativních kontextech: v analytických reportech, technických fórech nebo standardizační dokumentaci.

Pokud se vaše značka v konverzaci objevuje, ale není jasně odlišená, nacházíte se v situaci N:1. Model vás může občas zmínit, ale většinou upřednostní značku s nejsilnější asociací.

Značka typu N:M: všude a nikde

To je nejtěžší pozice. Velká softwarová firma působící v oblasti cloudové infrastruktury, poradenství, databází a hardwaru je spojována s mnoha tématy. Jenže každé z těchto témat je zároveň spojeno s řadou konkurentů. Asociace jsou slabší a rozptýlené v obou směrech.

Výsledek odpovídá tomu, co Petroni pozoroval u vztahů N:M: model vytvoří odpověď správného typu, ale nedokáže se spolehlivě rozhodnout pro konkrétní značku. Ta se v doporučeních AI objevuje jen občas, ale nikdy konzistentně pro konkrétní dotaz.

Tento vzorec často vídám při práci s enterprise software společnostmi. Investovaly značné prostředky do obsahu napříč mnoha tématy, ale nevytvořily dostatečně soustředěné a opakovaně posilované asociace, které model potřebuje, aby je dokázal s jistotou přiřadit ke konkrétnímu tématu.

Měření rozdílu

Pokud přijmeme předpoklad, a výzkum to potvrzuje, že doporučení AI jsou řízena relačními asociacemi uloženými ve vahách modelu, pak praktická otázka zní: Lze změřit, kde se vaše značka v tomto prostředí nachází?

AI Share of Voice je metrika, od které většina týmů začíná. Ukazuje, jak často se vaše značka objevuje v odpovědích generovaných AI. To je užitečné, ale je to jen výsledek bez diagnózy.

To, že vaše skóre Share of Voice činí 8 %, vám neřekne, proč je to právě 8 %, ani která konkrétní témata způsobují, že se neobjevujete v doporučeních tam, kde byste být měli.

Dvě značky mohou mít stejné skóre Share of Voice, ale z úplně odlišných strukturálních důvodů. Jedna může být spojována s mnoha tématy, ale u každého jen slabě. Druhá může mít silnou vazbu na dvě konkrétní témata, ale být neviditelná všude jinde. To jsou odlišné problémy, které vyžadují odlišné strategie.

Právě tuto mezeru má řešit metrika AI Topical Presence, kterou vyvinula společnosti Waikay. Místo měření toho, zda se vaše značka objeví, sleduje, s čím si ji AI spojuje a s čím ne.

Tato metrika zachycuje tři dimenze.

Depth (hloubka) měří, jak silně AI propojuje vaši značku s relevantními tématy, přičemž zohledňuje jejich důležitost.
Breadth (šířka) měří, s kolika klíčovými komerčními tématy ve vašem trhu AI vaši značku spojuje.
Concentration (koncentrace) sleduje, jak rovnoměrně jsou tyto asociace rozložené, a využívá k tomu Herfindahl-Hirschman Index převzatý z ekonomie hospodářské soutěže.

Značka s vysokou hloubkou, ale nízkou šířkou, je dobře známá pro několik oblastí, ale v mnoha dalších zůstává neviditelná. Značka se širokým pokrytím, ale vysokou koncentrací, je naopak křehká: jedna aktualizace modelu může její viditelnost výrazně změnit.

To se vrací zpět k Petroniho rámci. Pokud je vaše značka v některých tématech v pozici 1:1, ale jinde chybí, tematická přítomnost vám ukáže, kde jsou mezery. Pokud jste v situaci N:1 nebo N:M, pak vám může pomoci identifikovat, které asociace je potřeba posílit a u kterých témat už konkurence vybudovala dominantní postavení.

Od řazení stránek k budování asociací

Po 25 let bylo SEO o řazení stránek ve výsledcích vyhledávání. Samotný PageRank byl algoritmus na úrovni stránky; nápověda byla vždy v názvu (IYKYK… není potřeba mě opravovat…). I když se Google posouval směrem k entitám a znalostním grafům, praktická práce SEO stále stála na klíčových slovech, odkazech a on-page optimalizaci.

Viditelnost v AI vyhledávání ale vyžaduje něco jiného. Modely, které generují doporučení značek, načítají asociace vytvořené během tréninku, vzniklé ze vzorců spoluvýskytu napříč mnoha kontexty. Značka, která publikuje 500 blogových článků o „zero trust“, si nevytvoří stejnou sílu asociace jako značka, která se objevuje v odborných diskusích, analytických reportech a technických integracích.

To je fantastická zpráva pro značky, které na svých trzích odvádějí kvalitní práci. Samotné množství obsahu nevytváří silné relační asociace. Tréninkový proces modelu funguje jako filtr kvality: učí se ze vzorců napříč celým korpusem, ne z jedné konkrétní stránky.

Značka s reálnou odborností, o které se mluví v mnoha kontextech a mnoha hlasy, si vytvoří silnější asociace než značka, která jednoduše publikuje více obsahu.

Otázka, kterou je potřeba si položit, nezní: „Máme o tomto tématu stránku?“
Ale: „Kdyby někdo přečetl všechno, co AI během tréninku vstřebala o tomto tématu, působila by naše značka jako důvěryhodný účastník této konverzace?“

To je těžší otázka. Ale výzkum, který začal Petroniho testy doplňování vět v roce 2019, nám dal dostatečné pochopení mechanismu na to, abychom ho mohli měřit. A co lze měřit, lze také zlepšovat.

FAQ: 

Na čem AI skutečně staví doporučení značek?
AI doporučení stojí na relačních asociacích mezi značkami a tématy, které se vytvořily během tréninku na základě opakovaných kontextů.

Proč nestačí klasické SEO a klíčová slova?

Protože AI nehodnotí jen obsah stránek, ale celkovou sílu a konzistenci asociací značky napříč různými zdroji a kontexty.

Jaký je rozdíl mezi vztahy 1:1, N:1 a N:M u značek?

Liší se mírou jednoznačnosti asociací, přičemž 1:1 je silná a jasná vazba, zatímco N:1 a N:M jsou postupně slabší a více konkurenční.

 

Co je klíčové pro viditelnost značky v AI?

Klíčové je budování konzistentních, opakovaných a vícezdrojových asociací, které posilují tematickou přítomnost značky v daných oblastech.

Zdroj: searchengineland.com, searchenginejournal.com, marketingland.com, facebook.com, cpcstrategy.com

Autor: Vlastimil Malík

Foto zdroj: AI, pixabay.com

 

 

 

 

Profile picture for user Vlastimil Malík

Autor článku:
Vlastimil Malík

SEO manažer

Vlastimil se věnuje správě SEO projektů, copywritingu, tvorbě PR článků a marketingových textů. Má dlouholeté zkušenosti s vytvářením obsahu pro e-shopy, magazíny a weby. Postará se o vaše SEO a napíše pro vás odborné články na nejrůznější témata od fashionu až po pneumatiky. SEO se věnuje již od roku 2001.

Více článků z blogu

Používáme tyto nástroje

WordPress
PrestaShop
WooCommerce
Upgates
FastCentrik
Shoptet
GA4
Google Merchant
Google Tag Manager
Collabim
Marketing Miner
ahrefs
ecomail
Mailchimp