Nový vyhledávač na obzoru
V nedávné době bylo oznámeno, že OpenAI pracuje na novém vyhledávači, který by přímo napadl Google. Jenže ve zprávě chybí podstatné podrobnosti. A to vyvolává otázky, zda OpenAI vytváří samostatný vyhledávač, nebo má toto oznámení zcela jiný důvod.
Co stojí ve zprávě o vyhledávání na webu OpenAI
Zpráva zveřejněná na The Information uvádí, že OpenAI vyvíjí produkt „Web Search“, který bude přímým konkurentem Googlu. Důležitým detailem zprávy je, že bude zčásti poháněn Bingem – vyhledávačem od společnosti Microsoft. Kromě těchto bodů zpráva neobsahuje žádné další podrobnosti. Nedostalo se odpovědi ani na to, zda se bude jednat o samostatný vyhledávač, nebo bude pouze integrovaný do ChatGPT.
Všechny zprávy však nezapomínají uvádět, že půjde o přímou výzvu pro Google. Takže začněme:
- Představuje OpenAI výzvu pro Google?
Ve zprávě jsme se dozvěděli, že OpenAI používá pro vyhledání vyhledávač Bing, dále kombinaci Bing Search a GPT-4 plus samozřejmě něco málo pro koordinaci mezi těmi dvěma.
Pokud se nad těmito informacemi zamyslíme, v tomto scénáři OpenAI nedělá vývoj své vlastní technologie indexování vyhledávání. Používá k tomu právě Bing.
Co OpenAI zbývá, aby vytvořil vyhledávač? Je třeba vymyslet, jak vyhledávací rozhraní interaguje s Bingem a GPT-4.
A tohle už Bing vyřešil použitím toho, co společnost Microsoft nazývá orchestrační vrstvou. Bing Chat používá generování rozšířeného vyhledávání (RAG) pro zlepšení odpovědí přidáním dat vyhledávání na webu, která se použijí jako kontext pro odpovědi, které vytváří GPT. Další informace o tom, jak funguje RAG a orchestrace, najdete v hlavní řeči technologického ředitele společnosti Microsoft –Kevina Scotta na akci Microsoft Build z roku 2023 ve 32. minutě.
Jestliže OpenAI pracuje na výzvě pro Google Search, co přesně musí OpenAI udělat? A co Microsoft ještě udělá s Bing Chatem? Bing je moderní, zkušená a vyzrálá vyhledávací technologie. To je odbornost, kterou OpenAI zatím nemá. Může být tedy OpenAI pro Google výzvou? Pravděpodobnější odpovědí je, že Bing vyzývá Google prostřednictví OpenAI jako proxy.
- Má OpenAI dynamiku, aby vyzvala Google?
Pravdou je, že ChatGPT je jednou z nejrychleji rostoucích aplikací všech dob. V současnosti má kolem 180 milionů uživatelů a za dva měsíce dosáhla toho, co trvalo Facebooku a Twitteru roky.
Navzdory tomuto náskoku je náskok Googlu pro OpenAI velký. Vezměte si, že Google má skoro 4 miliardy uživatelů po celém světě. To je oproti 180 milionům velký rozdíl, co říkáte?
Pokud například všech 180 milionů uživatelů OpenAI provede každý den v průměru 4 vyhledávání, denní počet vyhledávání by mohl dosáhnout 720 milionů. Jenže statistiky jsou neúprosné. Ty odhadují, že na Googlu se zobrazí 6,3 milionu vyhledávání za minutu, což odpovídá více než 9 miliardám vyhledávání za den.
Jestliže má OpenAI Googlu konkurovat, bude muset nabídnout vysoce užitečný produkt, který přiláká uživatele, aby jej používal pravidelně. Například společnosti Apple a Google mají v ekosystému mobilních zařízení zaujaté publikum, které je do svého každodenního života pravidelně začleňuje. A to jak v práci, tak doma. Je naprosto zřejmé, že konkurenci nestačí pouze vytvořit nový vyhledávač.
Jak může reálným pohledem OpenAI dosáhnout takové úrovně užitečnosti a všudypřítomnosti?
OpenAI aktuálně čelí těžké bitvě proti Googlu, ale také Applu a Microsoftu. Pokud započítáme aplikace a další zařízení pro internet, přidáme Amazon a do tohoto seznamu začleníme další konkurenty, kteří jsou každý den začlenění do běžného života miliard uživatelů, má co dělat.
OpenAI nemá sílu spustit vyhledávač, který by konkuroval Googlu. Nemá totiž ekosystém, který by podporoval integraci do životů uživatelů.
- OpenAI postrádá odbornost na vyhledávání informací
Vyhledávání ve výzkumných dokumentech a patentech je formálně označováno jako vyhledávání informací (IR). Žádné hledání v úložišti výzkumných prací v Arxiv.org neobjeví papíry autorů výzkumníků OpenAI související s vyhledáváním informací.
To samé můžeme říci o vyhledávání patentů souvisejících s vyhledáváním informací (IR). Seznam výzkumných prací OpenAI také postrádá studie související s vyhledáváním informací.
Rozhodně to neznamená, že by byla OpenAI tajná. OpenAI má dlouhou historii publikování výzkumných prací o technologiích, které vyvíjejí. Ale výzkum IR neexistuje. Takže pokud se chce OpenAI stát konkurentem Googlu, kde vidíme stoupat dým z tohoto ohně?
Aktuálně nejsou žádné známky toho, že by OpenAI vyvíjel nějaké vyhledávání, nebo že by dokonce koketoval s vývojem budování nového vyhledávače. Nic takového tam zjevně není.
- Je vyhledávač OpenAI projektem společnosti Microsoft?
Existují důkazy, že Microsoft zkoumá, jak používat LLM jako součást vyhledávače. Všechny další výzkumné práce jsou klasifikovány jako patřící do oblasti umělé inteligence, výpočetní techniky přirozeného jazyka a získání informací (aka vyhledávání).
Zde je několik výzkumných prací z roku 2024:
- Extrakce strukturovaných entit pomocí velkých jazykových modelů:
Tento výzkumný článek zjišťuje způsob, jak extrahovat strukturované informace z nestrukturovaného textu (jako jsou například internetové stránky).
V praxi to znamená převést webovou stránku (která představuje nestrukturovaná data) do strojově srozumitelného formátu (což jsou strukturovaná data).
- Vylepšení lidské anotace: Využití velkých jazykových modelů a efektivní dávkové zpracování:
Jedná se o použití umělé inteligence pro klasifikace vyhledávacích dotazů.
- Zlepšení vkládání textu pomocí velkých jazykových modelů:
Tento výzkumný dokument zjišťuje, jak získat vysoce kvalitní vkládání textu, které je možné použít pro vyhledávání informací (IR). Vkládání textu je odkaz na vytvoření reprezentace textu způsobem, který mohou algoritmy použít k pochopení sémantických významů a vztahů mezi slovy.
Výše uvedený výzkumný dokument vysvětluje použití:
Textové vložení není nic jiného než vektorové reprezentace přirozeného jazyka. Ty kódují jeho schematické informace.
Jsou široce používány v různých úlohách zpracování přirozeného jazyka (NLP), jako je odpovídání na otázky, vyhledávání informací (IR) a další.
V oblasti IR se první fáze vyhledávání mnohdy spoléhá na vkládání textu, aby bylo možné vyvolat malou sadu kandidátských dokumentů z rozsáhlého množství pomocí přibližných technik vyhledávání u nejbližších sousedů.
Samozřejmě existuje více výzkumů společnosti Microsoft, které se týkají vyhledávání, ale jsou to konkrétně ty, které se týkají vyhledávání spolu s velkými jazykovými modely – jako je například GPT-4.5.
Stopy těchto malých drobečků pak vedou přímo k Microsoftu jako k technologii pohánějící jakýkoli vyhledávač, který má OpenAI plánovat. Pokud je tato fáma pravdivá.
- Má ukrást pozornost?
Fáma o tom, že má OpenAI spustit konkurenční vyhledávač, byla zveřejněna 14. února. Hned druhý den, 15. února, Google oznámil spuštění Gemini 1.5. Bylo to po tom, co 8. února oznámil Gemini Advanced.
Může být náhoda, že oznámení OpenAI druhý den zcela zastínilo oznámení Gemini? Toto načasování je až neuvěřitelné. V tuto chvíli je nový vyhledávač OpenAI fámou.
Zdroj: marketingland.com, facebook.com, cpcstrategy.com
Autor: Kristýna Franclová
Foto zdroj: pixabay.com