Dobré, špatné a ošklivé vlastnosti Groku, nového chatbota s umělou inteligencí Elona Muska

V neustále se vyvíjejícím světě technologií se Elon Musk svými projekty jen zřídkakdy postará o rozruch. Několik týdnů po své jasné výzvě k zastavení výcviku LLM schopnějších než GPT-4 Musk zahrál svůj charakteristický tah: udělal přesný opak toho, co hlásal. Vstupte do xAI – Muskova nejnovějšího mozkového dítěte – a Groka, jeho zbrusu nového LLM, který byl oznámen v sobotu.

Oznamujeme Grok!

Grok je umělá inteligence vytvořená podle vzoru Stopařova průvodce po Galaxii, takže má odpovídat téměř na cokoli a, což je mnohem těžší, dokonce navrhovat, na co se ptát!

Grok je navržen tak, aby na otázky odpovídal s trochou vtipu a má rebelské sklony, takže ho prosím nepoužívejte…

– xAI (@xai) 5. listopadu 2023

Podnik se dostal na titulní stránky novin nejen díky Muskově účasti, ale také díky hvězdné sestavě špičkových výzkumníků v oblasti umělé inteligence, které se společnosti podařilo získat z předních startupů a technologických gigantů. Společnost xAI, propagovaná s lákavou představou o umělé inteligenci, která má „porozumět světu“, zůstávala tajemně skryta ohledně toho, „jak“ a „co“ dělá… alespoň do minulého týdne.

Jde o další klasický Muskův tah, který zpochybňuje status quo, nebo jen o přehnaně populárního chatbota, který se veze na obrovské vlně popularity a humbuku kolem svých předchůdců?

Dobrý

Neustálý proud znalostí v reálném čase

Díky přístupu k celému obsahu Twitteru je Grok potenciálním převratným nástrojem. Jak zdůraznila společnost xAI, Grok bude disponovat „znalostmi o světě v reálném čase“ a bude prezentovat to, čemu výzkumníci v oblasti umělé inteligence říkají Reinforcement Learning from Human Feedback (RLHF), zpracovávat zprávy a rozmanité komentáře k aktuálním událostem.

Díky učení se o událostech z různých úhlů pohledu a přijímání poznámek komunity Twitteru – což jsou v podstatě anotace – bude Grok těžit z mnohostranného pohledu na svět.

Podle nedávných studií již lidé změnili své chování tak, že nejprve hledají zprávy na sociálních sítích, než se obrátí na hlavní média. Integrace služby Grok se službou Twitter by mohla tento proces dále urychlit a nabídnout uživatelům okamžité komentáře, kontext a – pokud bude dobře provedena – i kontrolu faktů na místě. Funkce znalostí v reálném čase, jak zdůraznila společnost xAI, zajišťuje, že společnost Grok zůstává v obraze, což jí umožňuje poskytovat včasné a relevantní reakce.

Zábavný režim: Elonův sen se stal skutečností

Zdá se, že vize Elona Muska o umělé inteligenci milující zábavu byla uvedena v život díky takzvanému „zábavnému režimu“ společnosti Grok. Tato funkce umožňuje LLM vytvářet vtipy, poskytovat vtipné, ale věcně přesné odpovědi a poskytovat uživatelům rozmarný a nenucený konverzační zážitek.

Jedním z problémů stávajících LLM, jako je ChatGPT, je, že někteří uživatelé mají pocit, že byly příliš upraveny, aby byla zajištěna politická korektnost, což potenciálně činí interakce méně organickými a spontánními. Některé lokalizované LLM navíc nejsou vhodné pro dlouhodobé interakce. Grok se svým zábavným režimem slibuje, že tuto mezeru zaplní a potenciálně poslouží jako poutavé zpestření času pro ty, kteří se chtějí odreagovat.

Grok má přístup k informacím v reálném čase prostřednictvím platformy , což je oproti jiným modelům obrovská výhoda.

Je také založen & miluje sarkasmus. Netuším, kdo by to takhle mohl řídit ‍♂️ pic.twitter.com/e5OwuGvZ3Z

– Elon Musk (@elonmusk) 4. listopadu 2023

Tento koncept není úplně nový, protože podobnou službu nabízí i Poe od společnosti Quora se svými vyladěnými chatboty, z nichž každý se může pochlubit jedinečnou osobností. Když je však tato funkce zakomponována do LLM s možnostmi Groku, posouvá to zážitek na novou úroveň.

Nativní přístup k internetu

Jednou z dalších odlišností systému Grok je možnost přístupu k internetu bez nutnosti použití zásuvného modulu nebo jiného modulu.

Přesný rozsah jeho možností procházení sice ještě není vyjasněn, ale představa je lákavá. Představte si modul LLM, který dokáže zlepšit faktickou přesnost, protože dokáže v reálném čase křížově porovnávat data. Ve spojení s přístupem k obsahu Twitteru by Grok mohl způsobit revoluci v interakci uživatelů s umělou inteligencí, protože by věděli, že informace, které dostávají, nejsou založeny pouze na již existujících tréninkových datech, ale že jsou neustále aktualizovány a ověřovány.

Multitasking

Grok je údajně schopen multitaskingu, což uživatelům umožňuje vést několik konverzací současně. Uživatelé mohou zkoumat různá témata, čekat na odpověď v jednom vlákně a pokračovat v jiném.

Chatbot také nabízí větvení konverzací, což uživatelům umožňuje proniknout hlouběji do konkrétních oblastí, aniž by narušili hlavní diskusi, a nabízí vizuálního průvodce všemi větvemi konverzace, což uživatelům usnadňuje navigaci mezi tématy.

Grok také nabízí vestavěný editor markdown, který uživatelům umožňuje stahovat, upravovat a formátovat odpovědi Grokupro pozdější použití. Tento nástroj v kombinaci s větvením zajišťuje, že uživatelé mohou pracovat s konkrétními větvemi konverzace a bezproblémově se do nich znovu zapojovat.

Toto jsou některé z funkcí uživatelského rozhraní aplikace Grok. Za prvé umožňuje provádět více úloh. Můžete spustit několik souběžných konverzací a přepínat mezi nimi v průběhu jejich průběhu. pic.twitter.com/aXAG0M2oPF

– Toby Pohlen (@TobyPhln) November 5, 2023

Minimální cenzura: svobodně mluvící UI

Vize Elona Muska pro Grok byla jasná: umělá inteligence, která se neostýchá říkat své digitální názory.

Ačkoli všichni významní chatovací roboti s umělou inteligencí mají ochranné prvky, které zabraňují potenciálnímu poškození nebo dezinformacím, někdy to může působit omezujícím dojmem. Uživatelé zaznamenali případy, kdy modely jako ChatGPT, Llama a Claude mohou zadržovat odpovědi a vybírat si opatrnost, aby se vyhnuli potenciálnímu urážce. To však může odfiltrovat odpovědi, které jsou neškodné nebo skutečně hledané.

Grok má v odpovědích větší volnost, a tak může potenciálně nabídnout autentičtější a neomezenější konverzační zážitek. Jak zdůraznila společnost xAI, design systému Grok mu umožňuje řešit pikantní otázky, které by jiné systémy umělé inteligence mohly obcházet.

Představujeme Grok!

Grok je umělá inteligence vytvořená po vzoru Stopařova průvodce po Galaxii, takže je určena k tomu, aby odpovídala téměř na cokoli a, což je mnohem těžší, dokonce navrhovala, jaké otázky položit!

Grok je navržen tak, aby na otázky odpovídal s trochou vtipu a má rebelské sklony, takže ho prosím nepoužívejte…

– xAI (@xai) 5. listopadu 2023

Je zřejmé, že tato umělá inteligence nabízí jedinečnou kombinaci informací v reálném čase, humoru, přesnosti a svobody. Jako u každé inovace je však třeba vzít v úvahu i výzvy a potenciální úskalí.

Špatné

Rychlý vývoj a omezené školení

Rychlý vývoj systému Grok už od počátku vyvolával obavy. Jak uvedla společnost xAI, „Grok je stále velmi raný beta produkt – to nejlepší jsme mohli udělat s dvouměsíčním školením“. Ve světě LLM zní dva měsíce a 33 miliard parametrů jako kapka v moři.

Pro představu, společnost OpenAI transparentně informovala o svém vývojovém procesu a zmínila: „Strávili jsme šest měsíců iterativním slaďováním GPT-4.“. Rozdíly v časových lhůtách vývoje naznačují, že vývoj systému Grok byl možná uspěchaný, aby se svezl na vlně zájmu o umělou inteligenci.

Společnost x.AI navíc zůstává skoupá na slovo ohledně rozsahu hardwaru použitého při výcviku Groku, což ponechává prostor pro spekulace.

Vše o parametrech

Pro nezasvěcené představují parametry v LLM množství informací nebo znalostí, které může model obsahovat. Udávají efektivní mozkovou kapacitu UI, určují její schopnost zpracovávat a generovat informace. Grok se svými 33 miliardami parametrů může na první pohled znít impozantně.

V konkurenčním prostředí LLM je to však jen další hráč. Ve skutečnosti by jeho počet parametrů nemusel stačit na napájení složitých podnikových potřeb a vysoce kvalitních výstupů, které titáni jako ChatGPT, Claude a Bard stanovili jako zlatý standard.

Částečně je tento nízký počet parametrů důvodem, proč Grok nedokáže porazit ostatní mainstreamové modely v klíčových benchmarcích, jako je HumanEval nebo MMLU:

Zdroj: x.AI

Kromě počtu parametrů je zde také otázka zpracování kontextu – v podstatě kolik informací může chatbot AI pochopit v jednom vstupu. V této oblasti není Grok nijak zvlášť působivý. Podle xAI rozumí Grok 8 192 tokenům kontextu, ale GPT-4 jich žongluje neuvěřitelných 32 000 a Claude jde ještě dál s až 100 000 tokeny. Nový GPT-4 Turbo od OpenAI dosahuje kontextového okna 128 000 tokenů.

Cena inovace

Cena je rozhodujícím faktorem při hodnocení hodnoty jakéhokoli produktu a Grok není výjimkou. Chatbot bude k dispozici uživatelům, kteří budou ochotni platit 16 dolarů měsíčně za privilegium interakce s ním.

S bezplatnými nabídkami, jako je Claude 2 a ChatGPT vybavený GPT-3.5 Turbo, může být Grok těžko prodejný – zejména s ohledem na to, že tyto bezplatné modely byly vyzdvihovány pro svou přesnost a v některých srovnávacích testech již Grok překonaly.

Navíc i nejsilnější LLM na bloku, GPT-4, slibuje, že bude lepší než Grok, a navíc má výhodu, že je široce dostupný, multimodální a výkonný.

Asistent @xAI Grok AI bude poskytován jako součást služby Premium+, takže doporučuji se k ní přihlásit.

Stačí 16 dolarů měsíčně přes web. https://t.co/wEEIZNjEkp

– Elon Musk (@elonmusk) 4. listopadu 2023

Mohlo by být zavedení služby Grok do značné míry strategickým krokem, jehož cílem je zvýšit počet předplatných služby Twitter Blue, a tím posílit tok příjmů společnosti Twitter?

Tyto obavy zdůrazňují problémy společnosti Grok při jejím prosazování jako významného hráče v oblasti LLM. A jeho nevýhody nekončí u cenovky.

The Ugly

Vynechání fikce

Založení LLM na fiktivní postavě z populárního románu je bezpochyby kreativní volbou. Kouzlo fiktivní osobnosti může být sice lákavé, ale ve světě, který stále více spoléhá na přesné informace, představuje neodmyslitelné riziko. Uživatelé, kteří se na umělou inteligenci obracejí s vážnými dotazy nebo radami, se mohou dostat do rozporu se systémem, který má napodobovat komediální postavu.

Navíc s tím, jak se stírá hranice mezi fikcí a realitou, existuje obava, že si uživatelé nesprávně vyloží hravé nebo satirické odpovědi jako faktické informace. V digitálním věku, kdy je každá informace rozebírána a sdílena, by důsledky takového mylného chápání mohly být rozsáhlé. Zvláště když se do hry zapojí více jazyků.

Ačkoli humor a vtip mají své místo, je nutné najít rovnováhu, zejména když uživatelé hledají kritické postřehy. Upřednostňování humoru před přesností může pobavit, ale také podkopává samotnou podstatu toho, co by měl LLM nabízet: spolehlivé informace.

Přehnaně kompromisní a nedostatečné

Elon Musk svými velkolepými sliby o Groku připravil půdu pro nebetyčná očekávání. Hlubší zkoumání odhaluje potenciální nesoulad mezi humbukem a realitou. Skutečnost, že tradiční tréninkové metody LLM jsou omezeny svými tréninkovými daty, podtrhuje zásadní omezení: nemohou se skutečně pustit do oblasti „super AI“.

Trénink Grok se svými 33 miliardami parametrů a několika měsíci vývoje se zdá být ve srovnání s ostatními giganty LLM trpasličí. I když myšlenka hravé fiktivní osobnosti zní lákavě, očekávat od ní převratné výsledky pomocí standardních tréninkových metod může být přitažené za vlasy.

Komunitě zabývající se umělou inteligencí není přehánění cizí, ale vzhledem k rychlému pokroku v této oblasti je pro uživatele zásadní prosívat humbuk. Dosáhnout statusu „super AI“ je monumentální výzva a je nepravděpodobné, že by se Grok se svou současnou konfigurací a tréninkem kvalifikoval.

Ostatně, aby Elon Musk dokázal sílu Groku, srovnal jeho konverzačního chatbota s malým LLM vycvičeným pro kódování. Stačí říct, že to nebyl férový souboj.

Příklad Grok vs. typický GPT, kde Grok má aktuální informace, ale ostatní ne pic.twitter.com/hBRXmQ8KFi

– Elon Musk (@elonmusk) 5. listopadu 2023

Hrozba dezinformací

LLM jsou mocné, ale nejsou neomylné. Při absenci přísných standardů se rozeznávání faktů od fikce stává herkulovským úkolem. Nedávná historie nabízí varovné příběhy, jako jsou chatboti vyškolení na datech ze serveru 4chan nebo dokonce Tay, dřívější chatbot od Microsoftu, kterému bylo umožněno komunikovat na Twitteru. Tito boti nejenže chrlili nenávistné projevy, ale také se přesvědčivě vydávali za skutečné osoby, čímž oklamali obrovské online publikum.

Tento týden byl na AI zveřejněn model @huggingface, který produkuje škodlivé + diskriminační texty a na internetu již zveřejnil přes 30 tisíc odporných komentářů (tvrdí jeho autor).

Tento experiment by nikdy neprošel komisí pro výzkum na lidech etika Zde jsou má doporučení.

1/7 https://t.co/tJCegPcFan pic.twitter.com/Mj7WEy2qHl

– Lauren Oakden-Rayner ️‍⚧️ (@DrLaurenOR) 6. června 2022

Tento flirt s dezinformacemi není ojedinělý. Vzhledem k tomu, že image Twitteru dostala od Elonova převzetí zásah, mohou existovat obavy o schopnost společnosti Grok konzistentně poskytovat přesné informace. LLM se občas stávají obětí halucinací, a pokud jsou tato zkreslení konzumována jako pravdy, mohou být následky alarmující.

Potenciál dezinformací je tikající časovanou bombou. Vzhledem k tomu, že se uživatelé stále více opírají o poznatky umělé inteligence, mohou dezinformace vést k chybnému rozhodování. Aby byl Grok důvěryhodným spojencem, musí postupovat opatrně a zajistit, aby jeho hravé chování nezastíralo pravdu.

Chybí multimodální schopnosti?

V rozvíjejícím se světě umělé inteligence působí Grokův přístup založený pouze na textu jako relikt minulosti. Od uživatelů se sice očekává, že budou za služby společnosti Grok platit, ale mohou se oprávněně ptát proč, zejména když ostatní LLM nabízejí bohatší multimodální zážitky.

Například GPT-4-v již udělal v multimodální oblasti velký pokrok a může se pochlubit schopností slyšet, vidět a mluvit. Podobnou sadu funkcí slibuje i připravovaný model Gemini od společnosti Google. Na tomto pozadí se nabídka společnosti Grok zdá být nedostatečná a vyvolává další otázky ohledně její hodnoty.

Na trhu panuje konkurence a uživatelé jsou stále náročnější. Pokud si chce Grok vydobýt místo, musí nabídnout něco skutečně výjimečného. Za současného stavu, kdy konkurence nabízí rozšířené funkce a lepší přesnost – často zdarma – má společnost Grok co dělat, aby se prosadila.

Závěr

Spuštění společnosti Grok vyvolalo nadšení, ale také značnou dávku skepse. Její přístup založený na holém MVP (minimum viable product) umožňuje rychlé iterace a vylepšování na základě zpětné vazby od uživatelů. Konkurence ze strany gigantů v oblasti umělé inteligence, kteří disponují mnohem většími zdroji, však představuje těžký boj.

Aby Grok uspěl, potřebuje schopnosti, které jsou jak nové, tak užitečné. Pouhá zábavná hodnota na přeplněném trhu stačit nebude. Lidé z AI se nenechají rozptýlit roztomilými psími memy.

Osud společnosti Grok nakonec závisí na vyvážení inovace a praktičnosti. I když je zdravá skepse na místě, úplně ho odepsat by mohlo být předčasné. Grok může být průkopníkem nových hranic nebo skončit jako poznámka pod čarou ve vývoji umělé inteligence. Ať tak či onak, jeho netradiční původ zaručuje, že Grok bude zajímavou kapitolou v rozvíjejícím se příběhu umělé inteligence.