Home » Claude 2 je venku – jak si AI chatbot společnosti Anthropic vede ve srovnání s ChatGPT a Google Bard?

Claude 2 je venku – jak si AI chatbot společnosti Anthropic vede ve srovnání s ChatGPT a Google Bard?

by Patricia

Anthropic, firma zabývající se umělou inteligencí, kterou založili bývalí výzkumní pracovníci OpenAI, představila aktualizovaného chatbota Claude 2, který se zaměřuje na konkurenty, jako jsou ChatGPT a Google Bard.

Jeho nástupce, který přichází pouhých pět měsíců po debutu Clauda, se může pochlubit delšími odpověďmi, vyladěným uvažováním a vynikajícím výkonem, díky němuž dosáhl působivých výsledků ve zkouškách čtení a psaní GRE.

Claude 2 je charakterizován jako výkonná umělá inteligence schopná zpracovat až 100 000 tokenů, což zhruba odpovídá 75 000 slovům, v jediné výzvě. To je dramatický skok oproti předchozímu limitu 9 000 tokenů, který Claude představoval, což představuje jedinečnou výhodu: schopnost umělé inteligence poskytovat odpovědi ve větším kontextu a vylepšeným způsobem.

Nový model dosáhl významných pokroků v několika oblastech, včetně práva, matematiky a kódování, hodnocených prostřednictvím standardizovaných testů. Podle společnosti Anthropic dosáhl Claude 2 v části advokátní zkoušky s výběrem odpovědí 76,5 % (GPT-3.5 dosáhl 50,3 %) a ve zkouškách čtení a psaní GRE dosáhl vyššího skóre než 90 % uchazečů o vysokoškolské studium. Claude 2 také dosáhl 71,2 % v testu kódování v jazyce Python Codex HumanEval a 88,0 % v matematických úlohách GSM8k pro základní školy, což odhaluje jeho pokročilé výpočetní schopnosti.

Jak uvádí TCN, Claude od společnosti Anthropic je navržen s jedinečnou „ústavou“, souborem pravidel inspirovaných Všeobecnou deklarací lidských práv, která mu umožňuje sebezdokonalování bez zpětné vazby od člověka, identifikaci nesprávného chování a přizpůsobení vlastního chování.

Jak si ale stojí proti dvěma vládcům kopců, ChatGPT a novému Bardovi od Googlu? Začněme tím, jak dobře si stojí ve specifikacích.

Cena:

  • ChatGPT: Pro ty, kteří používají verzi GPT-3.5, je zdarma. Ti, kteří chtějí používat výkonnější verzi se systémem GPT-4, budou muset zaplatit 20 USD měsíčně za verzi ChatGPT Plus.
  • Claude: Zdarma.
  • Bard:

zdarma

Dostupnost:

  • ChatGPT: Je nejrozšířenější ze všech tří.
  • Bard: Je dostupný v méně zemích než ChatGPT.
  • Claude: Dočasně je k dispozici v USA a Velké Británii.

Soukromí:

  • ChatGPT: Umožňuje uživatelům mazat jejich interakce. Nepodporuje procházení přes VPN.
  • Bard: Má možnost automatického smazání interakcí za 18 měsíců. Neumožňuje uživatelům obnovit předchozí interakce. Podporuje sítě VPN, díky čemuž je prakticky dostupný v jakékoli části světa a obchází politická omezení.
  • Claude: Umožňuje uživatelům mazat jejich konverzace. Podporuje procházení přes VPN.

Podporované jazyky:

  • ChatGPT: Podporuje více než 80 jazyků.
  • Bard: Podporuje angličtinu, japonštinu a korejštinu.
  • Claude: Podporuje několik rozšířených jazyků, mimo jiné angličtinu, španělštinu, portugalštinu, francouzštinu, mandarínštinu a němčinu. Pokud jazyk nerozpozná (nebo vstup obsahuje mnoho gramatických chyb), poskytne úvodní frázi a poté odpoví v angličtině.

Zpracování kontextu:

  • ChatGPT: Bezplatná verze podporuje 7 096 tokenů kontextu, ChatGPT Plus (GPT-4) podporuje 8 192 tokenů. OpenAI nabízí verzi, která podporuje 32K tokenů, ale ChatGPT ji nepoužívá.
  • Bard: Podporuje 8 196 tokenů kontextu.
  • Claude: Podporuje 100 000 tokenů kontextu – nejde o překlep.

Funkce:

  • ChatGPT: Verze zdarma nemá žádné další funkce. GPT Plus nabízí úložiště zásuvných modulů, interpret kódu a funkci dočasně pozastaveného procházení webu, kterou pohání Microsoft Bing. Poskytuje podporu rozhraní API.
  • Bard: Chatbot je stále v experimentální fázi, ale bude mít obchod se zásuvnými moduly a integraci se službou Google Suite. Poskytuje omezený přístup ke svému rozhraní API.
  • Claude: Chatbot může být přidán do služby Slack a zvládne různé úkoly, jako je shrnutí vláken, poskytování návrhů, brainstorming atd. Poskytuje podporu rozhraní API.

Bitva podnětů: ChatGPT vs. Bard vs. Claude

TCN použil stejnou výzvu k porovnání výsledků dosažených třemi chatboty.

Dorozumění v cizích jazycích

Nejprve jsme se zeptali na význam běžné španělské slangové fráze. Claude se ukázal být při vysvětlování pečlivější a přesnější, ChatGPT poskytl dostatečně dobré vysvětlení, ale Bard odmítl odpovědět s odůvodněním, že neumí španělsky. Jakmile jsme však naši výzvu přeformulovali z „co to znamená“ na „jaký je anglický ekvivalent“, poskytl lepší odpověď než ChatGPT, i když méně obsáhlou než Claude AI.

Odpověď poskytl Claude 2.

Odpověď poskytl Claude 2.


Odpověď poskytl ChatGPT.

Odpověď poskytl ChatGPT.


Odpověď poskytl Google Bard.

Odpověď poskytl Google Bard.

Aktuální informace

Poté jsme se modelů zeptali na dnešní cenu Bitcoinu. Tím se nejen testují funkce procházení webu, ale také se měří, kolik informací každý z nich poskytuje na základě jedné objednávky.

ChatGPT se nezdařil. Není připojen k internetu, takže nemůže poskytovat aktuální informace. Claude také nemá připojení k internetu. Na rozdíl od ChatGPT však halucinoval odpověď s nesprávnými informacemi. Pokud by se uživatel na něco zeptal za předpokladu, že Claude má připojení k internetu, dostal by nesprávnou odpověď, která by se tvářila jako správná. Google Bard poskytl správné informace.

Odpověď poskytl ChatGPT.

Odpověď poskytl ChatGPT.


Odpověď poskytl Claude 2.

Odpověď poskytl Claude 2.


Odpověď poskytl Google Bard.

Odpověď poskytl Google Bard.

Obsluha kontextu

Dále modely podrobíme zkoušce jejich schopnosti zpracovávat velké kusy textu. Jako příklad jsme použili Bibli a zkopírovali jsme celý text od Genesis 1:1 po Exodus 25:39 (téměř 62 tisíc slov). Poté jsme položili velmi konkrétní otázku z příběhu uvedeného v textu.

Jediným modelem, který byl schopen poskytnout odpověď, byl podle očekávání Claude. Zpracování výzvy mu trvalo přibližně 2 minuty, ale poskytl přesnou odpověď. Použili jsme specifické značky, abychom se ujistili, že nepodvádí a skutečně analyzuje text, a ukázalo se, že se úkolu zhostil.

Odpověď poskytl Claude 2.

Odpověď poskytl Claude 2.

Neverbální schopnosti

Nakonec jsme modely požádali, aby zvládly některé matematické úlohy. Umělá inteligence LLM k tomu není příliš uzpůsobena a ChatGPT Plus s GPT-4 je se svým interpretem kódu pravděpodobně nejlepší volbou ze všech tří. Nicméně jsme otestovali všechny tři modely a požádali je, aby vytvořily splátkový plán pro osobu, která se snaží vyrovnat své dluhy na kreditní kartě. Modely jsme také požádali, aby seřadily, které karty je třeba používat a kterým se vyhnout.

Nejkomplexnější odpovědi z hlediska plánu poskytl Claude. Udělal však chybu a doporučil nám, abychom upřednostnili výdaje na kartě s nejvyšší RPSN.

Odpověď poskytl Claude 2.

Odpověď poskytl Claude 2.


Převodník kódu ChatGPT poskytl odpověď, kde přeplatíme jednu z karet, což není úplně užitečné, pokud má někdo dluhy na jiných kartách.

Odpověď poskytl ChatGPT pomocí interpretu kódu.

Odpověď poskytl ChatGPT pomocí interpretu kódu.


GPT 3.5 neposkytoval přesné výsledky a požadoval po nás více peněz, než jsme měli ve skutečnosti k dispozici.

Odpověď poskytl ChatGPT.

Odpověď poskytl ChatGPT.


Bard byl poměrně obecný. Šel bezpečnou cestou a neuvedl žádná čísla, v podstatě popsal to, co je známé jako metoda dluhové laviny.

Odpověď poskytl Google Bard.

Odpověď poskytl Google Bard.

Silné a slabé stránky

Claude 2:

  • Silné stránky: Claude 2 má působivou schopnost zpracovávat velké kontexty až do 100 000 tokenů. Vykazuje vynikající výkon v různých oblastech, jako je právo, matematika a kódování, a může se pochlubit vysokými výsledky ve standardizovaných testech. Dokáže se sám zlepšovat a přizpůsobovat bez zpětné vazby od člověka a podporuje procházení VPN. Chatbota lze také přidat do služby Slack pro zpracování úkolů a poskytuje podporu API.
  • Slabé stránky: Dočasně je k dispozici pouze v USA a Velké Británii. Claude 2 postrádá připojení k internetu a při dotazu na aktuální reálná data může poskytnout nesprávné informace. Ve složitých úlohách se může dopustit chyb a znít o tom velmi přesvědčivě.

ChatGPT:

  • Silné stránky: ChatGPT je ze všech tří modelů nejrozšířenější, podporuje více než 80 jazyků. Ve verzi ChatGPT Plus nabízí také podporu rozhraní API a úložiště zásuvných modulů.
  • Slabé stránky: Ve srovnání s Claudem 2 má omezené možnosti práce s kontextem. Verze zdarma nenabízí další funkce a je mnohem omezenější a méně kvalitní než placená verze. Jeho funkce procházení webu je dočasně pozastavena a nemůže poskytovat údaje v reálném čase. V některých složitých úlohách může generovat nevhodné výsledky.

Google’s Bard:

  • Silné stránky: Bard podporuje procházení přes VPN. Díky připojení k internetu dokáže poskytovat data v reálném čase. Bard také plánuje integraci se službou Google Suite a nabízí obchod se zásuvnými moduly.
  • Slabé stránky: Bard podporuje méně jazyků než ChatGPT. Jeho přístup k rozhraní API je omezený a jeho možnosti práce s kontextem jsou menší než u Claude 2. Odpovědi Barda mohou být obecné a v některých složitých úlohách nepomáhají – což je rozumný kompromis, pokud chce uživatel snížit riziko halucinací.

Závěr

Když je nyní v oblasti AI LLM a chatbotů k dispozici více možností, nemusí se člověk nutně stát fanouškem ChatGPT nebo vstoupit do tábora, kde je pouze Google.

Pokud váháte, zda zaplatit 20 dolarů za ChatGPT Plus, zvažte použití Claude. Nabízí srovnatelné funkce jako GPT-4 a pravděpodobně bude poskytovat lepší výstupy než GPT-3.5, což je verze dostupná v bezplatném ChatGPT – a pro většinu uživatelů bude lepší volbou než Bard Google. Další funkcí Claude je schopnost analyzovat soubory PDF a soubory s mnoha příponami. Soubory můžete do programu jednoduše přetáhnout, podobně jako je tomu u placených doplňků dostupných v rámci předplatného GPT Plus. Než se tedy rozhodnete zaplatit za ChatGPT 4, možná budete chtít Claude vyzkoušet. Potenciálně by vám mohl ušetřit nějaké peníze.

Každá z možností má však své silné a slabé stránky, díky nimž je každý z botů atraktivnější pro konkrétní potřeby. Claude zvládá velké množství dat, ale nemusí být nejlepší volbou pro úlohy vyžadující data v reálném čase. ChatGPT je kreativnější, což je ideální pro úlohy vyžadující podporu specifických jazyků (a jeho obchod s doplňky je opravdu dobrý, pokud jste ochotni zaplatit cenu). Na druhou stranu je Bard věcnější, přesnější a využívá své připojení k internetu, ale nemusí být nejlepší pro kreativní úlohy.

Nakonec, proč si vybrat jeden z nich? Nemusíte se rozhodovat, který z nich je lepší – můžete používat všechny.

Related Posts

Leave a Comment