Anthropic vylepšuje Claude o téměř dvojnásobek schopností GPT-4 Turbo

Anthropic právě vydal Claude 2.1, velký jazykový model (LLM), který nabízí kontextové okno s 200 000 tokenů – vlastnost, která překonává nedávno oznámený kontext 120K GPT-4 Turbo od OpenAI.

Tato strategická verze přináší kontextové schopnosti, které jsou téměř dvojnásobné oproti nejbližšímu soupeři, a je výsledkem rozšířeného partnerství se společností Google, které startupu umožnilo použít její nejpokročilejší jednotky Tensor Processing Units.

„Náš nový model Claude 2.1 nabízí špičkové kontextové okno s 200 tisíci tokenů, dvojnásobné snížení míry halucinací, systémové výzvy, používání nástrojů a aktualizované ceny,“ uvedl Anthropic v dnešním tweetu. Uvedení Claude 2.1 reaguje na rostoucí poptávku po umělé inteligenci, která dokáže precizně zpracovávat a analyzovat dlouhé dokumenty.

Náš nový model Claude 2.1 nabízí špičkové kontextové okno s 200 tisíci tokenů, dvojnásobné snížení míry halucinací, systémové výzvy, používání nástrojů a aktualizované ceny.

Claude 2.1 je k dispozici prostřednictvím rozhraní API v naší konzoli a pohání náš https://t.co/uLbS2JNczH chat. pic.twitter.com/T1XdQreluH

– Anthropic (@AnthropicAI) 21. listopadu 2023

Tato nová aktualizace znamená, že uživatelé Clauda se nyní mohou zabývat dokumenty tak rozsáhlými, jako jsou celé kódové databáze nebo klasické literární eposy, což odemyká potenciál v různých aplikacích od právní analýzy po literární kritiku.

Výzkumník Greg Kamradt rychle otestoval model Claude 2.1. Zjistil větší konzistenci modelu OpenAI při nižším počtu tokenů, ale Claude má rozmanitější výsledky podle podnětů při různých délkách.

„Počínaje zhruba 90 tisíci tokeny se výkonnost vyvolání v dolní části dokumentu začala stále více zhoršovat,“ uzavřel. Jeho šetření zjistilo podobnou úroveň zhoršení pro GPT -4 Turbo přibližně při 65K tokenech. “ Jsem velkým fanouškem společnosti Anthropic – pomáhají posouvat hranice výkonu LLM a vytvářejí výkonné nástroje pro celý svět,“ napsal.

Claude 2.1 (200 tisíc tokenů) – tlakové testování dlouhé kontextové paměti.

Všichni rádi zvyšujeme délku kontextu – ale jaký je výkon?

Společnost Anthropic mě oslovila s předčasným přístupem ke Claudovi 2.1, takže jsem zopakoval analýzu „jehly v kupce sena“, kterou jsem provedl na GPT-4.

Tady je, co jsem zjistil:… pic.twitter.com/B36KnjtJmE

– Greg Kamradt (@GregKamradt) 21. listopadu 2023

Snaha společnosti Anthropic o snížení chyb umělé inteligence je patrná ze zvýšené přesnosti aplikace Claude 2.1, která uvádí snížení míry halucinací o 50 %. To v součtu znamená zdvojnásobení pravdivosti ve srovnání s verzí Claude 2.0. Tato vylepšení byla důkladně testována na robustní sadě složitých faktických otázek, které byly navrženy tak, aby zpochybnily současná omezení modelu. Jak TCN již dříve uvedla, halucinace byly jednou ze slabin modelu Claude. Takové drastické zvýšení přesnosti by LLM postavilo do užšího konkurenčního boje s GPT-4.

Se zavedením funkce pro používání nástrojů API se Claude 2.1 také hladčeji integruje do pracovních postupů pokročilých uživatelů a ukazuje svou schopnost orchestrace napříč různými funkcemi, prohledávání webu a čerpání ze soukromých databází. Tato funkce je sice stále ve fázi beta, ale slibuje rozšíření užitečnosti systému Claude napříč spektrem operací, od složitých numerických úvah až po doporučování produktů.

Dále je Claude 2.1 od společnosti Anthropic vybaven „systémovými výzvami“, které mají zvýšit úroveň interakce mezi uživatelem a umělou inteligencí.“ Tyto výzvy umožňují uživatelům nastavit scénu pro úkoly Clauda určením rolí, cílů nebo stylů, čímž se zvyšuje schopnost Clauda udržet si charakter ve scénářích hraní rolí, dodržovat pravidla a personalizovat odpovědi. To je srovnatelné s vlastními instrukcemi OpenAI, ale je to rozsáhlejší z hlediska kontextu.

Uživatel by například mohl Claudovi nařídit, aby při shrnutí finanční zprávy nasadil tón technického analytika, a zajistit tak, aby výstup odpovídal profesním standardům. Takové přizpůsobení prostřednictvím systémových pokynů může zvýšit přesnost, omezit halucinace a zlepšit celkovou kvalitu díla tím, že interakce budou přesnější a kontextově relevantnější.

Plný potenciál verze Claude 2.1 s kontextovým oknem o velikosti 200 tisíc tokenů je však vyhrazen uživatelům verze Claude Pro, takže uživatelé zdarma budou muset zůstat u verze Claude 2 se 100 tisíci tokeny a přesností zařazenou někde mezi GPT 3,5 a GPT-4.

Vlnový efekt vydání Claude 2.1 ovlivní dynamiku v odvětví umělé inteligence. Zatímco podniky a uživatelé vyhodnocují své možnosti v oblasti umělé inteligence, představují rozšířené možnosti verze Claude 2.1 nové úvahy pro ty, kteří chtějí využívat umělou inteligenci pro její přesnost a přizpůsobivost.

Anthropic vylepšuje Claude o téměř dvojnásobek schopností GPT-4 Turbo

Hra NFT ‚Champions Tactics‘ od Ubisoftu přichází do Mocaverse od společnosti Animoca

Generální ředitel společnosti Cruise odstoupil uprostřed krize v oblasti bezpečnosti samořízených vozidel

Related Posts

Leave a Comment Cancel Reply