Anthropic aktualizuje Claude z niemal dwukrotnie większymi możliwościami niż GPT-4 Turbo

Anthropic właśnie wydało Claude 2.1, duży model językowy (LLM), który oferuje okno kontekstowe 200 000 tokenów – funkcja, która przewyższa niedawno ogłoszony kontekst 120K GPT-4 Turbo firmy OpenAI.

Ta strategiczna wersja zapewnia sprawność obsługi kontekstu, która prawie dwukrotnie przewyższa najbliższego rywala i jest owocem rozszerzonej współpracy z Google, która umożliwiła startupowi korzystanie z najbardziej zaawansowanych jednostek przetwarzania Tensor.

„Nasz nowy model Claude 2.1 oferuje wiodące w branży okno kontekstowe z 200 tysiącami tokenów, 2-krotny spadek wskaźnika halucynacji, podpowiedzi systemowe, korzystanie z narzędzi i zaktualizowane ceny” – powiedział Anthropic w dzisiejszym tweecie. Wprowadzenie Claude 2.1 jest odpowiedzią na rosnące zapotrzebowanie na sztuczną inteligencję, która może precyzyjnie przetwarzać i analizować długie dokumenty.

Nasz nowy model Claude 2.1 oferuje wiodące w branży okno kontekstowe 200 tys. tokenów, 2-krotny spadek wskaźnika halucynacji, podpowiedzi systemowe, korzystanie z narzędzi i zaktualizowane ceny.

Claude 2.1 jest dostępny przez API w naszej konsoli i zasila nasz czat https://t.co/uLbS2JNczH pic.twitter.com/T1XdQreluH

– Anthropic (@AnthropicAI) 21 listopada 2023

Ta nowa aktualizacja oznacza, że użytkownicy Claude mogą teraz angażować się w dokumenty tak obszerne, jak całe bazy kodów lub klasyczne eposy literackie, uwalniając potencjał w różnych zastosowaniach, od analizy prawnej po krytykę literacką.

Badacz AI Greg Kamradt szybko przetestował model Claude 2.1. Znalazł większą spójność w modelu OpenAI przy niższej liczbie tokenów, ale Claude ma bardziej zróżnicowane wyniki w zależności od podpowiedzi o różnej długości.

„Począwszy od około 90 tys. tokenów, wydajność wyszukiwania w dolnej części dokumentu zaczęła się coraz bardziej pogarszać” – podsumował. Jego badanie wykazało podobny poziom degradacji dla GPT -4 Turbo przy około 65 tys. tokenów. „Jestem wielkim fanem Anthropic – pomagają przesuwać granice wydajności LLM i tworzyć potężne narzędzia dla świata” – napisał.

Claude 2.1 (200 tys. tokenów) – Testowanie pod presją długiego przywoływania kontekstu

Wszyscy uwielbiamy zwiększać długość kontekstu – ale jak wygląda wydajność?

Anthropic skontaktował się z wczesnym dostępem do Claude 2.1, więc powtórzyłem analizę „igły w stogu siana”, którą przeprowadziłem na GPT-4

Oto, co znalazłem:… pic.twitter.com/B36KnjtJmE

– Greg Kamradt (@GregKamradt) November 21, 2023

Zaangażowanie Anthropic w redukcję błędów sztucznej inteligencji jest widoczne w zwiększonej dokładności Claude 2.1, która twierdzi, że o 50% zmniejszyła liczbę halucynacji. Oznacza to podwojenie prawdomówności w porównaniu do Claude 2.0. Ulepszenia te zostały rygorystycznie przetestowane w oparciu o solidny zestaw złożonych, opartych na faktach pytań, mających na celu zakwestionowanie obecnych ograniczeń modelu. Jak wcześniej informował TCN, halucynacje były jedną ze słabości Claude’a. Tak drastyczny wzrost dokładności sprawiłby, że LLM konkurowałby z GPT-4.

Wraz z wprowadzeniem funkcji korzystania z narzędzia API, Claude 2.1 płynniej integruje się również z przepływami pracy zaawansowanych użytkowników, demonstrując swoją zdolność do orkiestracji różnych funkcji, przeszukiwania sieci i pobierania z prywatnych baz danych. Funkcja ta, choć wciąż w wersji beta, obiecuje rozszerzyć użyteczność Claude w całym spektrum operacji, od złożonego rozumowania numerycznego po rekomendacje produktów.
Ponadto Claude 2.1 firmy Anthropic zawiera „podpowiedzi systemowe”, zaprojektowane w celu podniesienia poziomu interakcji między użytkownikiem a sztuczną inteligencją. Podpowiedzi te pozwalają użytkownikom ustawić scenę dla zadań Claude’a poprzez określenie ról, celów lub stylów, zwiększając w ten sposób zdolność Claude’a do utrzymania charakteru w scenariuszach odgrywania ról, przestrzegania zasad i personalizowania odpowiedzi. Jest to porównywalne z niestandardowymi instrukcjami OpenAI, ale bardziej rozbudowane pod względem kontekstu.

Przykładowo, użytkownik może nakazać Claude’owi przyjęcie tonu analityka technicznego podczas podsumowywania raportu finansowego, zapewniając zgodność wyników z profesjonalnymi standardami. Takie dostosowanie za pomocą podpowiedzi systemu może zwiększyć dokładność, zmniejszyć halucynacje i poprawić ogólną jakość utworu, czyniąc interakcje bardziej precyzyjnymi i kontekstowo istotnymi.

Jednak pełny potencjał Claude 2.1, z oknem kontekstowym 200 tys. tokenów, jest zarezerwowany dla użytkowników Claude Pro, więc darmowi użytkownicy będą musieli pozostać przy Claude 2 ze 100 tys. tokenów i dokładnością plasującą się gdzieś pomiędzy GPT 3.5 a GPT-4.

Efekty uboczne wydania Claude 2.1 będą miały wpływ na dynamikę w branży sztucznej inteligencji. Podczas gdy firmy i użytkownicy oceniają swoje opcje AI, ulepszone możliwości Claude 2.1 przedstawiają nowe rozważania dla tych, którzy chcą wykorzystać AI ze względu na jej precyzję i zdolność adaptacji.

Anthropic aktualizuje Claude z niemal dwukrotnie większymi możliwościami niż GPT-4 Turbo

Gra NFT „Champions Tactics” firmy Ubisoft trafia do „Mocaverse” Animoca

Dyrektor generalny Cruise rezygnuje ze stanowiska w związku z kryzysem bezpieczeństwa samochodów autonomicznych

Related Posts

Leave a Comment Cancel Reply