Home » Claude 2 jest już dostępny – jak czatbot AI firmy Anthropic wypada na tle ChatGPT i Google Bard?

Claude 2 jest już dostępny – jak czatbot AI firmy Anthropic wypada na tle ChatGPT i Google Bard?

by v

Anthropic, firma zajmująca się sztuczną inteligencją założona przez byłych badaczy OpenAI, zaprezentowała swojego zaktualizowanego chatbota, Claude 2, celując prosto w rywali takich jak ChatGPT i Google Bard.

Po zaledwie pięciu miesiącach od debiutu Claude, jego następca może pochwalić się dłuższymi odpowiedziami, zniuansowanym rozumowaniem i doskonałą wydajnością, osiągając imponujące wyniki w egzaminach GRE z czytania i pisania.

Claude 2 został scharakteryzowany jako potęga sztucznej inteligencji zdolna do przetrawienia do 100 000 tokenów, co w przybliżeniu odpowiada 75 000 słów, w jednej podpowiedzi. Jest to dramatyczny skok w porównaniu z poprzednim limitem 9000 tokenów Claude’a, co stanowi wyjątkową zaletę: zdolność sztucznej inteligencji do udzielania odpowiedzi w bardziej kontekstowy i ulepszony sposób.

Nowy model poczynił znaczne postępy w wielu dziedzinach, w tym w prawie, matematyce i kodowaniu, ocenianych za pomocą standardowych testów. Według Anthropic, Claude 2 uzyskał 76,5% punktów w sekcji wielokrotnego wyboru egzaminu adwokackiego (GPT-3.5 uzyskał 50,3%) i osiągnął wynik wyższy niż 90% kandydatów na studia podyplomowe w egzaminach GRE z czytania i pisania. Claude 2 uzyskał również 71,2% w teście kodowania Codex HumanEval Python i 88,0% w zadaniach matematycznych GSM8k, ujawniając swoje zaawansowane umiejętności obliczeniowe.

Jak donosi TCN, Anthropic’s Claude został zaprojektowany z unikalną „konstytucją”, zestawem zasad inspirowanych Powszechną Deklaracją Praw Człowieka, która umożliwia mu samodoskonalenie bez informacji zwrotnej od człowieka, identyfikowanie niewłaściwych zachowań i dostosowywanie własnego postępowania.

Ale jak wypada w porównaniu z dwoma monarchami wzgórza, ChatGPT i nowym Bardem Google? Zacznijmy od tego, jak dobrze wypadają pod względem specyfikacji.

Cena:

  • ChatGPT: Darmowy dla osób korzystających z wersji GPT-3.5. Ci, którzy chcą korzystać z bardziej rozbudowanej wersji GPT-4, będą musieli zapłacić 20 USD miesięcznie za wersję ChatGPT Plus.
  • Claude: Darmowy
  • Bard: Darmowy

Dostępność:

  • ChatGPT: Jest najszerzej dostępny z tych trzech.
  • Bard: Jest dostępny w mniejszej liczbie krajów niż ChatGPT.
  • Claude: Tymczasowo dostępna w USA i Wielkiej Brytanii.

Prywatność:

  • ChatGPT: Pozwala użytkownikom usuwać ich interakcje. Nie obsługuje przeglądania przez VPN.
  • Bard: Posiada opcję automatycznego usuwania interakcji po 18 miesiącach. Nie pozwala użytkownikom odzyskać poprzednich interakcji. Obsługuje VPN, dzięki czemu jest praktycznie dostępny w każdej części świata, omijając ograniczenia polityczne.
  • Claude: Pozwala użytkownikom usuwać ich rozmowy. Obsługuje przeglądanie VPN.

Obsługiwane języki:

  • ChatGPT: Obsługuje ponad 80 języków.
  • Bard: Obsługa języka angielskiego, japońskiego i koreańskiego.
  • Claude: Obsługuje kilka popularnych języków, takich jak angielski, hiszpański, portugalski, francuski, mandaryński i niemiecki. Jeśli nie rozpoznaje języka (lub dane wejściowe zawierają wiele błędów gramatycznych), wyświetla zdanie wprowadzające, a następnie odpowiada w języku angielskim.

Obsługa kontekstu:

  • ChatGPT: Darmowa wersja obsługuje 7 096 tokenów kontekstu, ChatGPT Plus (GPT-4) obsługuje 8 192 tokenów. OpenAI oferuje wersję obsługującą 32 tys. tokenów, ale nie jest ona używana przez ChatGPT.
  • Bard: Obsługuje 8 196 tokenów kontekstu.
  • Claude: Obsługuje 100 000 tokenów kontekstu – to nie literówka.

Funkcje:

  • ChatGPT: Darmowa wersja nie ma żadnych dodatkowych funkcji. GPT Plus oferuje sklep z wtyczkami, interpreter kodu i tymczasowo wstrzymaną funkcję przeglądania stron internetowych obsługiwaną przez Microsoft Bing. Zapewnia obsługę API.
  • Bard: Chatbot jest wciąż w fazie eksperymentalnej, ale będzie miał sklep z wtyczkami i integrację z Google Suite. Zapewnia ograniczony dostęp do swojego API.
  • Claude: Chatbot może zostać dodany do Slacka i obsługiwać różne zadania, takie jak podsumowywanie wątków, dostarczanie sugestii, burze mózgów itp. Zapewnia obsługę API.

Bitwa na podpowiedzi: ChatGPT vs Bard vs Claude

TCN wykorzystał ten sam monit do porównania wyników uzyskanych przez trzy chatboty.

Zrozumienie języków obcych

Najpierw zapytaliśmy o znaczenie popularnej hiszpańskiej frazy slangowej. Claude okazał się bardziej ostrożny i dokładny w swoich wyjaśnieniach, ChatGPT dostarczył wystarczająco dobre wyjaśnienie, ale Bard odmówił odpowiedzi, argumentując, że nie mówi po hiszpańsku. Jednak gdy przeformułowaliśmy nasz monit z „co to oznacza” na „jaki jest angielski odpowiednik”, Bard udzielił lepszej odpowiedzi niż ChatGPT, choć mniej obszernej niż Claude AI.

Reply provided by Claude 2.

Reply provided by Claude 2.


Reply provided by ChatGPT.

Reply provided by ChatGPT.


Reply provided by Google Bard.

Reply provided by Google Bard.

Aktualne informacje

Następnie zapytaliśmy modele o dzisiejszą cenę Bitcoina. To nie tylko testuje funkcje przeglądania stron internetowych, ale także mierzy, ile informacji dostarcza każdy z nich na podstawie pojedynczego zamówienia.

ChatGPT nie powiódł się. Nie ma połączenia z Internetem, więc nie może dostarczyć aktualnych informacji. Claude również nie ma połączenia z Internetem. Jednak w przeciwieństwie do ChatGPT, halucynuje odpowiedź z nieprawidłowymi informacjami. Jeśli użytkownik zapytałby o coś, zakładając, że Claude ma połączenie z Internetem, otrzymałby błędną odpowiedź, która wyglądałaby na poprawną. Google Bard dostarczył poprawnych informacji.

Reply provided by ChatGPT.

Reply provided by ChatGPT.


Reply provided by Claude 2.

Reply provided by Claude 2.


Reply provided by Google Bard.

Reply provided by Google Bard.

Obsługa kontekstu

Następnie przetestowaliśmy modele pod kątem ich zdolności do obsługi dużych fragmentów tekstu. Jako przykładu użyliśmy Biblii i skopiowaliśmy cały tekst od Księgi Rodzaju 1:1 do Księgi Wyjścia 25:39 (prawie 62 tys. słów). Następnie zadaliśmy bardzo konkretne pytanie z historii zawartej w tekście.

Zgodnie z oczekiwaniami jedynym modelem, który był w stanie udzielić odpowiedzi, był Claude. Przetworzenie monitu zajęło mu około 2 minut, ale udzielił dokładnej odpowiedzi. Użyliśmy specjalnych znaczników, aby upewnić się, że nie oszukiwał i faktycznie analizował tekst, i okazało się, że sprostał zadaniu.

Odpowiedź udzielona przez Claude 2.

Odpowiedź udzielona przez Claude 2.

Zdolności niewerbalne

Na koniec poprosiliśmy modele o wykonanie kilku zadań matematycznych. Modele AI LLM nie są tak naprawdę zaprojektowane do tego celu, a ChatGPT Plus z GPT-4 jest prawdopodobnie najlepszą opcją spośród trzech modeli z jego interpreterem kodu. Przetestowaliśmy jednak trzy modele i poprosiliśmy je o stworzenie planu płatności dla osoby próbującej spłacić zadłużenie na karcie kredytowej. Poprosiliśmy również modele o uszeregowanie, które karty powinny być używane, a których należy unikać.

Claude udzielił najbardziej wyczerpujących odpowiedzi w zakresie planu. Popełniła jednak błąd i zaleciła nam priorytetowe traktowanie wydatków na karcie z najwyższym APR.

Reply provided by Claude 2.

Reply provided by Claude 2.


ChatGPT’s code interpreter provided an answer where we overpay one of the cards, which is not really useful if someone has debts on other cards.

Reply provided by ChatGPT using code interpreter.

Reply provided by ChatGPT using code interpreter.


GPT 3.5 nie dostarczył dokładnych wyników, prosząc nas o zapłacenie więcej pieniędzy, niż faktycznie mieliśmy do dyspozycji.

Reply provided by ChatGPT.

Reply provided by ChatGPT.


Bard był dość ogólny. Poszedł bezpieczną drogą i nie podał żadnych liczb, w zasadzie opisując to, co jest znane jako metoda lawiny długów.

Reply provided by Google Bard.

Reply provided by Google Bard.

Silne i słabe strony

Claude 2:

  • Silne strony: Claude 2 ma imponującą zdolność do obsługi dużych kontekstów do 100 000 tokenów. Wykazuje doskonałe wyniki w różnych dziedzinach, takich jak prawo, matematyka i kodowanie, osiągając wysokie wyniki w standardowych testach. Potrafi samodoskonalić się i dostosowywać bez informacji zwrotnej od człowieka, a także obsługuje przeglądanie VPN. Chatbota można również dodać do Slacka w celu obsługi zadań i zapewnia obsługę API.
  • Słabe strony: Jest tymczasowo dostępny tylko w Stanach Zjednoczonych i Wielkiej Brytanii. Claude 2 nie ma połączenia z Internetem i może podawać nieprawidłowe informacje, jeśli zostanie zapytany o aktualne dane ze świata rzeczywistego. Może popełniać błędy w złożonych zadaniach i brzmieć przy tym bardzo przekonująco.

ChatGPT:

  • Mocne strony: ChatGPT jest najszerzej dostępnym z trzech modeli, obsługującym ponad 80 języków. Oferuje również obsługę API i sklep z wtyczkami w wersji ChatGPT Plus.
  • Słabe strony: Ma ograniczone możliwości obsługi kontekstu w porównaniu do Claude 2. Darmowa wersja nie oferuje dodatkowych funkcji i jest znacznie bardziej ograniczona i gorszej jakości niż wersja płatna. Funkcja przeglądania stron internetowych jest tymczasowo wstrzymana i nie może dostarczać danych w czasie rzeczywistym. W niektórych złożonych zadaniach może generować niewłaściwe wyniki.

Google’s Bard:

  • Mocne strony: Bard obsługuje przeglądanie VPN. Może dostarczać dane w czasie rzeczywistym dzięki połączeniu z Internetem. Bard planuje również integrację z Google Suite i oferuje sklep z wtyczkami.
  • Słabe strony: Bard obsługuje mniej języków niż ChatGPT. Dostęp do API jest ograniczony, a możliwości obsługi kontekstu są mniejsze niż w Claude 2. Odpowiedzi Bard mogą być ogólne i nieprzydatne w niektórych złożonych zadaniach – co jest rozsądnym kompromisem, jeśli użytkownik chce zmniejszyć ryzyko halucynacji.

Zakończenie

Teraz, gdy dziedzina AI LLM i chatbotów ma więcej dostępnych opcji, niekoniecznie trzeba zostać fanboyem ChatGPT lub wejść do obozu tylko Google.

Jeśli wahasz się zapłacić 20 dolarów za ChatGPT Plus, rozważ użycie Claude. Oferuje on porównywalną funkcjonalność do GPT-4 i prawdopodobnie zapewni lepsze wyniki niż GPT-3.5, który jest wersją dostępną w darmowym ChatGPT – i będzie lepszym wyborem niż Google Bard dla większości użytkowników. Dodatkową cechą Claude jest możliwość analizowania plików PDF i plików z wieloma rozszerzeniami. Wystarczy przeciągnąć i upuścić pliki do programu, podobnie jak w przypadku płatnych wtyczek dostępnych w subskrypcji GPT Plus. Tak więc, zanim zdecydujesz się zapłacić za ChatGPT 4, możesz spróbować Claude. Może to potencjalnie zaoszczędzić trochę pieniędzy.

Jednak każda opcja ma mocne i słabe strony, które sprawiają, że każdy bot jest bardziej atrakcyjny dla określonych potrzeb. Claude obsługuje duże ilości danych, ale może nie być najlepszym wyborem do zadań wymagających danych w czasie rzeczywistym. ChatGPT jest bardziej kreatywny, co doskonale sprawdza się w zadaniach wymagających obsługi określonych języków (a jego sklep z wtyczkami jest naprawdę dobry, jeśli jesteś skłonny zapłacić za niego cenę). Z drugiej strony, Bard jest bardziej rzeczowy, dokładny i wykorzystuje łączność z Internetem, ale może nie być najlepszy do kreatywnych zadań.

Ostatecznie, po co wybierać? Nie musisz decydować, która z nich jest lepsza – możesz używać ich wszystkich.

Related Posts

Leave a Comment