Home » Излезе Клод 2 – как чатботът с изкуствен интелект на Anthropic се сравнява с ChatGPT и Google Bard?

Излезе Клод 2 – как чатботът с изкуствен интелект на Anthropic се сравнява с ChatGPT и Google Bard?

by v

Anthropic, фирмата за изкуствен интелект, създадена от бивши изследователи на OpenAI, представи актуализирания си чатбот Claude 2, с който се изправя срещу конкуренти като ChatGPT и Google Bard.

Появявайки се само пет месеца след дебюта на Claude, неговият наследник може да се похвали с по-дълги отговори, нюансирани разсъждения и превъзходни резултати, постигайки впечатляващи резултати на изпитите по четене и писане GRE.

Claude 2 се характеризира като мощна машина на изкуствения интелект, способна да обработва до 100 000 лексеми, което се равнява приблизително на 75 000 думи, в рамките на една задача. Това е драматичен скок в сравнение с предишния лимит на Клод от 9 000 символа, което представлява уникално предимство: способността на ИИ да предоставя отговори по по-контекстуален и подобрен начин.

Новият модел е постигнал значителни успехи в множество области, включително право, математика и кодиране, оценени чрез стандартизирани тестове. По данни на Anthropic Клод 2 е постигнал 76,5 % в частта с въпроси с избор между няколко отговора на изпита за адвокати (GPT-3.5 е постигнал 50,3 %) и е постигнал резултат, по-висок от 90 % от кандидатите за висше училище на изпитите за четене и писане GRE. Освен това Claude 2 постигна 71,2 % на теста за кодиране на Python Codex HumanEval и 88,0 % на задачите по математика за началното училище GSM8k, което разкрива неговите напреднали изчислителни умения.

Както съобщава TCN, Клод на Anthropic е проектиран с уникална „конституция“, набор от правила, вдъхновени от Всеобщата декларация за правата на човека, която му позволява да се самоусъвършенства без човешка обратна връзка, да идентифицира неправилно поведение и да адаптира собственото си поведение.

Но как се справя с двамата монарси на хълма – ChatGPT и новия Bard на Google? Нека започнем с това колко добре се справят със спецификациите.

Цена:

  • ChatGPT: Безплатно за тези, които използват версията GPT-3.5. Тези, които искат да използват по-мощната версия, работеща под управлението на GPT-4, ще трябва да плащат по 20 долара на месец за версията ChatGPT Plus.
  • Claude: Безплатно
  • Bard: Безплатно

Достъпност:

  • ChatGPT: Най-широко достъпният от трите.
  • Bard: Наличен е в по-малко държави от ChatGPT.
  • Claude: Временно се предлага в САЩ и Обединеното кралство.

Приватност:

  • ChatGPT: Позволява на потребителите да изтриват своите взаимодействия. Не поддържа сърфиране чрез VPN.
  • Bard: Има опция за автоматично изтриване на взаимодействията след 18 месеца. Не позволява на потребителите да изтеглят предишни взаимодействия. Поддържа VPN, което го прави практически достъпен във всяка част на света, заобикаляйки политическите ограничения.
  • Claude: Позволява на потребителите да изтриват своите разговори. Поддържа VPN сърфиране.

Поддържани езици:

  • ChatGPT: Поддържа над 80 езика.
  • Bard: Поддържа английски, японски и корейски.
  • Claude: Поддържа няколко широко разпространени езика като английски, испански, португалски, френски, мандарин и немски и др. Ако не разпознае даден език (или въведените данни имат много граматически грешки), той предоставя въвеждаща фраза и след това отговаря на английски език.

Обработка на контекста:

  • ChatGPT: ChatGPT Plus (GPT-4) поддържа 8 192 символа. OpenAI предлага версия, която поддържа 32 хил. токена, но тя не се използва от ChatGPT.
  • Bard: Поддържа 8196 токена контекст.
  • Claude: Поддържа 100 000 токена контекст – не е печатна грешка.

Функции:

  • ChatGPT: Безплатната версия няма допълнителни функции. GPT Plus предлага магазин за плъгини, интерпретатор на код и временно спряна функция за уеб сърфиране, задвижвана от Microsoft Bing. Осигурява поддръжка на API.
  • Bard: Чатботът все още е в експериментална фаза, но ще има магазин за плъгини и интеграция с Google Suite. Предоставя ограничен достъп до своя API.
  • Claude: Чатботът може да бъде добавен към Slack и да се справя с различни задачи като обобщаване на теми, предоставяне на предложения, мозъчна атака и др. Осигурява поддръжка на API.

Битвата на подсказките: ChatGPT срещу Bard срещу Claude

TCN използва една и съща подкана, за да сравни резултатите, получени от трите чатбота.

Разбиране на чужди езици

На първо място попитахме за значението на често срещана испанска жаргонна фраза. Клод се оказа по-внимателен и точен в обяснението си, ChatGPT предостави достатъчно добро обяснение, но Bard отказа да отговори с аргумента, че не може да говори испански. Въпреки това, след като променихме формулировката на въпроса си от „какво означава това“ на „какъв е английският еквивалент на“, той предостави по-добър отговор от този на ChatGPT, макар и по-малко изчерпателен от този на Claude AI.

Отговор, предоставен от Клод 2.

Отговор, предоставен от Клод 2.


Отговор, предоставен от ChatGPT.

Отговор, предоставен от ChatGPT.


Отговор, предоставен от Google Bard.

Отговор, предоставен от Google Bard.

Актуална информация

След това попитахме моделите за цената на Биткойн днес. По този начин не само се тестват функциите за сърфиране в интернет, но и се оценява колко информация предоставя всеки от тях въз основа на една поръчка.

ChatGPT се провали. Той не е свързан с интернет, така че не може да предостави актуална информация. Клод също няма връзка с интернет. За разлика от ChatGPT обаче той халюцинира отговор с невярна информация. Ако потребител попита нещо, предполагайки, че Клод има интернет връзка, той ще получи грешен отговор, който изглежда като верен. Google Bard предостави правилната информация.

Отговорът е предоставен от ChatGPT.

Отговорът е предоставен от ChatGPT.


Отговор, предоставен от Claude 2.

Отговор, предоставен от Claude 2.


Отговор, предоставен от Google Bard.

Отговор, предоставен от Google Bard.

Обработка на контекста

След това подложихме моделите на тест за способността им да обработват големи части от текст. Използвахме Библията като пример и копирахме целия текст от Битие 1:1 до Изход 25:39 (почти 62 хил. думи). След това зададохме много конкретен въпрос от историята, предоставена в текста.

Единственият модел, който успя да даде отговор, беше Клод, както се очакваше. На него му бяха необходими около 2 минути, за да обработи запитването, но даде точен отговор. Използвахме специфични маркери, за да се уверим, че не мами и действително анализира текста, и той се оказа на висотата на задачата.

Отговорът е предоставен от Клод 2.

Отговорът е предоставен от Клод 2.

Невербални способности

Накрая помолихме моделите да се справят с някои математически задачи. ИИ LLM всъщност не са предназначени за това, а ChatGPT Plus с GPT-4 вероятно е най-добрият вариант сред трите със своя интерпретатор на код. Въпреки това тествахме трите модела и ги помолихме да създадат план за плащане за човек, който се опитва да изчисти дълговете си по кредитна карта. Също така помолихме моделите да класират кои карти трябва да се използват и кои да се избягват.

Клод предостави най-изчерпателните отговори по отношение на плана. Въпреки това той допусна грешка и ни препоръча да дадем приоритет на разходите по картата с най-висок ГПР.

Отговорът е предоставен от Клод 2.

Отговорът е предоставен от Клод 2.


Интерпретаторът на кода на ChatGPT предостави отговор, при който надплащаме една от картите, което не е много полезно, ако някой има дългове по други карти.

Отговор, предоставен от ChatGPT с помощта на интерпретатор на код.

Отговор, предоставен от ChatGPT с помощта на интерпретатор на код.


GPT 3.5 не предоставяше точни резултати, като искаше от нас да платим повече пари, отколкото всъщност имахме на разположение.

Отговор, предоставен от ChatGPT.

Отговор, предоставен от ChatGPT.


Бардът беше доста общ. Той тръгна по безопасния път и не предостави никакви цифри, като в общи линии описа това, което е известно като метод на дълговата лавина.

Отговор, предоставен от Google Bard.

Отговор, предоставен от Google Bard.

Силни и слаби страни

Клод 2:

  • Силни страни: Клод 2 има впечатляваща способност да обработва големи контексти до 100 000 жетона. Той демонстрира превъзходни резултати в различни области като право, математика и кодиране, като може да се похвали с високи резултати на стандартизирани тестове. Той може да се самоусъвършенства и адаптира без човешка обратна връзка и поддържа VPN сърфиране. Чатботът може да бъде добавен и към Slack за обработка на задачи и осигурява поддръжка на API.
  • Слаби страни: Временно е наличен само в САЩ и Великобритания. Клод 2 не разполага с интернет връзка и може да предостави невярна информация, ако бъде попитан за текущи данни от реалния свят. Той може да прави грешки при сложни задачи и да звучи много убедително за това.

ChatGPT:

  • Силни страни: ChatGPT е най-широко достъпният от трите модела, като поддържа над 80 езика. Освен това предлага поддръжка на API и магазин за плъгини във версията ChatGPT Plus.
  • Слаби страни: Има ограничени възможности за работа с контекст в сравнение с Claude 2. Безплатната версия не предлага допълнителни функции и е много по-ограничена и с по-ниско качество от платената версия. Нейната функция за сърфиране в интернет е временно спряна и не може да предоставя данни в реално време. При някои сложни задачи тя може да генерира неподходящи резултати.

Бардът на Google:

  • Силни страни: Bard поддържа VPN сърфиране. Той може да предоставя данни в реално време благодарение на връзката си с интернет. Bard също така планира да се интегрира с Google Suite и да предлага магазин за приставки.
  • Слаби страни: Bard поддържа по-малко езици от ChatGPT. Достъпът му до API е ограничен, а възможностите му за обработка на контекст са по-малки от тези на Claude 2. Отговорите на Bard могат да бъдат общи и безполезни при някои сложни задачи – което е разумен компромис, ако потребителят иска да намали риска от халюцинации.

Заключение

След като в областта на LLM и чатботовете с изкуствен интелект има повече налични възможности, не е задължително човек да се превърне във фенбой на ChatGPT или да влезе в лагера само на Google.

Ако се колебаете дали да платите 20 долара за ChatGPT Plus, помислете дали да не използвате Клод. Той предлага функционалност, сравнима с GPT-4, и вероятно ще дава по-добри резултати от GPT-3.5, която е версията, налична в безплатния ChatGPT – и ще бъде по-добър избор от Google Bard за повечето потребители. Допълнителна функция на Claude е способността му да анализира PDF файлове и файлове с много разширения. Можете просто да плъзнете и пуснете файловете в програмата, подобно на платените приставки, налични в абонамента за GPT Plus. Така че, преди да решите да платите за ChatGPT 4, може да опитате Claude. Той може да ви спести пари.

Въпреки това всяка опция има силни и слаби страни, които правят всеки бот по-привлекателен за конкретни нужди. Claude обработва големи количества данни, но може да не е най-добрият избор за задачи, изискващи данни в реално време. ChatGPT е по-креативен, което е идеално за задачи, изискващи поддръжка на специфични езици (а магазинът му за плъгини е наистина добър, ако сте готови да платите цената). От друга страна, Bard е по-фактологичен, точен и използва интернет свързаността си, но може да не е най-добрият избор за творчески задачи.

В крайна сметка, Защо да избирате един от тях? Не е необходимо да решавате кой от тях е по-добър – можете да използвате всички.

Related Posts

Leave a Comment