Anthropic модернизира Клод с почти два пъти по-големи възможности от GPT-4 Turbo

Anthropic току-що пусна Claude 2.1 – голям езиков модел (LLM), който предлага контекстен прозорец с 200 000 символа – функция, която надминава наскоро обявения 120-хиляден контекст на GPT-4 Turbo от OpenAI.

Тази стратегическа версия предоставя умения за работа с контекст, които почти удвояват тези на най-близкия съперник, и е плод на продължително партньорство с Google, което даде възможност на стартъпа да използва най-съвременните Tensor Processing Units.

„Нашият нов модел Claude 2.1 предлага водещия в индустрията контекстен прозорец с 200 хил. токена, 2 пъти по-ниска честота на халюцинациите, системни подсказки, използване на инструменти и актуализирани цени“, заяви Anthropic в туитър по-рано днес. Въвеждането на Claude 2.1 отговаря на нарастващото търсене на изкуствен интелект, който може да обработва и анализира документи с дълга форма с прецизност.

Нашият нов модел Claude 2.1 предлага водещия в индустрията контекстен прозорец с 200 хил. символа, 2 пъти по-ниска честота на халюцинациите, системни подсказки, използване на инструменти и актуализирани цени.

Claude 2.1 е наличен през API в нашата конзола и захранва нашето https://t.co/uLbS2JNczH чат изживяване. pic.twitter.com/T1XdQreluH

– Anthropic (@AnthropicAI) Ноември 21, 2023

Това ново подобрение означава, че потребителите на Клод вече могат да се занимават с документи, които са толкова обширни, колкото цели кодови бази или класически литературни епоси, отключвайки потенциала на различни приложения – от правен анализ до литературна критика.

Изследователят на изкуството Грег Камрадт бързо изпробва модела Claude 2.1. Той открива по-голяма последователност в модела на OpenAI при по-малък брой символи, но Клод има по-разнообразни резултати според подсказките с различна дължина.

„Започвайки от около 90 хил. лексеми, резултатите от припомнянето в долната част на документа започнаха да стават все по-лоши“, заключи той. Неговото изследване установи подобни нива на влошаване за GPT -4 Turbo при около 65 хил. токена. “ Аз съм голям фен на Anthropic – те помагат да се разширят границите на производителността на LLM и създават мощни инструменти за света“, написа той.

Клод 2.1 (200 хил. жетона) – тестване под налягане на дългото припомняне на контекста

Всички обичаме да увеличаваме дължината на контекста – но каква е производителността?

Anthropic предостави ранен достъп до Клод 2.1, така че повторих анализа „игла в купа сено“, който направих на GPT-4

Ето какво открих:… pic.twitter.com/B36KnjtJmE

– Greg Kamradt (@GregKamradt) November 21, 2023

Ангажиментът на Anthropic за намаляване на грешките на изкуствения интелект е очевиден в повишената точност на Claude 2.1, като се твърди, че процентът на халюцинациите е намалял с 50%. Това води до удвояване на истинността в сравнение с Claude 2.0. Тези подобрения бяха стриктно тествани срещу солиден набор от сложни, фактологични въпроси, предназначени да предизвикат ограниченията на настоящия модел. Както TCN вече съобщи, халюцинациите бяха една от слабостите на Клод. Подобно драстично увеличение на точността би поставило LLM в по-тясна конкуренция с GPT-4.

С въвеждането на функцията за използване на API инструменти, Claude 2.1 също така се интегрира по-безпроблемно в работните процеси на напредналите потребители, демонстрирайки способността си да оркестрира различни функции, да търси в интернет и да извлича данни от частни бази данни. Макар че все още е в бета-версия, тази функция обещава да разшири полезността на Claude в целия спектър от операции – от сложни числени разсъждения до изготвяне на препоръки за продукти.

Освен това Claude 2.1 на Anthropic включва „системни подсказки“, предназначени да повишат нивото на взаимодействие между потребителя и изкуствения интелект.“ Тези подсказки позволяват на потребителите да задават етапа на задачите на Claude, като посочват роли, цели или стилове, като по този начин подобряват способността на Claude да поддържа характер в ролеви сценарии, да спазва правилата и да персонализира отговорите. Това е сравнимо с персонализираните инструкции на OpenAI, но е по-обширно по отношение на контекста.

Например, потребителят може да насочи Клод да възприеме тона на технически анализатор, когато обобщава финансов отчет, като гарантира, че резултатът съответства на професионалните стандарти. Подобно персонализиране чрез системни инструкции може да увеличи точността, да намали халюцинациите и да подобри цялостното качество на произведението, като направи взаимодействията по-прецизни и контекстуално релевантни.

Пълният потенциал на Claude 2.1 с неговия контекстен прозорец от 200 хил. символа обаче е запазен за потребителите на Claude Pro, така че безплатните потребители ще трябва да се придържат към Claude 2 със 100 хил. символа и точност, класирана някъде между GPT 3,5 и GPT-4.

Ефектът от пускането на Claude 2.1 ще повлияе на динамиката в индустрията за изкуствен интелект. Тъй като предприятията и потребителите оценяват своите възможности за ИИ, подобрените възможности на Claude 2.1 представят нови съображения за тези, които се стремят да използват ИИ заради неговата прецизност и адаптивност.

Anthropic модернизира Клод с почти два пъти по-големи възможности от GPT-4 Turbo

Играта NFT „Champions Tactics“ на Ubisoft идва в „Mocaverse“ на Animoca

Главният изпълнителен директор на Cruise се оттегля на фона на кризата с безопасността на самоуправляващите се автомобили

Related Posts

Leave a Comment Cancel Reply