Доброто, лошото и грозното на Grok, новия AI чатбот на Елон Мъск

В постоянно развиващия се свят на технологиите начинанията на Елон Мъск рядко предизвикват вълни. Няколко седмици след ясния си призив да спре обучението на LLM, които са по-способни от GPT-4, Мъск изигра характерния си ход: направи точно обратното на това, което проповядваше. Влезте в xAI – най-новото мозъчно дете на Мъск – и в Grok, неговия чисто нов LLM, обявен в събота.

Откриване на Grok!

Grok е изкуствен интелект, създаден по модела на „Пътеводител на галактическия стопаджия“, така че е предназначен да отговаря на почти всичко и, което е далеч по-трудно, дори да подсказва какви въпроси да се задават!

Grok е проектиран да отговаря на въпроси с малко остроумие и има бунтарска жилка, така че, моля, не го използвайте…

– xAI (@xai) Ноември 5, 2023

Предприемачеството влезе в заглавията на вестниците не само заради участието на Мъск, но и заради звездния състав от водещи изследователи на изкуствения интелект, които компанията успя да привлече от водещи стартъпи и технологични гиганти. Популяризирана с примамливия привкус на изкуствен интелект, създаден да „разбира света“, xAI остана мистериозно срамежлива по отношение на „как“ и „какво“ на дейността си… поне до миналата седмица.

Дали това е още един класически ход на Мъск, който предизвиква статуквото, или просто прехвален чатбот, който се възползва от огромната вълна на популярност и хайп, която съпътства предшествениците му?

Доброто

Непрекъснат поток от знания в реално време

Наличието на достъп до цялото съдържание на Twitter прави Grok потенциално променящ играта инструмент. Както подчертава xAI, Grok ще разполага с „познания за света в реално време“, представяйки това, което изследователите на ИИ наричат Reinforcement Learning from Human Feedback (RLHF), обработвайки новини и разнообразни коментари за текущи събития.

Чрез изучаване на събитията от различни гледни точки и поглъщане на бележките на общността в Twitter – които по същество са анотации – Grok ще се възползва от многостранна представа за света.

Според скорошни проучвания хората вече са променили поведението си и първо търсят новини в социалните медии, преди да се обърнат към основните медии. Интеграцията на Grok с Twitter би могла допълнително да ускори този процес, като предложи на потребителите незабавни коментари, контекст и – ако е изпълнена добре – проверка на фактите на място. Функцията за познания в реално време, както подчерта xAI, гарантира, че Grok е в крак с пулса на света, което му позволява да предоставя навременни и подходящи отговори.

Забавен режим: Мечтата на Елон стана реалност

Визията на Елон Мъск за обичащ забавленията изкуствен интелект изглежда е осъществена с така наречения „забавен режим“ на Grok. Тази функция позволява на LLM да създава вицове, да дава хумористични, но фактически точни отговори и да предоставя на потребителите причудливи и непринудени разговори.

Едно от предизвикателствата пред съществуващите LLM, като ChatGPT, е, че някои потребители смятат, че те са били прекалено прецизирани, за да се гарантира политическата коректност, което потенциално прави взаимодействията по-малко органични и спонтанни. Освен това някои локализирани LLM не са подходящи за продължителни взаимодействия. Grok, със своя забавен режим, обещава да запълни тази празнина, като потенциално служи за ангажиращо прекарване на времето за тези, които искат да се отпуснат.

Grok има достъп до информация в реално време чрез платформата , което е огромно предимство пред другите модели.

Освен това е базиран & обича сарказма. Нямам представа кой би могъл да го насочи по този начин ‍♂️ pic.twitter.com/e5OwuGvZ3Z

– Elon Musk (@elonmusk) November 4, 2023

Тази концепция не е съвсем нова, тъй като Poe на Quora предлага подобна услуга със своите фино настроени чатботове, всеки от които притежава уникална индивидуалност. Въпреки това, ако това е вградено в LLM с възможностите на Grok, преживяването се издига на ново ниво.

Национален достъп до интернет

Една от другите отличителни черти на Grok е възможността за достъп до интернет, без да се изисква приставка или друг модул.

Въпреки че точният обхват на възможностите за сърфиране предстои да бъде изяснен, идеята е примамлива. Представете си МЖО, който може да подобри фактологичната точност, защото може да прави кръстосани препратки към данни в реално време. В съчетание с достъпа си до съдържание в Twitter Grok може да революционизира начина, по който потребителите взаимодействат с ИИ, знаейки, че информацията, която получават, не се основава само на предварително съществуващи данни за обучение, а е непрекъснато актуализирана и проверявана.

Многозадачност

Споменава се, че Grok е способен на многозадачност, което позволява на потребителите да провеждат няколко разговора едновременно. Потребителите могат да разглеждат различни теми, да изчакват отговор по една тема и да продължат с друга.

Чатботът също така предлага разклонения в разговорите, което позволява на потребителите да навлязат по-дълбоко в определени области, без да прекъсват основната дискусия, като предлага визуален справочник за всички разклонения на разговора, улеснявайки потребителите в навигирането между темите.

Grok предлага и вграден редактор на markdown, който позволява на потребителите да изтеглят, редактират и форматират отговорите на Grokза по-късна употреба. Този инструмент, в комбинация с разклоненията, гарантира, че потребителите могат да работят с конкретни клонове на разговора и да се включват отново безпроблемно.

Това са някои от функциите на потребителския интерфейс в Grok. Първо, той ви позволява да изпълнявате няколко задачи. Можете да стартирате няколко едновременни разговора и да превключвате между тях, докато те напредват. pic.twitter.com/aXAG0M2oPF

– Toby Pohlen (@TobyPhln) November 5, 2023

Минимална цензура: свободно говорещ изкуствен интелект

Визията на Елон Мъск за Grok беше ясна: изкуствен интелект, който не се притеснява да изказва своето цифрово мнение.

Макар че всички големи чатботове с ИИ имат предпазни огради, за да се избегне потенциална вреда или дезинформация, понякога може да се почувствате ограничени. Потребителите отбелязват случаи, в които модели като ChatGPT, Llama и Claude могат да задържат отговорите си, за да избегнат потенциална обида. Това обаче може да доведе до филтриране на отговорите, които са добронамерени или наистина търсени.

На Grok се позволява по-голяма свобода в отговорите и по този начин може да предложи по-автентично и неограничено преживяване при разговор. Както се подчертава от xAI, дизайнът на Grok му дава възможност да отговаря на пикантни въпроси, които други системи с изкуствен интелект биха могли да заобиколят.

Представяне на Grok!

Grok е ИИ, създаден по модела на „Пътеводител на галактическия стопаджия“, така че е предназначен да отговаря на почти всичко и, което е далеч по-трудно, дори да подсказва какви въпроси да се задават!

Grok е проектиран да отговаря на въпроси с малко остроумие и има бунтарска жилка, така че, моля, не го използвайте…

– xAI (@xai) Ноември 5, 2023

Очевидно е, че този изкуствен интелект предлага уникална комбинация от информация в реално време, хумор, точност и свобода. Въпреки това, както при всяка иновация, има и предизвикателства и потенциални капани, които трябва да се вземат предвид.

Лошото

Прибързана разработка и ограничено обучение

От самото начало бързото развитие на Grok повдигна някои въпроси. Както заявиха от xAI, „Grok все още е много ранен бета продукт – най-доброто, което можехме да направим с два месеца обучение“. В света на LLM два месеца и 33 милиарда параметри звучат като капка в морето.

В перспектива OpenAI е прозрачна по отношение на своя процес на разработка, като споменава: „Прекарахме шест месеца в итеративно съгласуване на GPT-4“. Разликата в сроковете за разработване предполага, че разработката на Grok може да е била прибързана, за да се яхне вълната на изкуствения интелект.

Освен това x.AI не съобщава за степента на използване на хардуера по време на обучението на Grok, което оставя място за спекулации.

Всичко за параметрите

За непосветените параметрите в LLM представляват количеството информация или знания, които моделът може да съхранява. Те показват ефективния мозъчен капацитет на ИИ, като определят способността му да обработва и генерира информация. Grok, със своите 33 милиарда параметъра, може да звучи впечатляващо на пръв поглед.

В конкурентния пейзаж на LLM обаче той е просто още един играч. Всъщност броят на параметрите му може да не стигне за задоволяване на сложните корпоративни нужди и висококачествените резултати, които титани като ChatGPT, Claude и Bard са определили като златен стандарт.

Отчасти този малък брой параметри е причината, поради която Grok не успява да победи други основни модели в ключови сравнителни тестове като HumanEval или MMLU:

Източник: x.AI

Освен броя на параметрите, съществува и въпросът за обработката на контекста – основно колко информация може да разбере чатботът с изкуствен интелект в един вход. Grok не е особено впечатляващ в тази област. Според xAI Grok разбира 8 192 лексеми от контекста, но GPT-4 жонглира с цели 32 000, а Claude стига още по-далеч с до 100 000 лексеми. Новият GPT-4 Turbo на OpenAI достига до прозорец с 128 000 символа контекст.

Цената на иновациите

Цената е решаващ фактор при оценката на стойността на всеки продукт и Grok не прави изключение. Чатботът ще бъде достъпен за потребители, които са готови да плащат по 16 долара на месец за привилегията да взаимодействат с него.

При наличието на безплатни предложения като Claude 2 и ChatGPT, оборудвани с GPT-3.5 Turbo, Grok може да се окаже трудно продаваем – особено като се има предвид, че тези безплатни модели са изтъкнати заради своята точност, като вече изпреварват Grok в някои сравнителни тестове.

Нещо повече, дори най-мощният LLM на пазара, GPT-4, обещава да бъде по-добър от Grok, като допълнително предимство е, че е широко достъпен, мултимодален и мощен.

Асистентът за изкуствен интелект Grok @xAI ще бъде предоставен като част от Premium+, така че препоръчвам да се регистрирате за него.

Само 16 долара на месец през интернет. https://t.co/wEEIZNjEkp

– Елон Мъск (@elonmusk) 4 ноември 2023 г.

Може ли въвеждането на Grok да е до голяма степен стратегически ход за увеличаване на абонаментите за Twitter Blue, като по този начин се увеличи потокът от приходи на Twitter?

Тези опасения подчертават предизвикателствата пред Grok да се утвърди като основен играч в областта на LLM. И недостатъците му не се изчерпват с цената.

Грозното

Изпускане на художествена литература

Основаването на LLM на измислен герой от популярен роман без съмнение е творчески избор. Въпреки че очарованието на измислена личност може да е примамливо, то крие присъщи рискове в свят, който все повече разчита на точна информация. Потребителите, които се обръщат към изкуствения интелект за сериозни запитвания или съвети, може да се окажат в противоречие със система, създадена да имитира комедиен герой.

Освен това, тъй като границата между измислица и реалност се размива, има опасения, че потребителите могат да изтълкуват погрешно забавните или сатирични отговори като фактическа информация. В цифровата епоха, в която всяка информация се анализира и споделя, последиците от подобни погрешни схващания могат да бъдат широко разпространени. Особено когато става дума за повече от един език.

Въпреки че хуморът и остроумието имат своето място, важно е да се постигне баланс, особено когато потребителите търсят критични прозрения. Даването на предимство на хумора пред точността може да забавлява, но също така подкопава самата същност на това, което трябва да предлага един LLM: надеждна информация.

Свръхкомпромис и недостатъчно изпълнение

Великолепните обещания на Елон Мъск за Grok създадоха предпоставки за неимоверно високи очаквания. По-дълбокото проучване разкрива потенциално несъответствие между шума и реалността. Фактът, че традиционните методи за обучение на LLM са ограничени от своите данни за обучение, подчертава едно критично ограничение: те не могат да навлязат истински в територията на „супер AI“.

Обучението на Grok с неговите 33 милиарда параметъра и няколко месеца разработка изглежда джуджешко в сравнение с други гиганти на LLM. Въпреки че идеята за игрива, измислена личност звучи примамливо, очакването тя да постигне революционни резултати с помощта на стандартните методи за обучение може да се окаже пресилено.

Общността на изкуствения интелект не е чужда на преувеличенията, но с бързия напредък в областта е от решаващо значение за потребителите да отсеят шумотевицата. Постигането на статут на „супер ИИ“ е монументално предизвикателство и е малко вероятно Grok, с настоящата си конфигурация и обучение, да се класира.

Всъщност, за да докаже мощта на Grok, Елон Мъск сравни разговорния му чатбот с малък LLM, обучен за кодиране. Достатъчно е да се каже, че това не беше честна битка.

Пример на Grok срещу типичен GPT, където Grok има актуална информация, а другият не pic.twitter.com/hBRXmQ8KFi

– Elon Musk (@elonmusk) November 5, 2023

Заплахата от дезинформация

LLM са мощни, но не са безпогрешни. При липсата на строги стандарти разграничаването на фактите от измислиците се превръща в херкулесова задача. Неотдавнашната история предлага поучителни истории, като чатботове, обучени по данни от 4chan, или дори Тей, по-ранен чатбот от Microsoft, на който беше позволено да взаимодейства в Twitter. Тези ботове не само изричаха реч на омразата, но и се маскираха убедително като истински човек, заблуждавайки огромна онлайн аудитория.

Тази седмица в @huggingface беше пуснат модел AI, който произвежда вредни + дискриминационни текстове и вече е публикувал над 30 хил. гнусни коментара онлайн (казва авторът му).

Този експеримент никога не би преминал през комисия за изследване на хора етика Ето моите препоръки.

1/7 https://t.co/tJCegPcFan pic.twitter.com/Mj7WEy2qHl

– Lauren Oakden-Rayner ️‍⚧️ (@DrLaurenOR) June 6, 2022

Този флирт с дезинформацията не е изолиран. Тъй като имиджът на Twitter пострада след поглъщането от Елон, може да има опасения относно способността на Grok да предоставя постоянно точна информация. LLM понякога стават жертва на халюцинации и ако тези изкривявания се възприемат като истини, ефектът може да бъде тревожен.

Потенциалът за дезинформация е бомба със закъснител. Тъй като потребителите все повече разчитат на ИИ за прозрения, дезинформацията може да доведе до погрешно вземане на решения. За да може Grok да бъде надежден съюзник, той трябва да действа внимателно, като гарантира, че игривото му поведение няма да замъгли истината.

Липсват мултимодални възможности?

В бързоразвиващия се свят на изкуствения интелект подходът на Grok, при който се използва само текст, е като реликва от миналото. Макар че от потребителите се очаква да плащат за услугите на Grok, те с право могат да се питат защо, особено когато други МЛП предлагат по-богати, мултимодални изживявания.

Например GPT-4-v вече е постигнал напредък в мултимодалната област, като може да се похвали с възможност за чуване, виждане и говорене. Предстоящият Gemini на Google обещава подобен набор от функции. На този фон предложенията на Grok изглеждат недостатъчни, което повдига още повече въпроси относно предлаганата от него стойност.

Пазарът е конкурентен, а потребителите стават все по-взискателни. Ако Grok желае да обособи ниша за себе си, трябва да предложи нещо наистина изключително. В сегашния си вид, когато конкурентите предлагат подобрени функции и по-добра точност – често безплатно – Grok трябва да си свърши работата.

Заключение

Стартирането на проекта Grok предизвика вълнение, но и доста скептицизъм. Подходът му, базиран на MVP (минимален жизнеспособен продукт), позволява бързи итерации и подобрения въз основа на обратната връзка с потребителите. Но конкуренцията на гигантите в областта на изкуствения интелект, които разполагат с много повече ресурси, представлява трудна битка.

За да успее, Grok се нуждае от възможности, които са едновременно нови и полезни. Само развлекателната стойност няма да е достатъчна на претъпкания пазар. Хората с изкуствен интелект не се разсейват със сладки мемове на кучета.

В края на краищата съдбата на Grok зависи от баланса между иновациите и практичността. Въпреки че здравословният скептицизъм е справедлив, пълното му отписване може да бъде прибързано. Grok може да стане пионер в нови области или да се превърне в бележка под линия в еволюцията на изкуствения интелект. Така или иначе, нетрадиционният му произход гарантира, че Grok ще бъде интригуваща глава в разгръщащата се история на изкуствения интелект.

AI Brainchild ChatGPT Elon Musk Hitckhiker LLM GPT-4 OpenAI