Mohou scrappy, decentralizované, open-source modely umělé inteligence konkurovat dobře financovaným proprietárním modelům, jako je výkonný GPT-4 od OpenAI? Tato často kladená otázka rozproudila na Twitteru živou debatu poté, co si bývalý výzkumník umělé inteligence společnosti Google vybral stranu.
Arnaud Benard, spoluzakladatel společnosti Galileo AI, hodil rukavici a řekl: „Pokud si myslíte, že modely s otevřeným zdrojovým kódem letos porazí GPT-4, mýlíte se“. Odvolával se na talent a zdroje OpenAI a na robustní povahu GPT-4 jako produktu přesahujícího rámec LLM a tvrdil, že open-source projekty mohou mít problém posunout se z vyzyvatelů na šampiony AI.
Pokud si myslíte, že open-source modely letos porazí gpt-4, mýlíte se.
Pracoval jsem ve špičkových výzkumných laboratořích pro ai (google ai) a vytvořil jsem open-source knihovny s ☻ 5 miliony stažení měsíčně.
Gpt-4 je rok starý a zatím se mu žádný model nevyrovná, tady je důvod:
– Arnaud Benard (@arnaudai) January 1, 2024
Není divu, že Benardův tweet vyvolal smíšené reakce, od hlasité podpory až po ostrý nesouhlas.
Ryan Casey, populární nadšenec do umělé inteligence, který píše zpravodaj „Beyond The Yellow Woods“, nabídl optimističtější pohled na potenciál open-source umělé inteligence a uvedl: „Open source se podle jeho výpočtů letos vyrovná [soukromým modelům] nebo je překoná“. „Pokud po něm bude poptávka, dojde k inovacím.“
Ehm, myslím, že open source se letos vyrovná nebo překoná soukromé modely. pic.twitter.com/y99qKJ2iKF
– Ryan Casey (@ryansweb) 1. ledna 2024
Na druhou stranu stratég AI Jeremi Traguna poznamenal, že „modely OpenAI se neustále pohybují“, a dodal, že „open source modely budou mít problém udržet rychlost, aby zasáhly pohybující se cíl v době, kdy je cíl v pozici, kdy má být zasažen“. Jinými slovy, zatímco modely s otevřeným zdrojovým kódem mohou dohánět GPT-3.5 v éře GPT-4, může existovat GPT-5 v době, kdy budeme mít generické LLM srovnatelné s GPT-4.5 Turbo.
Technický analytik Jon Howells se domnívá, že zdroje nejsou jediným standardem, který odděluje otevřené a uzavřené LLM.
„Společnost Mistral má obrovské finanční prostředky, skvělý tým a nedávno uvedla na trh open-source model GPT-3.5,“ napsal. „Oni nebo podobná organizace do konce tohoto roku uvedou open-source model na úrovni GPT-4.“
Francouzský startup Mistral AI si získal uznání poté, co vydal svůj model Mixtral LLM, který v mnoha případech použití nabízí vyšší výkon než GPT-3.5.
Ve vláknové diskusi spoluzakladatel společnosti Nous Research „Teknium“ uvedl důležitou, avšak filozofickou poznámku. „Každé zvýšení schopností OS (Open Source) je trvalá věc, kterou nelze nikdy vzít světu, kterou lze spolehlivě používat navždy,“ řekl. V podstatě platí, že dokud bude existovat nějaký pokrok v technologii UI s otevřeným zdrojovým kódem, žádná společnost nemůže omezit její přístup.
Zavedl jsem společně i mistral, ani jedna strana se na to nezlobí fwiw. Ale tento příspěvek, měl říct, že žádný model OS nepřekoná GPT-4, ale GPT-4 bude stará novinka – pravděpodobně tento rok – netrvalo dlouho a překonali jsme 3.5, a generální ředitel Mistralu řekl, že plánuje vydat GPT4 úroveň Open…
– Teknium (e/λ) (@Teknium1) 1. ledna 2024
Otevřeno nebo zavřeno? Nekonečná debata
Debata o otevřeném a uzavřeném zdrojovém kódu připomíná rané bitvy o operační systémy mezi Windows a Linuxem. Santiago Pino z ML School napsal, že proprietární modely UI mohou zvítězit u běžných spotřebitelů, jako to udělal systém Windows, ale že software s otevřeným zdrojovým kódem poskytuje přizpůsobení a kontrolu, které mohou být velmi užitečné pro firemní uživatele.
Pino zdůraznil, že mnoho společností začíná experimentovat s ChatGPT, ale poté přechází na modely s otevřeným zdrojovým kódem, které mohou doladit a přizpůsobit svým specifickým potřebám a požadavkům na dodržování dat. Řešení s otevřeným zdrojovým kódem podle něj zabraňují uzamčení dodavatele a poskytují transparentnost.
„Uzavřené, proprietární modely mohou získat jednotlivce, ale většina společností nechce posílat svá data Microsoftu nebo Googlu. Chtějí mít vše pod kontrolou. Řešením jsou modely s otevřeným zdrojovým kódem,“ uvedl na Twitteru několik dní předtím, než se Bernardovo vlákno stalo virálním.
Open-source modely zničí ChatGPT a Gemini.
Příběh open-source velkých jazykových modelů je příběhem Linuxu. Windows a Mac si získaly zákazníky, ale Linux se stal operačním systémem internetu.
Totéž se stane s ChatGPT, Gemini a open-source modely. Uzavřené,… pic.twitter.com/fdmS1VNtqf
– Santiago (@svpino) December 22, 2023
Tento druh názoru sdílela v debatě o Bernardově tweetu společnost Sciumo Inc. zabývající se vývojem softwaru, která zdůraznila výklenkový potenciál modelů s otevřeným zdrojovým kódem: „(Modely s otevřeným zdrojovým kódem) budou konkurovat tam, kde na tom záleží: při řešení problémů specifických pro danou oblast s daty a odbornými znalostmi, které (OpenAI) nemá.“
Furkan Gözükara, počítačový inženýr, který je známý díky svému kanálu SECourses na YouTube, patří také mezi ty, kteří zaujímají diferencovanější postoj. V rozhovoru pro TCN souhlasil s Bernardem a řekl, že „pouze u specifických úloh Open Source LLM projde OpenAI“.
Gözükara uvádí příklad společnosti, která „školí LLM na (svých) vlastních dokumentech“. Ano, OpenAI má možnost přizpůsobit GPT na základě konkrétních pokynů a dokumentů, ale manipulace s citlivými údaji pro třetí strany je vždy problém. Tato obava se nedávno potvrdila, když vyšlo najevo, že personalizované GPT předávají citlivé údaje uživatelům z řad třetích stran.
Yan Lecun, vedoucí vývoje umělé inteligence společnosti Meta a zarytý obhájce otevřeného kódu, opakovaně prohlásil, že „modely základů umělé inteligence s otevřeným kódem vyhladí uzavřené a proprietární modely umělé inteligence“. Také společnost Google, další gigant v oblasti AI, si uvědomuje hrozbu, kterou představuje open-source AI: „Modely s otevřeným zdrojovým kódem jsou rychlejší, přizpůsobitelnější, soukromější a na kila schopnější,“ uvádí se v uniklém memorandu společnosti Google z roku 2023.
Zda se modely s otevřeným zdrojovým kódem vyrovnají nebo překonají GPT-4 a budoucí iterace, se teprve uvidí v letošním roce. Pohledy odborníků z obou stran však odhalují zajímavé napětí. Modely s uzavřeným zdrojovým kódem mohou mít výhodu ve zdrojích a rychlé iteraci, ale nástroje s otevřeným zdrojovým kódem se rychle vyvíjejí a nabízejí stálé možnosti a přizpůsobitelnost. Prozatím může komunita AI sledovat vývoj soutěže a využívat výhod plynoucích z používání nejlepších dostupných technologií.