Czy zdecentralizowane modele sztucznej inteligencji o otwartym kodzie źródłowym mogą konkurować z dobrze finansowanymi modelami własnościowymi, takimi jak potężny GPT-4 firmy OpenAI? To często zadawane pytanie wywołało ożywioną debatę na Twitterze po tym, jak były badacz sztucznej inteligencji Google wybrał stronę.
Arnaud Benard, współzałożyciel Galileo AI, rzucił rękawicę, mówiąc: „Jeśli myślisz, że modele open source pokonają GPT-4 w tym roku, to się mylisz”. Powołał się na talent i zasoby OpenAI oraz solidny charakter GPT-4 jako produktu wykraczającego poza LLM i zapewnił, że projekty open-source mogą mieć trudności z przejściem od pretendentów do mistrzów AI.
jeśli myślisz, że modele open-source pokonają gpt-4 w tym roku, to się mylisz.
Pracowałem w najlepszych laboratoriach zajmujących się badaniami nad sztuczną inteligencją (google ai) i tworzyłem biblioteki open source z ponad 5 milionami pobrań miesięcznie.
gpt-4 ma rok i jak dotąd żaden model mu nie dorównuje, oto dlaczego:
1. talent – openai zrekrutował…
– Arnaud Benard (@arnaudai) January 1, 2024
Nic dziwnego, że tweet Benarda wywołał mieszane reakcje, od głośnego wsparcia po ostrą niezgodę.
Ryan Casey, popularny entuzjasta sztucznej inteligencji, który pisze biuletyn „Beyond The Yellow Woods”, zaproponował bardziej optymistyczne podejście do potencjału sztucznej inteligencji typu open source, stwierdzając: „Open source dorówna lub pokona [modele prywatne] w tym roku”, zgodnie z jego obliczeniami. „Jeśli będzie na to popyt, pojawią się innowacje.”
Eh, myślę, że open source dorówna lub przebije ten rok. pic.twitter.com/y99qKJ2iKF
– Ryan Casey (@ryansweb) January 1, 2024
Z drugiej strony strateg AI Jeremi Traguna zauważył, że „modele OpenAI wciąż się poruszają”, dodając, że „modele open source będą miały trudności z utrzymaniem prędkości, aby trafić w ruchomy cel w momencie, gdy cel znajduje się w pozycji do trafienia”. Innymi słowy, podczas gdy modele open source mogą doganiać GPT-3.5 w erze GPT-4, może istnieć GPT-5 do czasu, gdy będziemy mieli ogólne LLM porównywalne z GPT-4.5 Turbo.
Analityk techniczny Jon Howells uważa, że zasoby nie są jedynym standardem oddzielającym otwarte od zamkniętych LLM.
„Mistral ma ogromne fundusze, świetny zespół i niedawno wypuścił GPT-3.5 bijący model open-source” – napisał. „Oni lub podobna firma wprowadzi model open-source na poziomie GPT-4 do końca tego roku”.
Mistral AI, francuski startup, zyskał uznanie po wydaniu Mixtral LLM, który oferuje lepszą wydajność niż GPT-3.5 w wielu przypadkach użycia.
W dyskusji wątkowej współzałożyciel Nous Research „Teknium” poczynił ważną, ale filozoficzną uwagę. „Każdy wzrost możliwości systemu operacyjnego (Open Source) jest trwałą rzeczą, której nigdy nie można odebrać światu i która może być niezawodnie używana na zawsze” – powiedział. Zasadniczo, dopóki istnieje pewien postęp w technologii AI o otwartym kodzie źródłowym, żadna firma nie może ograniczyć jej dostępu.
Wprowadziłem razem i mistral, żadna ze stron nie jest o to zła. Ale w tym poście powiedział, że żaden model systemu operacyjnego nie pokona GPT-4, ale GPT-4 będzie starą wiadomością – prawdopodobnie w tym roku – pokonanie 3.5 nie zajęło nam dużo czasu, a CEO Mistral powiedział, że planuje wydać GPT4 na poziomie Open…
– Teknium (e/λ) (@Teknium1) January 1, 2024
Otwarte czy zamknięte? Niekończąca się debata
Debata open-source kontra closed-source przypomina wczesne bitwy systemów operacyjnych pomiędzy Windows i Linux. Santiago Pino z ML School napisał, że własnościowe modele sztucznej inteligencji mogą wygrać z ogólnymi konsumentami, tak jak zrobił to Windows, ale oprogramowanie open source zapewnia dostosowanie i kontrolę, które mogą być niezwykle przydatne dla użytkowników korporacyjnych.
Pino podkreślił, że wiele firm zaczyna eksperymentować z ChatGPT, ale następnie migruje do modeli open-source, które mogą dostroić i dostosować do swoich konkretnych potrzeb i wymagań dotyczących zgodności danych. Rozwiązania open-source pozwalają uniknąć uzależnienia od dostawcy i zapewniają przejrzystość, powiedział.
„Zamknięte, prawnie zastrzeżone modele mogą wygrywać jednostki, ale większość firm nie chce wysyłać swoich danych do Microsoftu czy Google. Chcą mieć nad nimi kontrolę. Modele open-source są odpowiedzią”, powiedział w tweecie na kilka dni przed tym, jak wątek Bernarda stał się wirusowy.
Modele open-source zniszczą ChatGPT i Gemini.
Historia otwartych modeli językowych to historia Linuksa. Windows i Mac zdobyły konsumentów, ale Linux stał się systemem operacyjnym Internetu.
To samo stanie się z ChatGPT, Gemini i modelami open-source. Zamknięte,… pic.twitter.com/fdmS1VNtqf
– Santiago (@svpino) December 22, 2023
Ten rodzaj poglądu został podzielony w debacie na temat tweeta Bernarda przez Sciumo Inc, firmę zajmującą się tworzeniem oprogramowania, która podkreśliła niszowy potencjał modeli open-source: „(Modele open-source) będą konkurować tam, gdzie ma to znaczenie: problemy specyficzne dla domeny z danymi specyficznymi dla domeny i wiedzą specjalistyczną, której (OpenAI) nie ma”.
Furkan Gözükara, inżynier komputerowy znany ze swojego kanału YouTube SECourses, jest również jednym z tych, którzy mają bardziej zniuansowane stanowisko. W rozmowie z TCN zgodził się z Bernardem, mówiąc, że „tylko w przypadku konkretnych zadań Open Source LLM przejdzie OpenAI”.
Gözükara podaje przykład firmy, która „szkoli LLM na (swoich) własnych dokumentach”. Tak, OpenAI ma możliwość dostosowywania GPT w oparciu o konkretne instrukcje i dokumenty, ale obsługa wrażliwych danych dla stron trzecich zawsze budzi obawy. Obawy te zostały niedawno potwierdzone, gdy ujawniono, że spersonalizowane GPT przekazywały poufne dane użytkownikom zewnętrznym.
Yan Lecun, szef działu rozwoju sztucznej inteligencji w Meta i zaciekły obrońca otwartego oprogramowania, wielokrotnie powtarzał, że „modele AI oparte na otwartym oprogramowaniu wymażą zamknięte i zastrzeżone modele AI”. Google, inny gigant AI, również dostrzega zagrożenie stwarzane przez sztuczną inteligencję open source: „Modele open source są szybsze, bardziej konfigurowalne, bardziej prywatne i funt za funt bardziej wydajne” – czytamy w notatce Google, która wyciekła w 2023 roku.
Dopiero okaże się, czy modele open source dorównają lub przewyższą GPT-4 i przyszłe iteracje w tym roku. Jednak perspektywy ekspertów po obu stronach ujawniają intrygujące napięcie. Modele o zamkniętym kodzie źródłowym mogą mieć przewagę w zakresie zasobów i szybkiej iteracji, ale narzędzia open source szybko ewoluują, oferując stałe możliwości i możliwość dostosowywania. Na razie społeczność AI może obserwować rozwój konkurencji i cieszyć się korzyściami płynącymi z korzystania z najlepszej dostępnej technologii.