Können skrupellose, dezentralisierte, quelloffene Modelle künstlicher Intelligenz mit gut finanzierten proprietären Modellen wie dem leistungsstarken GPT-4 von OpenAI konkurrieren? Diese häufig gestellte Frage löste eine lebhafte Debatte auf Twitter aus, nachdem sich ein ehemaliger Google-KI-Forscher für eine Seite entschieden hatte.
Arnaud Benard, Mitbegründer von Galileo AI, warf den Fehdehandschuh hin und sagte: „Wenn Sie glauben, dass Open-Source-Modelle GPT-4 dieses Jahr schlagen werden, liegen Sie falsch. Er verwies auf das Talent und die Ressourcen von OpenAI und die Robustheit von GPT-4 als ein Produkt, das über ein LLM hinausgeht, und behauptete, dass Open-Source-Projekte es schwer haben könnten, sich von Herausforderern zu KI-Champions zu entwickeln.
Wenn Sie glauben, dass Open-Source-Modelle GPT-4 dieses Jahr schlagen werden, liegen Sie falsch.
Ich habe in den besten KI-Forschungslabors (Google KI) gearbeitet und Open-Source-Bibliotheken mit ☻ 5 Millionen monatlichen Downloads entwickelt.
gpt-4 ist ein Jahr alt und bis jetzt kann kein Modell mithalten:
1. Talent – openai rekrutiert…
– Arnaud Benard (@arnaudai) Januar 1, 2024
Nicht überraschend löste Benards Tweet gemischte Reaktionen aus, die von lautstarker Unterstützung bis zu heftiger Ablehnung reichten.
Ryan Casey, ein bekannter KI-Enthusiast, der den Newsletter Beyond The Yellow Woods“ verfasst, äußerte sich optimistischer über das Potenzial von Open-Source-KI: Open Source wird seinen Berechnungen zufolge in diesem Jahr mit [privaten Modellen] gleichziehen oder sie sogar übertreffen. „Wenn es eine Nachfrage danach gibt, wird es auch Innovationen geben“.
Ich denke, Open Source wird dieses Jahr mithalten oder übertreffen. pic.twitter.com/y99qKJ2iKF
– Ryan Casey (@ryansweb) Januar 1, 2024
Der KI-Stratege Jeremi Traguna merkte dagegen an, dass „die Modelle von OpenAI in Bewegung bleiben“ und fügte hinzu, dass „Open-Source-Modelle es schwer haben werden, mit der Geschwindigkeit Schritt zu halten, um ein sich bewegendes Ziel zu dem Zeitpunkt zu treffen, zu dem das Ziel in der Lage ist, getroffen zu werden.“ Mit anderen Worten: Während Open-Source-Modelle in der Ära von GPT-4 vielleicht mit GPT-3.5 mithalten können, könnte es bis zu dem Zeitpunkt, an dem wir generalistische LLMs haben, die mit GPT-4.5 Turbo vergleichbar sind, bereits ein GPT-5 geben.
Jon Howells, ein technischer Analyst, glaubt, dass die Ressourcen nicht der einzige Standard sind, der offene von geschlossenen LLMs trennt.
„Mistral verfügt über enorme finanzielle Mittel, ein großartiges Team und hat vor kurzem ein Open-Source-Modell herausgebracht, das GPT-3.5 übertrifft“, schrieb er. „Sie oder ein ähnliches Unternehmen werden bis zum Ende dieses Jahres ein Open-Source-Modell auf GPT-4-Niveau herausbringen.“
Mistral AI, ein französisches Startup-Unternehmen, hat sich nach der Veröffentlichung seines Mixtral LLM, das in vielen Anwendungsfällen eine bessere Leistung als GPT-3.5 bietet, einen Namen gemacht.
In einem Diskussionsstrang machte der Mitbegründer von Nous Research, „Teknium“, einen wichtigen, wenn auch philosophischen Punkt. „Jede Leistungssteigerung bei OS (Open Source) ist eine dauerhafte Sache, die der Welt nie genommen werden kann und die für immer zuverlässig genutzt werden kann“, sagte er. Im Grunde genommen kann kein Unternehmen den Zugang zu Open-Source-KI-Technologie einschränken, solange es Fortschritte gibt.
Ich habe zusammen mit Mistral eingeführt, keine der beiden Parteien ist böse darüber fwiw. Aber dieser Beitrag, er hatte gesagt, dass kein OS-Modell GPT-4 schlagen wird, aber GPT-4 wird alte Nachrichten sein – wahrscheinlich in diesem Jahr – es dauerte nicht lange, um 3,5 zu schlagen, und Mistral CEO sagte, er plant, eine GPT4-Ebene Open Release…
– Teknium (e/λ) (@Teknium1) Januar 1, 2024
Offen oder geschlossen? Eine unendliche Debatte
Die Debatte um Open-Source oder Closed-Source erinnert an die frühen Kämpfe um Betriebssysteme zwischen Windows und Linux. Santiago Pino von der ML School schrieb, dass proprietäre KI-Modelle sich bei den allgemeinen Verbrauchern durchsetzen könnten, wie es bei Windows der Fall war, dass aber Open-Source-Software Anpassungs- und Kontrollmöglichkeiten bietet, die für Unternehmensanwender äußerst nützlich sein können.
Pino hob hervor, dass viele Unternehmen zunächst mit ChatGPT experimentieren, dann aber auf Open-Source-Modelle umsteigen, die sie auf ihre spezifischen Bedürfnisse und Anforderungen an die Dateneinhaltung abstimmen und anpassen können. Open-Source-Lösungen vermeiden die Bindung an einen bestimmten Anbieter und sorgen für Transparenz, sagte er.
„Geschlossene, proprietäre Modelle mögen für Einzelpersonen interessant sein, aber die meisten Unternehmen wollen ihre Daten nicht an Microsoft oder Google senden. Sie wollen die Kontrolle. Open-Source-Modelle sind die Antwort“, sagte er in einem Tweet, einige Tage bevor Bernards Beitrag viral wurde.
Open-Source-Modelle werden ChatGPT und Gemini zerstören.
Die Geschichte der Open-Source-Großsprachmodelle ist die Geschichte von Linux. Windows und Mac gewannen bei den Verbrauchern, aber Linux wurde das Betriebssystem des Internets.
Das Gleiche wird mit ChatGPT, Gemini und Open-Source-Modellen passieren. Geschlossen,… pic.twitter.com/fdmS1VNtqf
– Santiago (@svpino) Dezember 22, 2023
Diese Sichtweise wurde in der Debatte um Bernards Tweet von Sciumo Inc. geteilt, einem Softwareentwicklungsunternehmen, das das Nischenpotenzial von Open-Source-Modellen hervorhob: „(Open-Source-Modelle) werden dort konkurrieren, wo es darauf ankommt: bei domänenspezifischen Problemen mit domänenspezifischen Daten und Fachwissen, über das (OpenAI) nicht verfügt.“
Furkan Gözükara, ein Computeringenieur, der für seinen YouTube-Kanal SECourses bekannt ist, gehört ebenfalls zu denen, die eine differenziertere Haltung einnehmen. Im Gespräch mit TCN stimmte er Bernard zu und sagte, dass „Open Source LLMs nur bei bestimmten Aufgaben an OpenAI vorbeikommen werden.“
Gözükara nennt das Beispiel eines Unternehmens, das „LLM an (seinen) eigenen Dokumenten schult“. Ja, OpenAI hat die Möglichkeit, GPTs auf der Grundlage spezifischer Anweisungen und Dokumente anzupassen, aber der Umgang mit sensiblen Daten an Dritte ist immer ein Problem. Diese Bedenken wurden kürzlich bestätigt, als sich herausstellte, dass personalisierte GPTs sensible Daten an Drittnutzer weitergaben.
Yan Lecun, Leiter der KI-Entwicklung bei Meta und ein vehementer Verfechter von Open-Source, hat wiederholt erklärt, dass „Open-Source-KI-Grundmodelle geschlossene und proprietäre KI-Modelle auslöschen werden“. Auch Google, ein weiterer KI-Gigant, erkennt die Bedrohung durch quelloffene KI an: „Open-Source-Modelle sind schneller, anpassbarer, privater und pfundweise leistungsfähiger“, heißt es in einem durchgesickerten Google-Memo aus dem Jahr 2023.
Es bleibt abzuwarten, ob die Open-Source-Modelle mit GPT-4 und künftigen Iterationen in diesem Jahr mithalten oder diese übertreffen können. Die Ansichten der Experten beider Seiten lassen jedoch ein interessantes Spannungsfeld erkennen. Closed-Source-Modelle mögen in Bezug auf Ressourcen und schnelle Iteration im Vorteil sein, aber Open-Source-Tools entwickeln sich schnell weiter und bieten permanente Funktionen und Anpassungsmöglichkeiten. Bis dahin kann die KI-Gemeinschaft den Wettbewerb beobachten und die Vorteile der besten verfügbaren Technologie nutzen.