Home » Echtwelt-Pokédex kann dank ChatGPT Pokémon auf Anhieb identifizieren

Echtwelt-Pokédex kann dank ChatGPT Pokémon auf Anhieb identifizieren

by Patricia

Ein YouTube-Schöpfer schlägt eine Brücke zwischen Nostalgie und modernster Technologie, indem er generative KI mit der nostalgischen Liebe zu Nintendos kultigem Pokémon-Franchise verbindet und zeigt, wie man seinen eigenen KI-gestützten Pokédex erstellen kann.

Im Pokémon-Universum ist ein Pokédex eine digitale Enzyklopädie in der Welt, in der Daten über die Arten der bunten Monster gespeichert sind, einschließlich ihrer Eigenschaften, Fähigkeiten und Lebensräume. Trainer verwenden einen Pokédex, um ihre Pokémon-Begegnungen zu verfolgen und mehr über die einzelnen Arten zu erfahren.

Das KI-Pokédex-Projekt ist die Idee von Abraham Haskin, einem ehemaligen Google-Ingenieur und Betreiber des YouTube-Kanals Abe’s Project. Sie wollten eine reale Version des Handheld-Geräts schaffen und nutzten moderne Technologien, um diese Lücke zu füllen.

„Es war vor allem die Erkenntnis, dass ich es tun kann“, sagte Haskin in einem Interview mit TCN. „Ich denke, es gibt immer wieder coole Projekte in Filmen, Zeichentrickfilmen und Science-Fiction, bei denen man denkt: Wäre es nicht fantastisch, wenn es so etwas gäbe? „

Das weltweite Phänomen Pokémon wurde ursprünglich 1996 von dem in Tokio ansässigen Unternehmen Game Freak unter dem Namen Pocket Monsters auf den Markt gebracht und kam 1998 mit der Veröffentlichung von Pokémon Rot und Blau für den Game Boy in die Vereinigten Staaten, zeitgleich mit dem Start der dazugehörigen Anime-Serie im US-Fernsehen.

Nintendo und The Pokémon Company haben in der Vergangenheit verschiedene Pokédex-Nachbildungen auf den Markt gebracht, aber es handelte sich dabei um einfache Spielzeuge und nicht um funktionierende Werkzeuge, die die tatsächlichen Funktionen des bekannten Videospiels und Animes nachahmen.

Haskin erkannte, dass die Technologie inzwischen so weit fortgeschritten ist, dass ein echter Pokédex möglich ist, und wandte sich an das KI-Flaggschiff von OpenAI, ChatGPT, um das Gerät zum Leben zu erwecken. Der DIY-Pokédex, der an ein lokales Wi-Fi-Netzwerk angeschlossen ist, verwendet Aufrufe an ChatGPT und die Pokémon-API – eine von Fans erstellte Datenbank -, um die einzelnen Kreaturen zu identifizieren, wenn der DIY-Pokédex auf ein Bild oder ein Spielzeug gerichtet wird.

Ein 3D-gedruckter, KI-gesteuerter Pokémon-Pokédex. Bild: Abraham Haskin

Ein 3D-gedruckter, KI-gesteuerter Pokémon-Pokédex. Bild: Abraham Haskin


In der Demonstration zeigte Haskin, dass der DIY-Pokédex in der Lage ist, ein Pokémon in voller Farbe auf einem Bildschirm zu identifizieren, aber er hat es schwerer mit Spielzeug und Miniaturen.

Haskin sagte, dass die Verwendung der GPT-4-Technologie teuer sein kann, wenn man Hunderte von Aufrufen an das System richtet, während das Pokémon-Projekt nur ein paar Cent kostet, wenn es um die Implementierung der KI geht.

„Wenn man eine Web-App oder etwas Ähnliches machen würde, um ein Foto hochzuladen, um Pokémon zu erkennen, würde das wahrscheinlich ziemlich schnell ziemlich teuer werden“, sagte Haskin und fügte hinzu, dass der Stimmenklon-Aspekt des Projekts die kostenlose Version der generativen Audio-KI-Plattform Play HT verwendet.
Eine weitere generative KI-Schöpfung, die sich die popkulturelle Kraft von Pokémon zunutze macht, ist ein Projekt des Georgia Institute of Technology namens POKE ‚LLMON, das KI einsetzt, um Pokémon-Kämpfe zu verstehen und mit menschenähnlichen Fähigkeiten zu meistern.

KI-Halluzinationen sind seit der öffentlichen Vorstellung von ChatGPT Anfang letzten Jahres ein Dauerthema in der KI-Branche. Haskin sagte, dass man sich bei dem Projekt zwar mit den Macken von ChatGPT auseinandersetzen musste, die KI aber keine übermäßig beunruhigenden oder nicht auf Pokémon bezogenen Antworten gab.

„Sie ist sicher unzuverlässig. Ich habe sogar darüber nachgedacht, eine Funktion einzubauen, die es ermöglicht, ChatGPT dieselbe Frage zweimal zu stellen“, so Haskin. „Denn in einem gewissen Prozentsatz der Fälle liegt es einfach falsch und glaubt, nichts zu sehen – als ob nichts auf dem Bild wäre.

Bei erneuter Aufforderung antwortet ChatGPT laut Haskin jedoch immer mit der richtigen Antwort. Das gehört einfach dazu, wenn man mit neuen Technologien wie generativer KI und großen Sprachmodellen wie ChatGPT, Claude AI und Gemini zu tun hat.

Ein großes Sprachmodell (Large Language Model, LLM) bezieht sich auf KI, die auf der Grundlage von Benutzereingaben menschenähnliche Antworten generiert und so in der Lage ist, Fragen zu beantworten, Texte zu verfassen und Bilder zu erzeugen.

„Diese LLMs haben eine gewisse Weichheit; sie haben nicht diese Starrheit, die man bei der Arbeit mit Computersystemen gewohnt ist“, sagte Haskin. „Es gibt also ein gewisses Geben und Nehmen, bei dem man ein wenig mit dieser Unschärfe umgehen muss“, sagten sie. „Aber es würde nicht schlimmer werden, denn jede Aufforderung zu ChatGPT ist ein unabhängiges Ereignis. Das Modell aktualisiert sich nicht und lernt auch nicht von mir, so dass es sowieso keine Auswirkungen hätte.

Um auf die Liebe zur Nostalgie zurückzukommen, sagte Haskins, dass das Pokédex-Projekt möglicherweise nicht das letzte ikonische Technologieprojekt der 90er Jahre für den Sender sein wird.

„Ich liebe es wirklich, Dinge zu tun, die an der Grenze des Machbaren liegen, und wenn es noch etwas gibt, das machbar ist, würde ich auf jeden Fall darüber nachdenken, es zu tun“, sagte Haskin. „Ich würde gerne ein paar Sachen neu auflegen, die in den 90er Jahren gemacht wurden. Ich würde gerne Remakes machen und sehen, was für coole Sachen wir mit moderner Technologie machen können.“

Related Posts

Leave a Comment