Home » Pokédex z reálného světa dokáže díky ChatGPT identifikovat pokémony na první pohled

Pokédex z reálného světa dokáže díky ChatGPT identifikovat pokémony na první pohled

by v

Tvůrce YouTube spojuje nostalgii a nejmodernější technologie a spojuje generativní umělou inteligenci s nostalgickou láskou ke kultovní herní sérii Pokémon od společnosti Nintendo, aby ukázal, jak si můžete vytvořit vlastní Pokédex poháněný umělou inteligencí.

Ve světě Pokémonů je Pokédex digitální encyklopedií, která zaznamenává údaje o druzích barevných příšerek, včetně jejich vlastností, schopností a stanovišť. Trenéři používají Pokédex ke sledování svých setkání s Pokémony a k získávání informací o jednotlivých druzích.

Za projektem AI Pokédex stojí Abraham Haskin, bývalý inženýr společnosti Google a moderátor kanálu Abe’s Project na YouTube. Chtěli vytvořit skutečnou verzi kapesního zařízení a využili moderní technologie, aby tuto mezeru zaplnili.

„Většinou šlo o to, že jsem si uvědomil, že bych to mohl udělat,“ řekl Haskin v rozhovoru pro TCN. „Myslím, že ve filmech, kreslených filmech a sci-fi se vždycky najdou skvělé projekty [které vás donutí přemýšlet]: Nebylo by úžasné, kdyby tohle existovalo?“

Původně byla hra Pokémon uvedena na trh v roce 1996 tokijskou společností Game Freak pod názvem Pocket Monsters a do Spojených států se celosvětový fenomén Pokémon dostal v roce 1998 s vydáním her Pokémon Red a Blue na původní Game Boy, které se shodovalo s uvedením souvisejícího anime seriálu v americké televizi.

Společnosti Nintendo a The Pokémon Company v minulosti vydaly různé repliky Pokédexu, ale jednalo se o jednoduché hračky – nikoliv o pracovní nástroje, které by obnovovaly skutečnou funkčnost známé videoherní a anime pomůcky.

Haskin si uvědomil, že technologie pokročila natolik, že je možné vytvořit skutečný Pokédex, a obrátil se na vlajkový model umělé inteligence společnosti OpenAI, ChatGPT, aby zařízení oživil. Pokédex pro kutily, připojený k místní síti Wi-Fi, využívá volání ChatGPT a rozhraní API Pokémonů – databáze vytvořené fanoušky – k identifikaci jednotlivých tvorů, když je Pokédex pro kutily namířen na obrázek nebo hračku.

3D tištěný Pokédex s umělou inteligencí. Obrázek: Abraham Haskin

3D tištěný Pokédex s umělou inteligencí. Obrázek: Abraham Haskin


V ukázce Haskin předvedl, že DIY Pokédex je schopen identifikovat plnobarevného Pokémona na obrazovce, ale hůře si poradí s hračkami a miniaturami.

Haskin uvedl, že zatímco použití technologie GPT-4 může být nákladné, pokud se do systému volají stovky hovorů, projekt Pokémon stojí jen haléře, pokud jde o implementaci umělé inteligence.

„Kdybyste chtěli vytvořit webovou aplikaci nebo něco, co by dělalo totéž, abyste nahráli fotografii a rozpoznali Pokémony, asi by se to dost prodražilo, a to dost rychle,“ řekl Haskin a dodal, že aspekt klonování hlasu v rámci projektu využívá bezplatnou úroveň platformy generativní umělé inteligence Play HT audio.

Dalším výtvorem generativní umělé inteligence, který využívá popkulturní sílu Pokémonů, je projekt Georgijského technologického institutu nazvaný POKE ‚LLMON, který využívá umělou inteligenci k pochopení a zvládnutí soubojů ve hře Pokémon s dovednostmi podobnými lidským.

Halucinace umělé inteligence jsou v odvětví umělé inteligence trvalým problémem od veřejného spuštění ChatGPT na začátku loňského roku. Haskin uvedl, že ačkoli projekt vyžadoval vypořádání se s podivnostmi ChatGPT, AI nevracela příliš znepokojivé odpovědi nebo odpovědi nesouvisející s pokémony.

„Určitě je váhavá. Vlastně jsem přemýšlel o tom, že bych přidal funkci, jako je kontrola, aby se ChatGPT zeptal na stejnou otázku dvakrát,“ řekl Haskin. „Protože v určitém procentu případů je to prostě špatně a myslí si, že nic nevidí – jako že na tom obrázku nic není.“

Po opětovném dotazu však ChatGPT podle Haskina odpoví správně. Je to prostě nedílná součást práce s novými technologiemi, jako je generativní umělá inteligence a nástroje pro tvorbu velkých jazykových modelů, jako jsou ChatGPT, Claude AI a Gemini.

Velký jazykový model (LLM) označuje umělou inteligenci, která na základě uživatelských vstupů generuje odpovědi podobné lidským, což jí umožňuje odpovídat na otázky, skládat texty a generovat obrázky.

„V těchto LLM je cítit mazlavost; nemají takovou strnulost, na jakou jste zvyklí při práci s počítačovými systémy,“ řekl Haskin. „Takže je tu trochu ústupků a odstupů, kdy se musíte s touto mlhavostí trochu vypořádat,“ řekli. „Ale nezhoršilo by se to, protože každá výzva k ChatGPT je nezávislá událost. Model se neaktualizuje ani se ode mě neučí, takže by ho to stejně neovlivnilo.“

Haskins se vrátil ke své lásce k nostalgii a řekl, že projekt Pokédex nemusí být posledním ikonickým technologickým projektem 90. let pro kanál.

„Opravdu rád dělám věci, které se zdají být na hraně možností, a pokud by se objevila další věc, která by byla proveditelná, určitě bych o tom uvažoval,“ řekl Haskin. „Rád bych udělal nějaké oživení věcí, které lidé vytvořili v 90. letech. Rád bych udělal remake a zjistil, jaké skvělejší věci bychom mohli udělat s moderními technologiemi.“

Related Posts

Leave a Comment