Home » ChatGPT předvádí svou vizi od čtení rentgenových snímků po dekódování tajných zpráv o UFO

ChatGPT předvádí svou vizi od čtení rentgenových snímků po dekódování tajných zpráv o UFO

by Thomas

Ačkoli umělá inteligence vtrhla na scénu prostřednictvím někdy až děsivě chytrých chatbotů, textové interakce jsou již zastaralé. Oznámení aktualizace OpenAI GPT-4 představilo GPT-Vision (GPT-V), nejnovější multimodální zázrak AI. Oznámení se nyní stává skutečností, protože uživatelé mají konečně možnost vyzkoušet plný potenciál jeho schopností.

Multimodální velký jazykový model (LLM) znamená, že dokáže komunikovat nejen s psaným slovem, ale také prostřednictvím dalších způsobů. V tomto případě umí nový GPT-V rozumět obrázkům a pracovat s nimi. Také díky novému generativnímu uměleckému nástroji DALL-E 3 může ChatGPT přijímat obrázky jako vstup, ale také je generovat jako výstup.

Tyto nové schopnosti vyvolaly pozdvižení napříč technologickým prostorem, protože je uživatelé vyzkoušeli v praxi. Dokážou dekódovat redigované vládní dokumenty o pozorování UFO? Ano. „ChatGPT-4V Multimodal dekóduje redigovaný vládní dokument o pozorování UFO, který zveřejnila NASA,“ píše se v jednom tweetu. „Možná, že pravda není někde venku, je přímo tady v GPT-V.“

Snažit se vyplnit mezery v řetězci textu je v podstatě to, co dělají LLM. Uživatel udělal další nejlepší věc, když se snažil otestovat schopnosti GPT-V, a přiměl jej, aby uhodl části textu, které cenzuroval. „Téměř stoprocentní přesnost záměru.“ hlásil.

Samozřejmě je těžké ověřit, zda je jeho odhad toho, co je jinak zastřené, přesný – nemůžeme se přece zeptat CIA, jak dobře si vedl při nahlížení přes černé čáry.

Ještě těžší než odhalit informace, které byly vládou cenzurovány, je snažit se porozumět šifrovanému písmu svého lékaře. GPT-V však dokáže čmáranice rozluštit. Po zdvořilé výzvě dokáže GPT-V dát smysl i těm nejnesrozumitelnějším poznámkám lékaře a zajistit, aby se z „vezměte si dvě tablety“ nestalo „upečte si modré oplatky“.

Ale buďte opatrní. Někdy i ta nejpokročilejší umělá inteligence selže proti rukám zkušeného – nebo artritického – lékaře a k rozluštění těchto písemných hádanek může být zapotřebí odborníka.

A těm, kteří svým lékařům nedůvěřují, může ChatGPT poskytnout okamžitý druhý názor. Model dokáže porozumět rentgenovým snímkům a poskytnout analýzu a náhled na konkrétní lékařské případy.

Ale proč se zastavit u skenování rukopisu a těla? GPT-V se stal nejnovějším guru domácího fitness, který kurátorsky sestavuje tréninkové plány na míru vašemu domácímu vybavení a cílům. A pokud vás zajímá, kolik kalorií obsahuje jídlo, které se chystáte sníst, GPT-V vám kryje záda. Jeden uživatel se radostně podělil: „OK ChatGPT 4.0 s novými funkcemi vidění… rozpozná všechno. Dokonce i tuleně na pláži.“

Milovníci interiérového designu, radujte se! Umělá inteligence nyní nabízí návrhy designu a dokáže zohlednit osobní preference. Představte si obytný prostor, který křičí „vy“, bez vysokých honorářů za návrháře. Stačí vyfotit svůj příšerný pokoj a požádat GPT-V o návrhy, které z něj udělají ráj podle vašich představ.

Trápí vás domácí úkoly? Stačí pořídit snímek obrazovky se zadáním a GPT-V převezme roli ochotného spolužáka, kterého jste si vždycky přáli mít vedle sebe.

A pro finanční maniaky mezi námi: GPT-V není jen o zábavě a hrách. GPT-V se dokáže ponořit do hloubky technické analýzy. Stačí zadat snímek obrazovky vaší oblíbené (nebo nejnenáviděnější) akcie nebo kryptoměny a nástroj analyzuje graf a podle něj vytvoří projekce. Jen nezapomeňte, že to není finanční poradenství – a pokud skončíte chudí, žádná umělá inteligence z vás boháče neudělá.

Úsvit multimodálních LLM nově definuje průmyslová odvětví. S vývojem titánů v oblasti umělé inteligence je GPT-V jen špičkou ledovce. Nadcházející Gemini od Googlu prý svými multimodálními schopnostmi předčí Barda. NexT-GPT nabízí alternativu s otevřeným zdrojovým kódem a na obzoru slibuje modely vycvičené k žonglování se slovy, zvuky, videi a obrázky.

Takové pokroky nejsou jen technobláboly – mají důsledky, které by mohly změnit naše každodenní interakce, profese a možná i náš pohled na svět. A zatímco OpenAI je s GPT-V průkopníkem, konkurence není daleko. Mohli bychom být na pokraji renesance umělé inteligence?

No, pokud stále používáte AI jen pro chat, možná už jste pozadu. AI umí číst a vidět a každým dnem získává další schopnosti.

GPT-V může také zničit zábavu s knihou „Kde je Waldo?“. Proč by to někdo chtěl? Tohle je území ChaosGPT.

Related Posts

Leave a Comment