Home » Umělá inteligence nyní dokáže reprodukovat hudbu čtením myšlenek

Umělá inteligence nyní dokáže reprodukovat hudbu čtením myšlenek

by v

Technologie už hodně pomohla s okamžiky, kdy si člověk musí říct na špičku jazyka, jakou skladbu má na mysli. Díky umělé inteligenci nyní nemusíte ani zpívat nebo broukat písničku – stačí si ji jen představit.

Takovou budoucnost přinášejí vědci poté, co v průlomové studii úspěšně použili umělou inteligenci (AI) k obnovení hudby jednoduše na základě snímání mozkové aktivity při přemýšlení o písni.

V článku publikovaném v časopise PLOS Biology dokázali vědci pod vedením Kalifornské univerzity v Berkeley vygenerovat rozpoznatelný zvuk písně „Another Brick in the Wall, Part 1“ od skupiny Pink Floyd pouze pomocí dat z mozku.

Studie zahrnovala záznam elektrických signálů přímo z mozku pacientů s epilepsií, kteří již byli sledováni kvůli léčbě záchvatů. Zatímco pacienti pasivně poslouchali klasickou rockovou píseň, elektrody na povrchu jejich mozku zachycovaly aktivitu oblastí zpracovávajících sluchové signály.


Výzkumníci pak tento soubor mozkových dat vložili do algoritmů strojového učení. Analýzou vzorců reakcí různých oblastí sluchové kůry na složky, jako je výška tónu, tempo, vokály a nástroje, se modely umělé inteligence naučily spojovat specifickou nervovou aktivitu s konkrétními akustickými prvky.

Po vyškolení na těchto dvojicích vstup-odezva byly modely schopny generovat nové spektrografické reprezentace pouze z mozkových dat. Výzkumníci pak tyto vizualizace převedli na průběhy a vytvořili zvuk, který – ač zkreslený – jasně připomínal „Another Brick in the Wall, Part 1“.

Nejenže bylo možné identifikovat melodii a text, ale nervové dekódování dokonce odráželo, které nástroje vyvolávají určité reakce v různých oblastech mozku. Například aktivita v určitých částech horního spánkového gyru kolísala specificky v reakci na vokální slabiky. Zatímco jiné oblasti se aktivovaly více v reakci na ustálený rytmus kytarových motivů písně.


To dokazuje schopnost rozložit složitý hudební podnět na jeho jednotlivé části pouze na základě zpracování mozkem. Pokud to potvrdí i budoucí výzkum, představuje to obrovský skok vpřed v dekódování myšlenek, protože předchozí techniky se omezovaly na jednotlivá slova nebo písmena.

Vedoucí autor, neurolog z Kalifornské univerzity v Berkeley Dr. Robert Knight, vysvětlil, že tým si vybral píseň Pink Floyd zejména kvůli její bohaté, vrstevnaté instrumentaci. Tento přístup by se však dal použít na jakoukoli hudbu nebo dokonce na zachycení melodických vlastností přirozené řeči.

Vědci předpokládají, že by tato technologie mohla být nakonec použita k tomu, aby pomohla těžce ochrnutým pacientům nebo obětem mrtvice získat zpět schopnost mluvit pouhým přemýšlením. Již nyní se vyvíjejí rozhraní mozek-počítač, která umožňují dekódovat slova nebo text z neinvazivních snímků mozku. Přidání rozměru melodie a prozódie by umožnilo rekonstruovat plnější myšlenky a zamýšlenou řeč.

Výzkumníci v této oblasti čtení myšlenek dělají pokroky již řadu let a díky vzestupu výkonných modelů umělé inteligence (a hardwaru) je možné v této oblasti zaznamenat zásadní průlomy.

Již v květnu dokázal tým výzkumníků převést myšlenky na text. „Byli jsme trochu šokováni, že to funguje tak dobře, jak to funguje. Pracoval jsem na tom 15 let … takže to bylo šokující a vzrušující, když to konečně fungovalo,“ řekl hlavní autor Dr. Alexander Huth, neurolog z Texaské univerzity v Austinu.

TCN také nedávno informoval, že lékařský tým úspěšně implantoval mikročipy do mozku kvadruplegika a dokázal pomocí umělé inteligence obnovit vnímání a pohyb „(propojením) jeho mozku s tělem a míchou.“

Kromě toho dostala společnost Neuralink Elona Muska zelenou k zahájení zkoušek svých mozkových implantátů na lidech, které mají tuto oblast výzkumu posunout do nových sfér. Společnost Neuralink již prohlásila, že je schopna číst myšlenky zvířat a nechat opici ovládat počítač a hrát Pong pouze pomocí mozku.

Stále však existují problémy, jak tyto výsledky převést do reálných aplikací. Autoři však doufají, že s rychlým pokrokem v oblasti záznamových zařízení a schopností umělé inteligence by se jejich přístup mohl jednoho dne vyvinout v rozhraní pro převod myšlenek na řeč, která vrátí hlas lidem s poruchou řeči.

„Dnes jsme zrekonstruovali píseň,“ řekl Robert T. Knight, jeden z výzkumníků, časopisu Scientific American. „Možná zítra zrekonstruujeme celé album Pink Floyd.“

Kromě klinického využití otevírají tyto techniky nervového dekódování také zajímavé možnosti pro studium jevů, jako je paměť, učení a kreativita, a to doslova čtením myšlenek s vysokou věrností. Studie týmu z Kalifornské univerzity v Berkeley představuje přelomový moment, který nás přibližuje k přístupu k bohatým vnitřním zkušenostem mysli.

Related Posts

Leave a Comment