Home » ИИ вече може да възпроизвежда музика чрез четене на мисли

ИИ вече може да възпроизвежда музика чрез четене на мисли

by v

Технологията е направила много, за да помогне в моментите, когато трябва да се каже името на мелодията. Благодарение на изкуствения интелект вече дори не е необходимо да пеете или да напявате песен – просто си я помислете.

Това е бъдещето, към което учените се стремят, след като в едно революционно проучване успешно е използван изкуствен интелект (ИИ) за пресъздаване на музика само чрез сканиране на мозъчната дейност, докато се мисли за дадена песен.

В статия, публикувана в PLOS Biology, изследователи, ръководени от Калифорнийския университет в Бъркли, успяват да генерират разпознаваем звук на песента „Another Brick in the Wall, Part 1“ на Pink Floyd, като използват само данни от мозъка.

Изследването е включвало запис на електрически сигнали директно от мозъците на пациенти с епилепсия, които вече са подложени на наблюдение за лечение на припадъци. Докато пациентите пасивно слушали класическата рок песен, електроди на повърхността на мозъка им улавяли активността на областите за слухова обработка.


След това изследователите подават този набор от мозъчни данни на алгоритми за машинно обучение. Анализирайки моделите на това как различните области на слуховата кора реагират на компоненти като височина на тона, темпо, вокали и инструменти, моделите на изкуствения интелект се научиха да свързват специфична невронна активност с конкретни акустични характеристики.

След като са били обучени на тези двойки вход-реакция, моделите са били в състояние да генерират нови спектрографски представяния само от мозъчни данни. След това изследователите превърнаха тези визуализации във вълнови форми, създавайки аудио, което – макар и изкривено – ясно наподобяваше „Another Brick in the Wall, Part 1“.

Не само че мелодията и текстът бяха разпознаваеми, но невронното декодиране дори отразяваше кои инструменти предизвикват определени реакции в различни области на мозъка. Например активността в определени части на горната темпорална гируса се колебаеше специално в отговор на вокалните срички. В същото време други области се активираха повече в отговор на мотивите на китарата с постоянен ритъм на песента.


Това демонстрира способността да се разгражда сложен музикален стимул на съставните му части единствено въз основа на мозъчната обработка. Ако това се потвърди от бъдещи изследвания, то представлява огромен скок напред в декодирането на мисли, тъй като предишните техники са били ограничени до отделни думи или букви.

Старшият автор, неврологът от Калифорнийския университет в Бъркли, д-р Робърт Найт, обяснява, че екипът е избрал песента на Pink Floyd специално заради богатия ѝ, многопластов инструментариум. Но подходът може да се приложи към всякаква музика или дори към улавянето на мелодичните свойства на естествената реч.

Изследователите предполагат, че тази технология би могла да се използва в крайна сметка, за да се помогне на тежко парализирани пациенти или на жертви на инсулт да възвърнат способността си да говорят просто чрез мислене. Вече се разработват мозъчно-компютърни интерфейси за декодиране на думи или текст от неинвазивни мозъчни сканирания. Добавянето на мелодията и прозодията би позволило да се реконструират по-пълни мисли и планирана реч.

Изследователите постигат напредък в тази област на четене на мисли от години, а появата на мощни модели на изкуствен интелект (и хардуер) направиха възможно да се видят големи пробиви в тази област.

Неотдавна, през май, екип от изследователи успя да превърне мислите в текст. „Бяхме донякъде шокирани, че това работи толкова добре, колкото работи. Работя по това от 15 години … така че беше шокиращо и вълнуващо, когато най-накрая проработи“, казва водещият автор д-р Александър Хът, невролог от Тексаския университет в Остин.

Също така TCN наскоро съобщи, че медицински екип успешно е имплантирал микрочипове в мозъка на мъж с квадриплегия и е успял да използва изкуствен интелект, за да възстанови усещанията и движенията чрез „(свързване) на мозъка му с тялото и гръбначния мозък“

Освен това компанията Neuralink на Елон Мъск получи зелена светлина за започване на изпитания на мозъчни импланти върху хора, за да достигне тази изследователска област до нови граници. Neuralink вече твърди, че е в състояние да чете мислите на животни и да позволи на маймуна да управлява компютър и да играе на Понг, използвайки само мозъка.

Все още има предизвикателства пред превръщането на тези резултати в реални приложения. Но авторите се надяват, че с бързия напредък на записващите устройства и възможностите на изкуствения интелект техният подход един ден може да се развие в интерфейси за преобразуване на мисълта в реч, които да върнат гласа на хората с нарушена реч.

„Днес реконструирахме една песен“, казва Робърт Т. Найт, един от изследователите, пред Scientific American. „Може би утре ще можем да възстановим целия албум на Pink Floyd.“

Освен за клинични цели, тези техники за невронно декодиране откриват и вълнуващи възможности за изучаване на явления като памет, учене и творчество чрез буквално разчитане на мисли с висока точност. Изследването на екипа от Калифорнийския университет в Бъркли представлява преломен момент, който ни приближава до достъпа до богатия вътрешен опит на ума.

Related Posts

Leave a Comment