Home » Sztuczna inteligencja może teraz odtwarzać muzykę, czytając w myślach

Sztuczna inteligencja może teraz odtwarzać muzykę, czytając w myślach

by Tim

Technologia zrobiła wiele, aby pomóc w tych momentach, w których czujesz na języku nazwę utworu. Dzięki sztucznej inteligencji teraz nie trzeba nawet śpiewać ani nucić piosenki – wystarczy o niej pomyśleć.

Taką przyszłość zapowiadają naukowcy po tym, jak w przełomowym badaniu z powodzeniem wykorzystano sztuczną inteligencję (AI) do odtworzenia muzyki po prostu na podstawie skanowania aktywności mózgu podczas myślenia o piosence.

W artykule opublikowanym w PLOS Biology naukowcy z Uniwersytetu Kalifornijskiego w Berkeley byli w stanie wygenerować rozpoznawalny dźwięk utworu Pink Floyd „Another Brick in the Wall, Part 1”, wykorzystując jedynie dane z mózgu.

Badanie polegało na rejestrowaniu sygnałów elektrycznych bezpośrednio z mózgów pacjentów z padaczką, którzy byli już monitorowani pod kątem leczenia napadów. Gdy pacjenci biernie słuchali klasycznego utworu rockowego, elektrody na powierzchni ich mózgów uchwyciły aktywność obszarów przetwarzania słuchowego.


Naukowcy następnie wprowadzili ten zestaw danych mózgowych do algorytmów uczenia maszynowego. Analizując wzorce reakcji różnych obszarów kory słuchowej na komponenty takie jak wysokość dźwięku, tempo, wokal i instrumenty, modele sztucznej inteligencji nauczyły się kojarzyć określoną aktywność neuronalną z konkretnymi cechami akustycznymi.

Po przeszkoleniu na tych parach wejście-reakcja, modele były w stanie generować nowe reprezentacje spektrograficzne na podstawie samych danych mózgowych. Następnie naukowcy przekonwertowali te wizualizacje na kształty fal, tworząc dźwięk, który – choć zniekształcony – wyraźnie przypominał „Another Brick in the Wall, Part 1”.

Nie tylko można było zidentyfikować melodię i słowa, ale dekodowanie neuronowe odzwierciedlało nawet, które instrumenty wywoływały określone reakcje w różnych regionach mózgu. Na przykład aktywność w niektórych częściach górnego zakrętu skroniowego zmieniała się szczególnie w reakcji na sylaby głosowe. W międzyczasie inne obszary aktywowały się bardziej w odpowiedzi na jednostajne motywy gitary rytmicznej utworu.


Demonstruje to zdolność do rozbicia złożonego bodźca muzycznego na jego części składowe w oparciu wyłącznie o przetwarzanie mózgu. Jeśli zostanie to potwierdzone w przyszłych badaniach, będzie to ogromny krok naprzód w dekodowaniu myśli, ponieważ poprzednie techniki ograniczały się do pojedynczych słów lub liter.

Starszy autor, neuronaukowiec z UC Berkeley, dr Robert Knight, wyjaśnił, że zespół wybrał utwór Pink Floyd ze względu na jego bogatą, wielowarstwową instrumentację. Podejście to można jednak zastosować do dowolnej muzyki, a nawet do przechwytywania właściwości melodycznych naturalnej mowy.

Naukowcy sugerują, że technologia ta mogłaby ostatecznie zostać wykorzystana, aby pomóc poważnie sparaliżowanym pacjentom lub ofiarom udaru odzyskać zdolność mówienia po prostu poprzez myślenie. Interfejsy mózg-komputer są już opracowywane w celu dekodowania słów lub tekstu z nieinwazyjnych skanów mózgu. Dodanie wymiaru melodii i prozodii pozwoliłoby na zrekonstruowanie pełniejszych myśli i zamierzonej mowy.

Oprócz tego firma Neuralink Elona Muska otrzymała zielone światło na rozpoczęcie testów na ludziach swoich implantów mózgowych, aby przenieść tę dziedzinę badań na nowe granice. Neuralink już twierdzi, że jest w stanie odczytać myśli zwierzęcia i pozwolić małpie kontrolować komputer i grać w Ponga za pomocą samego mózgu.

Nadal istnieją wyzwania związane z przełożeniem tych wyników na rzeczywiste zastosowania. Autorzy mają jednak nadzieję, że wraz z szybkim postępem w dziedzinie urządzeń rejestrujących i możliwości sztucznej inteligencji, ich podejście może pewnego dnia ewoluować w kierunku interfejsów myśl-mowa, które przywracają głos osobom z upośledzeniem mowy.

„Dzisiaj zrekonstruowaliśmy piosenkę” – powiedział Robert T. Knight, jeden z badaczy, w wywiadzie dla Scientific American. „Może jutro uda nam się zrekonstruować cały album Pink Floyd”.

Poza zastosowaniami klinicznymi, te techniki dekodowania neuronowego otwierają również ekscytujące możliwości badania zjawisk takich jak pamięć, uczenie się i kreatywność poprzez dosłowne odczytywanie myśli z wysoką wiernością. Badanie przeprowadzone przez zespół UC Berkeley stanowi przełomowy moment, przybliżając nas do uzyskania dostępu do bogatego wewnętrznego doświadczenia umysłu.

Related Posts

Leave a Comment