Попрощайтесь с набором текста и поздоровайтесь с мышлением
Нейротехнологическая компания Unbabel провела удивительную живую демонстрацию своего проекта Project Halo на конференции Web Summit во вторник. Цель технологии — обеспечить бесшумное, основанное на мыслях общение между людьми и машинами.
Project Halo сочетает в себе неинвазивный нейроинтерфейс и генеративный искусственный интеллект для преобразования паттернов биоэлектрических сигналов в язык.
«Существует универсальный язык, который происходит внутри нашего мозга», — сказал генеральный директор Unbabel Васко Педро. «Когда вы смотрите на фМРТ-изображения людей, говорящих на разных языках, но думающих об одном и том же объекте, у них активируются одни и те же участки мозга».
Педро показал, как Project Halo позволяет пользователям получать сообщение, передаваемое через наушники, а затем отправлять ответ совершенно беззвучно, просто думая о том, что они хотят сказать.
Представление метода ответа на сообщения, не требующего речи или набора текста, имеет множество потенциальных вариантов использования, отметил Педро, от обыденных сценариев, таких как ненавязчивое ответное сообщение в темном кинотеатре, до более жизненно важных ситуаций: предоставление людям с боковым амиотрофическим склерозом (ALS) возможности общаться с помощью текста или даже аудиозаписей.
Обучив модель преобразования текста в речь с помощью своего голоса, они могут даже говорить.
Педро продемонстрировал трогательный пример того, как Project Halo позволил пациенту с ALS беззвучно передать жене заказ на обед. Система декодировала его желаемый ответ из нейронных сигналов, а затем синтезировала текстовый ответ в цифровой аппроксимации его оригинального голоса, который был записан до того, как он потерял способность говорить.
Unbabel’s — не первый ИИ, читающий мысли. Как уже сообщал TCN, компания Meta недавно разработала систему, способную сканировать мозговую активность и визуализировать образы, возникающие в сознании человека. ИИ добился этого, снимая магнитно-резонансные измерения, когда участники смотрели на картинки, и реконструировал исходные представления изображений.
Кроме того, компания Neuralink, еще один крупный игрок в этой области, работает над продвинутыми нейроинтерфейсами и уже получила разрешение на тестирование своего мозгового имплантата на людях.
Однако ключевым отличием Project Halo является его способность читать мысли и генерировать ответы на естественном языке. Как отмечает Педро, для этого потребовалось интегрировать языковую модель, которая могла бы узнать о личном контексте пользователя, его отношениях, предпочтениях и многом другом, чтобы создавать сообщения, точно отражающие то, что он хочет передать.
Это не технология бесконтрольного чтения мыслей: чтобы устройство ответило, пользователь должен действительно захотеть ввести ответ.
«По сути, происходит следующее: мне зачитывают вопрос через AirPods, а затем я использую нейронный интерфейс, который находится в моей руке — это ЭМГ», — объяснил Педро. «Он улавливает биологические сигналы, и в результате большая языковая модель, которая знает обо мне много нового, пытается создать ответ, который я хотел бы дать».
Модель также обрабатывает около 15 слов в минуту, что является значительным улучшением по сравнению со старыми методами, которые могут быть вдвое медленнее.
Педро заявил, что сейчас проект Halo находится на ранней стадии, но компания рассчитывает запустить его в коммерческую эксплуатацию в 2024 году. По его мнению, Halo позволит обеспечить беспрепятственное общение для всех людей, независимо от их физических возможностей.
«Наша цель — создать искусственный интеллект во благо и дать возможность каждому человеку общаться на любом языке, устранив тем самым языковой барьер», — говорит Педро.