Исследователи из компании Meta (Соцсеть запрещена в РФ) разработали новый искусственный интеллект, который может анализировать мозговые волны человека, чтобы определить, какие слова он слышит. Этот тип программы может однажды быть использован, чтобы помочь немым людям общаться.
Как отмечают исследователи в своей
Поэтому Жан-Реми Кинг и его коллеги из компании Meta разработали ИИ, способный переводить записи магнито- и электроэнцефалографии (которые являются неинвазивными методами) в слова. Технология все еще находится в зачаточном состоянии, но первые результаты обнадеживают: для каждой записи ИИ предсказывал список из 10 слов, и в 73% случаев этот список включал правильное слово; в 44% случаев первое предсказанное слово было правильным. Следующим шагом может быть попытка интерпретировать мысли человека.
Перевод мозговой активности в слова
Для обучения ИИ Кинг и его коллеги использовали общедоступные наборы данных о мозговых волнах 169 добровольцев, собранные во время прослушивания записей естественной речи людей. Эти волновые данные, записанные с помощью магнито- или электроэнцефалографии (М/ЭЭГ), были разделены на трехсекундные блоки и переданы в ИИ вместе с соответствующими звуковыми файлами — цель программы заключалась в том, чтобы сравнить их для выявления закономерностей.
Из имеющихся данных 10% было зарезервировано для этапа тестирования. Другими словами, эти мозговые волны никогда ранее не исследовались ИИ. И программа блестяще прошла тест: она смогла определить по мозговым волнам, какие отдельные слова из списка 793 слов каждый человек слушал в этот момент.
"Результаты показывают, что наша модель может идентифицировать из 3-х сигналов MEG соответствующий речевой сегмент с точностью до 72,5% в топ-10 из 1594 отдельных сегментов (и 44% в топ-1)", уточняют исследователи. Для записей типа ЭЭГ ИИ показал более низкую точность: он смог предсказать список из десяти слов, содержащих правильное слово, в 19,1% случаев из 2604 различных сегментов.
На сегодняшний день у Meta нет конкретных коммерческих целей, но для команды эти результаты указывают на перспективный путь к расшифровке обработки естественного языка в реальном времени на основе неинвазивных записей активности мозга.
Возможности прогнозирования все еще далеки от возможностей человеческого мозга
Некоторые эксперты по-прежнему скептически относятся к этим показателям, считая, что эта технология еще далека от достаточной точности для реального применения. Они считают, что записи магнитоэнцефалографии и электроэнцефалографии никогда не будут достаточно подробными, чтобы однажды можно было повысить точность предсказания. В мозге происходит множество процессов, которые в любой момент могут помешать мозговым волнам, связанным со слушанием.
Однако Кинг не теряет уверенности, хотя и признает, что ИИ в его нынешнем виде малоэффективен — определение того, какие слова человек слышит в данный момент времени, малоэффективно. С другой стороны, эта технология может привести к разработке системы, способной интерпретировать мысли человека и, таким образом, потенциально позволяющей людям, не способным говорить, снова общаться — особенно амбициозная цель, учитывая сложность задачи.
Недавно компания Meta объявила о долгосрочном исследовательском партнерстве - с центром визуализации мозга NeuroSpin при CEA и INRIA - для изучения человеческого мозга и, в частности, того, как он обрабатывает язык. Цель — собрать данные, необходимые для разработки ИИ, способного обрабатывать речь и текст так же эффективно, как человек.
Несколько исследований уже показали, что мозг систематически организован в иерархию, которая поразительно похожа на языковые модели ИИ. Однако определенные области мозга предвидят не только слова, но и идеи относительно далеко вперед, в то время как большинство современных языковых моделей обучены предсказывать только следующее слово. "Разблокирование этой способности к долгосрочному прогнозированию может помочь улучшить современные языковые модели ИИ", — говорится в блоге компании.