Реконструкция изображений по нейронной активности

Реконструкция изображений по нейронной активности

Автор: / Наука / Суббота, 13 января 2018 17:44

Японские исследователи создали нейросеть, которая может реконструировать изображения предметов на основе данных о мозговой активности людей, которые на них смотрят

Такая нейросеть успешно реконструирует буквы, геометрические фигуры и даже изображения животных и предметов, сообщается в препринте, опубликованном на bioRxiv, передает «N+1».

Возможность «чтения» человеческих мыслей привлекает ученых достаточно давно, а единственный реальный способ ее достижения - расшифровка паттернов активности головного мозга. Использование для этой цели данных функциональной магнитно-резонансной томографии (фМРТ) является наиболее эффективным: такой метод позволяет визуализировать мозговую активность с наибольшим пространственным разрешением, то есть локализовать ее с максимальной точностью.

Все существующие подходы, однако, имеют ряд ограничений: например, реконструирующая нейросеть может быть ограничена обучающей выборкой, то есть воссоздавать только отдельный ряд изображений, об особенностях которых ей известно. Пполученные изображения очень часто напоминают исходные только отчасти.

Разработчики из Киотского университета под руководством Юкиасу Камитани представили новый алгоритм такой реконструкции - нейросеть, работающую благодаря методам глубокого обучения. Такая нейросеть работает с помощью декодера паттернов изображения в мозговой активности. Она была обучена на парах «изображение-активность», полученных в ходе эксперимента, участников которого просили рассмотреть 1200 изображений (каждое изображение было просмотрено каждым из трех участников по пять раз).

Алгоритм реконструкции работает благодаря попиксельному изменению случайного изображения таким образом, чтобы элементы изначального изображения совпадали с его же элементами, извлеченными из мозговой активности.

Разработчикиввели в систему дополнительную нейросеть (DGN или deep generative network - глубокая генеративная нейросеть), которая позволяет сделать свойства полученного из мозговой активности изображения максимально похожими на свойства изначального изображения (например, цвет предмета).

В результате нейросеть смогла воссоздать изображения геометрических фигур, букв и даже целых предметов. Несмотря на то, что изображения предметов получились абстрактными, работа нейросети, по оценкам системы попиксельной корреляции исходного и полученного изображений, оказалась на 79,7 процента эффективна без дополнительной DGN и на 76,1 - с ее использованием. Человеческая оценка оказалась еще выше: люди правильно угадывали воссозданные изображения (а точнее - определяли пары исходного и полученного изображения) в 99,1 проценте случаев с DGN и в 96,5 - без нее (что означает, что применение дополнительной нейросети имеет смысл для улучшения восприятия людьми).

Эффективность новой нейросети оказалась достаточно высокой, работа над ее улучшением должна продолжаться далее: визуально лучшие результаты она показала при реконструировании простых форм и цифр, но не реальных объектов.

Ключевые слова

Автор

Френсис Дрейк

Френсис Дрейк

Please publish modules in offcanvas position.