Все ясно без слов…
Если, конечно, у вас есть аппарат для чтения мыслей — устройство, недавно сошедшее со страниц фантастических романов.
Зрительная кора — относительно небольшая область, расположенная в задней части головного мозга и отвечающая за обработку визуальной информации. Используя новейшее оборудование, сразу несколько ученых из разных стран практически одновременно получили возможность не просто сканировать активность этого участка, а буквально восстанавливать визуальный образ, который в данный момент видит человек.
Для сканирования мозговой деятельности используется функциональная магнитно-резонансная томография, позволяющая получать необходимые показания без подключения специальных проводов к голове. Суть метода заключается в том, что нейронная активность головного мозга сопровождается изменением тока крови, которое и измеряет специальное устройство. Образы, полученные с помощью ФМРТ, не всегда достаточно четки, но по сравнению с тем, что исследователи имели еще год назад, можно говорить об очень серьезном прорыве.
Размытость — не единственное ограничение используемой техники. В связи с тем, что ток крови изменяется не мгновенно, а иногда с задержкой в несколько секунд, даже в идеале (без учета времени, уходящего на обработку сигнала в компьютере) информация в ФМРТ не может обрабатываться в реальном времени.
По словам Джека Галланта — одного из самых известных ученых, занимающихся чтением мыслей (или нейронным декодированием, как он предпочитает это называть), вся проблема сводится к тому, чтобы зафиксировать показания нейронов в зрительной коре и затем обработать полученные данные. По современным оценкам, в интересуемой ученых части головного мозга находится около 300 млн нейронов. Из-за того, что считываются они не индивидуально, а группами, некоторые нюансы работы мозга теряются.
Есть и другие факторы, затрудняющие точное воссоздание образов. Например, для считывания коры человек должен лежать практически неподвижно, поскольку малейшие движения приводят к помехам. Смогут ли исправить этот недостаток со временем, еще неизвестно. Пока же можно сказать, что у этого феномена есть и положительные стороны: прочитать мысли человека без его ведома будет практически невозможно. Иначе говоря, если технология и попадет в руки злоумышленникам, то использовать ее на людях, ходящих по улице, будет невозможно.
Еще год-два назад самые передовые разработки в данной области позволяли воссоздавать лишь черно-белое изображение статической картинки, которую видел человек, помещенный в сканер (исходная картинка также была черно-белой). Разрешение изображения составляло всего 100 пикселей, то есть 10 клеточек по вертикали и горизонтали — разместить на этом фрагменте можно было только самые простые геометрические фигуры.
Учитывая, какого прогресса удалось добиться за прошедший год с небольшим (от статического черно-белого изображения в 100 пикселей до цветной динамической картинки), заявления о возможности воссоздания практически оригинальных образов или чтения мыслей в будущем уже не выглядят столь фантастичными.
На данный момент можно говорить о том, что новый метод с использованием ФМРТ позволяет неплохо распознавать контуры, цвета и само перемещение предметов на экране. Узнать человека по реконструкции пока невозможно, и не только потому, что лицо похоже на размытое пятно, но и в связи с другой особенностью работы технологии, о которой будет сказано ниже. Впрочем, Джек Галлант утверждает, что все эти недостатки обязательно будут со временем устранены.
Для первичной калибровки системы распознавания использовались обычные клипы с YouTube. Испытуемые в течение нескольких часов смотрели видео, а компьютерная программа в это время пыталась определить, как изображение на экране (например предмет оранжевого цвета) влияет на активность нейронов. Найденные соответствия и послужили базой для системы распознавания образов. Далее в нее добавили еще около 18 млн секунд видео с YouTube, и программный алгоритм уже самостоятельно симулировал активность нейронов, чтобы в базе были заполнены белые пятна.
Как можно догадаться, симуляция нейронной активности проводилась для того, чтобы всем входным сигналам соответствовали конкретные картинки. Следовательно, система умеет восстанавливать не конкретно то, что видит человек, а лишь увиденные ранее образы, на которые мозг реагирует наиболее похожим образом. Если человек в томографе смотрит на машину, то алгоритм находит в базе 100 наиболее похожих реакций зрительной коры, усредняет их и выводит полученную картинку на экран. Для чистоты эксперимента видео, которое показывают испытуемому, никогда ранее не «показывали» компьютеру.
Именно усреднением образов и объясняется тот факт, что иногда люди и предметы на реконструкции выглядят немного необычными. Так, зачастую на них видится другая одежда (например нет воротника или рукава короче, чем надо), лица имеют странные черты (где должна быть женщина, иногда отображается мужчина) и так далее. Дополнительные неточности в реконструкции также связаны с тем, что образы восстанавливаются лишь с интервалом в одну секунду и обрабатываются независимо от других кадров.
Джек Галлант утверждает, что уже сейчас ясность реконструкций можно заметно повысить, добавив в алгоритм некоторые простые проверки. Скажем, если на 90 из 100 картинок обнаружено лицо, то сначала ключевые точки всех изображений (глаза, рот, нос) подгоняются друг под друга и только потом усредняются.
Интересно, что с точки зрения реверсивного инжиниринга воспроизведение образов и чтение мыслей — это совершенно разные задачи, хотя обычным людям и кажется, что они тесно связаны. На самом деле эти два вида активности обрабатываются разными участками мозга. Испытуемые, находясь в томографе, могут думать в это время о разных вещах, но на работу системы реконструкции образов это не влияет. Некоторые ученые считают, что дальнейшее изучение особенностей работы мозга приведет к тому, что настоящее чтение мыслей также перестанет быть фантастикой. По оценкам Галланта, это произойдет приблизительно через 30—50 лет.
Чтение образов/мыслей приведет к революции во многих науках. Врачи смогут получать более полную информацию о пациентах, страдающих галлюцинациями, и, вероятно, научатся общаться с людьми, находящимися в коме. В суде восстанавливать события, возможно, будут не на основании слов свидетелей, а опираясь на то, что они видели или запомнили. Впрочем, сами авторы изобретения пока ставят под сомнение применение их разработки в судах, поскольку многочисленные исследования показали, что свидетельствам очевидцев не всегда можно верить. У многих людей бывают проблемы с памятью (о чем они зачастую и сами не догадываются), и чтобы события имели смысл, разные детали мозг придумывает самостоятельно. Устройство для чтения воспоминаний, таким образом, будет ограничено в точности не только собственными недостатками, но и особенностями работы памяти свидетеля.
Новая технология позволит совершать и другие вещи, немыслимые сейчас. Вероятно, появится возможность обмениваться визуальными образами напрямую, то есть один человек сможет видеть то же самое, что и другой, или «вспоминать» те же самые визуальные образы. Также произойдет прорыв в сфере управления техникой, электроникой и компьютерными интерфейсами, команды которым можно будет посылать мысленно, образами в голове.
Из первых уст
Джек Галлант, нейробиолог, ведущий исследователь методов сканирования мозговой деятельности, глава лаборатории в Университете Беркли (Калифорния, США):
— Мозг — крайне сложный орган, и чтобы получить полное понимание его структуры и функций, необходимо использовать множество взаимосвязанных подходов. Один из возможных подходов заключается в рассмотрении трех различных задач, стоящих перед компьютерной нейробиологией. Первая — получение представления о том, каким образом мозг разделен на составные части, выполнящие различные функции. Вторая задача, зависящая от первой, — определение функций каждой из частей.
Классический подход к исследованию этой проблемы — измерение реакций нервной системы на количественном, исчислимом с помощью компьютера уровне безотносительно к конкретным анатомическим и биофизическим деталям. Этот путь позволяет сделать разрешимой задачу анализа чрезвычайно сложной системы.
Третья цель, опирающаяся на первые две, — понять, каким образом эти «вычисления» происходят в нервной системе человека. Следствием такого подхода, основанного на математических компьютерных моделях, становятся разнообразные практические приложения, такие как сканирование визуальных образов.
Существующие методы декодирования активности мозга относительно примитивны, а компьютерные модели незрелы, поэтому использование технологии для практических задач в ближайшем будущем маловероятно. Тем не менее, скажем — в 30-летней перспективе, декодирование активности мозга может быть связано с серьезными этическими осложнениями.