ОКО ПЛАНЕТЫ > Новости науки и техники > Мозг сортирует зрительные образы не так, как считалось ранее

Мозг сортирует зрительные образы не так, как считалось ранее


4-09-2013, 15:13. Разместил: Редакция ОКО ПЛАНЕТЫ

Мозг сортирует зрительные образы не так, как считалось ранее


Рис. 1. Схематическое представление признаков визуальных объектов, обрабатываемых зрительной корой

Рис. 1. Схематическое представление признаков визуальных объектов, обрабатываемых зрительной корой. Выходя из первичной зрительной коры, информация о том, что мы видим, разделяется на два потока: путь «где» (в теменную кору, на рисунке представлен сверху) и путь «что» (в височную кору, на рисунке представлен снизу). Первичная зрительная кора анализирует ориентацию отдельных линий объекта (внизу справа). Нейроны пути «где» определяют направление движения объекта (знак ‘curve ahead’ вверху) и строят карту местности (значок розы ветров вверху). Нейроны пути «что» начинает «сборку образов» (две линии, формирующие угол). Далее в этом пути к признакам, анализируемым в составе образа, добавляется цветность и контрастность (радужный «веер» внизу в центре). Нижняя височная кора ответственна за распознавание и категоризацию сложных образов, таких как человеческое лицо (внизу слева). Изображение с сайта www.cns.nyu.edu

Вопрос о том, по каким критериям зрительная кора больших полушарий классифицирует визуальные объекты, не так прост. Из большинства работ следует, что сортировка образов, по крайней мере у обезьян, происходит «по смыслу». В новом исследовании, о котором пойдет речь далее, было показано, что классификация происходит по принципу схожести форм объектов. Получается, что у нейронов высших отделов зрительной коры силуэты лошади и собаки вызывают более сходные реакции, нежели, скажем, силуэт лошади и голова игрушечной лошади на палочке.

Кора больших полушарий (неокортекс) — высшее звено в цепи обработки любой информации, приходящей к нам от органов чувств. Неокортекс можно условно разделить на ряд участков (полей), внутри каждого из которых нейроны выполняют схожие функции — например, анализируют зрительные стимулы, обеспечивают точные движения пальцев рук или грамотное построение предложений. Те области коры, в которые попадает информация от одной и той же сенсорной системы (например, зрительной), отличаются друг от друга уровнем воспринимаемых признаков: первичная зрительная кора обрабатывает простые свойства объектов, такие как ориентация в пространстве или направление движения одного предмета простой формы, в то время как в «высших» полях зрительной коры могут анализироваться, например, расположение предмета на воображаемой трехмерной карте местности и сложная траектория его движения. К сожалению, как это часто бывает в науках о мозге, четкого критерия, который позволил бы однозначно разделить визуальные признаки на простые и сложные, нет, как нет и общепринятой классификации стимулов по сложности. Однако интуитивно понятно, что, например, цвет объекта не относится к категории сложных зрительных признаков, а целостная картина конкретного человеческого лица не относится к простым изображениям.

Информация о том, что видит животное, достигая неокортекса, попадает вначале в затылочные доли больших полушарий, где находится первичная зрительная кора. Оттуда нервные импульсы, кодирующие простые признаки визуальных объектов, могут быть переданы по одному из «путей» либо в височные, либо в теменные доли больших полушарий. Эти пути, или потоки, имеют в своем составе нейроны, реагирующие на более комплексные свойства зрительных стимулов. Зрительные области височной коры распознают образы (путь «что»), теменной — положение объектов друг относительно друга и относительно самого животного (путь «где»). Иными словами, пространственную картину мира формируют зрительные отделы теменной коры, а височная кора помогает млекопитающему понять, что же именно он перед собой видит (рис. 1).

Высшим отделом зрительной коры, которым завершается путь «что», у приматов служит нижняя височная (инферотемпоральная) кора. Нейроны этой области реагируют на различные сложные образы — целостные объекты или их элементы. В ней происходит распознавание этих образов и их первичная сортировка (эти два действия, очевидно, взаимосвязаны: определить объект, например, как лицо означает отнести его ко множеству лиц). Нижняя височная кора имеет «выходы» к ассоциативным отделам неокортекса — медиальной височной и префронтальной коре. Последние служат высшими центрами обработки информации, получаемой организмом, и в них же идет окончательное распределение «многомерных» (то есть основанных на данных от разных органов чувств) образов. Но по какому принципу происходит классификация образов в инферотемпоральной коре, не вполне понятно.

Согласно ныне принятой теории, популяция нервных клеток нижней височной коры «отзывается» на зрительные стимулы, принадлежащие к одной и той же категории, похожим образом. Это означает, что примерное количество и частота появления потенциалов действия в группе нейронов инферотемпоральной коры будут сходными в случае предъявления животному визуальных образов из одной категории. Однако когда макакам предъявляли изображения из определенного набора, стимулируя таким образом отдельные нейроны пути «что», реагирующие на форму объектов (сравнительно простой признак), ответы нижней височной коры макак не получалось сгруппировать ни в какие категории; они были как бы случайны. Это означает, что клетки инферотемпоральной коры «пользуются» не только информацией о форме объектов — для их полноценной работы требуется приток импульсов, кодирующих и другие признаки изображений.

Проводившиеся ранее эксперименты на нижней височной коре обезьян показали, что нейроны этой коры отвечают схожим образом на образы, близкие по «значению», то есть, допустим, на предъявление фотографий банана и персика (и то, и другое — фрукты). При этом особо выделяется категория «четвероногие животные», представителей которой приматы распознают среди многих других зрительных стимулов. Также полученные данные указывали на то, что обезьяны делят объекты на одушевленные и неодушевленные, и в этом непосредственно участвуют нейроны инферотемпоральной коры. Категории зрительных образов, на которые похожим образом отвечают клетки этой области, подчиняются иерархии: более крупные из них, например, категория «лица», заключает в себе более мелкие группы, например «лица обезьян», «лица людей» и «лица птиц, амфибий, пресмыкающихся». (Правильнее, конечно, было бы назвать «лица» представителей последней категории передней частью головы.)

Группа итальянских и американских исследователей решила проверить, по какому принципу нижняя височная зрительная кора сортирует различные объекты. Макакам предъявляли зрительные стимулы одинакового размера из специального набора Caltech 101. Каждый рисунок находился в поле зрения обезьяны 100 миллисекунд, сменяясь следующим после 100-миллисекундной паузы. Обезьяны должны были найти глазами определенную цель — красный треугольник, который всегда появлялся вместе с последним предъявляемым образом. Параллельно велась регистрация электрической активности отдельных нейронов инферотемпоральной коры. Всего было обработано 94 нейрона. Уровень активности клеток измерялся средним числом потенциалов действия (спайков) в секунду, которые нейрон генерировал во время предъявления стимула (при этом один и тот же стимул в эксперименте мог повторяться) и в промежутке между стимулами после этого предъявления.

Считалось, что нейрон реагирует на зрительный образ сильно, если он часто разряжается потенциалами действия, и наоборот. Далее данные для одного стимула суммировались по всем 94 нейронам и получалась «карта» (вектор) реакции исследуемой области коры на данный объект. Если два объекта воспринимаются как похожие, векторы реакции для этих двух объектов похожи, и наоборот. Похожесть в данном случае определялась математическими методами — подсчетом коэффициента корреляции Пирсона для двух «карт». Для сравнения нескольких (более двух) стимулов сразу применялся кластерный анализ, группировавший зрительные объекты в соответствии с векторами реакции, ими вызываемыми.

Результаты получились неожиданные. Вопреки предыдущим свидетельствам, на сей раз нейроны нижней височной коры макак «считали» похожими предметы, близкие не по своему значению, а по форме. Также в ряде случаев объекты сближались на основании таких относительно простых признаков, как число элементов (изображения телефона и открытого ноутбука содержат в себе больше деталей, чем изображения теннисного мяча и груши), яркость и контрастность. Семантическая близость стимулов играла роль только в случае лиц и четвероногих животных, притом не всегда. Однако выделение лиц и четвероногих в отдельные категории можно объяснить и тем, что все представленные в эксперименте лица были овальной формы, а изображения всех четвероногих схожи числом деталей в них (рис. 2).

 

Рис. 2. Набор зрительных стимулов, использованных в работе

Рис. 2. Набор зрительных стимулов, использованных в работе. Изображение из обсуждаемой статьи в PLoS Computational Biology

Почему семантика зрительного образа вдруг потеряла значение? Возможно, дело тут в чистоте эксперимента. Предыдущие исследования нейронов нижней височной коры обезьян проводились на сотнях клеток из этой области сразу. На первый взгляд, это хорошо, поскольку можно получить статистически более достоверную картину. Однако в предыдущих работах нейробиологи не учитывали тот факт, что часть используемых в экспериментах клеток в принципе слабо реагировала на ряд стимулов, а часть находилась в регионе коры, про который известно, что он отвечает за распознавание лиц. Все эти нюансы в новом исследовании были учтены, и авторы отобрали только те клетки, которые реагировали в той или иной степени на все стимулы экспериментального набора и не имели каких-то специфических «предпочтений», например, к лицам. К тому же, ранее использовавшиеся зрительные стимулы были цветными, что, кстати, объясняет разделение одушевленных и неодушевленных объектов. Мех большинства зверей, равно как человеческая кожа и перья птиц, имеет красновато-коричневый оттенок, чего нельзя сказать о поверхности компьютеров, холодильников и автомобилей. Таким образом, «одушевленность», воспринимаемая нейронами инферотемпоральной коры, могла быть просто индикатором того, что стимул несет в себе коричнево-красные оттенки.

Какие же категории объектов на самом деле выделяют клетки нижней височной коры? Кластерный анализ показал, что нейроны инферотемпоральной коры различают объекты высокой и низкой контрастности, вытянутые по горизонтальной или вертикальной оси, широкие или узкие в том или ином направлении, похожие по форме на круг или на звезду (рис. 3).

 

Рис. 3. Категории визуальных объектов, выделенные на основе ответов нейронов нижней височной коры макак

Рис. 3. Категории визуальных объектов, выделенные на основе ответов нейронов нижней височной коры макак. Красным обведены категории, выделяемые на основании похожести форм, желтым — на основании семантических признаков, голубым — на основании простых визуальных признаков. Иллюстрация из обсуждаемой статьи в PLoS Computational Biology

Впрочем, нельзя забывать, что такое разделение — продукт не самих нейронов зрительной коры, а только алгоритма, обработавшего ответы этих нейронов на предъявление различных объектов. В зависимости от значения параметров, задаваемых алгоритму, можно получить и другие варианты классификации зрительных стимулов. Поэтому для окончательного выяснения того, на какие же группы делятся образы в мозге обезьяны, требуется провести и поведенческие опыты (как обезьяна вообще воспринимает тот или иной объект?), и дополнительные нейрофизиологические эксперименты по другим методикам, позволяющим определить, считает ли животное одинаковыми данные два объекта или нет.

Большое количество работ на нейронах нижней височной коры, где последние всё-таки разделяли зрительные стимулы по их смысловому значению, и нынешнее опровержение этих выводов напоминает нам о том, что любые данные требует проверки и перепроверки. Если у явления существует однозначное объяснение («сортировка образов проходит на основании семантики последних»), вероятнее всего, такое объяснение неполно и требует доработки. В этом и заключается сложность и в то же время прелесть науки: нет предела познанию, точек зрения может быть несколько, и каждая из них отражает не всю правду, а только ее часть.

Источник: Carlo Baldassi, Alireza Alemi-Neissi, Marino Pagan, James J. DiCarlo, Riccardo Zecchina, Davide Zoccolan. Shape Similarity, Better than Semantic Membership, Accounts for the Structure of Visual Object Representations in a Population of Monkey Inferotemporal Neurons [http://www.ploscompbiol.org/article/info:doi/10.1371/journal.pcbi.1003167] // PLOS Computational Biology. 2013. V. 9(8). P. e1003167. Doi:10.1371/journal.pcbi.1003167.

См. также:
Roozbeh Kiani, Hossein Esteky, Koorosh Mirpour, and Keiji Tanaka. Object Category Structure in Response Patterns of Neuronal Population in Monkey Inferior Temporal Cortex // Journal of Neurophysiology. 2007. V. 97. P. 4296–4309.

Светлана Ястребова


Вернуться назад