МОДЕЛЬНЫЕ ПРЕДСТАВЛЕНИЯ ОБ ОБЩЕЙ СТРУКТУРЕ ПРОЦЕССА ЗРИТЕЛЬНОГО УЗНАВАНИЯ

Пространственно-частотный анализ в зрении


  • Физиологические данные
  • Возможное устройство анализатора пространственных частот

    Возможное устройство анализатора пространственных частот. Несмотря на недостаток данных о механизмах частотного анализа, мы как и ряд других авторов, считаем возможным, на основе уже имеющихся данных предположить, наличие в зрительной системе механизма типа обобщенного фурье-разложения исходного изображения, служащего для получения удобного описания этого изображения.

    Отталкиваясь от изложенных в и. 1 физиологических данных, в данном разделе излагаются модельные представления о структуре анализатора пространственных частот в зрении и гипотеза о виде пространственно-частотного описания изображения, передаваемого на более высокие уровни обработки.

    Анализатор пространственных частот. Анализатор пространственных частот предназначен для получения удобного описания входного изображения и состоит из "элементарных фильтров" (детекторов пространственных частот), организованных в колонки и сверхколонки (рис. 148).

    Рис. 148. Схематическое изображение анализатора пространственных частот. 1 - элементарный фильтр, 2 - колонка, 3 - сверхколонка.
    Элементарный фильтр (детектор пространственной частоты). Элементарный фильтр представляет собой нейрон с квадратным рецептивным полем (размером 30') в виде решетки определенной ориентации. Реакция на выходе фильтра появляется в том случае, если в контролируемом им участие изображения (т. е. в пределах рецептивного поля) будет содержаться сигнал (перепады яркости), отвечающий трем условиям. Пространственная частота сигнала попадает в полосу пропускаемых фильтром частот. Ориентация сигнала(направление распространения перепадов яркости) попадает в диапазон выделяемых фильтром направлений. Цвет сигнала попадает в цветовую характеристику фильтра. Соседние рецептивные поля нейронов наполовину перекрываются.

    Колонка. Элементарные фильтры организованы в колонку (рис. 148). В нее входят нейроны с накрывающими друг друга рецептивными полями с одной и той же ориентацией. Отличаются нейроны в колонке по детектируемой ими частоте. Существуют колонки, настроенные на решетки разного цвета (синий, красный, зеленый).

    Сверхколонка. Отдельные колонки функционально образуют сверхколонку, "обслуживающую" небольшой участок поля зрения (порядка 30') и содержащую в себе набор элементарных фильтров всех частот, ориентации и цвета.

    Область поля зрения, обслуживаемая анализатором, составляет примерно 3 X 3°, т. е. входит в зону перекрытия полуполей зрения для левого и правого глаза.

    О двух типах анализаторов. Отличие в пространственно-частотной чувствительности простых и сложных клеток коры позволяет предположить, что в коре имеется не один, а два анализатора пространственных частот. Их различие - в наличии или характере связей между сверхколонками. В соответствии с гипотезой гл. IX и выводами предыдущего параграфа предполагается, что один из анализаторов не имеет таких связей, которые уменьшали бы объем передаваемых им дальше сведений об изображении. В отличие от первого, другой анализатор содержит взаимные тормозные связи между элементарными фильтрами, имеющими одинаковую пространственную частоту и ориентацию, и обслуживающими соседние участки ноля зрения, т. е. расположенными в соседних сверхколонках.

    Для того чтобы судить о локализации первого и второго анализаторов, надо обратиться к следующим данным. Эти клетки хорошо отвечали на стимулы в виде протяженных решеток, попадавшие на соседние рецептивные поля этих клеток. Это говорит об отсутствии тормозных связей между "элементарными фильтрами", настроенными на одну и ту же пространственную частоту и ориентацию и обслуживающими соседние небольшие участки ноля зрения (т. е. между клетками, отвечающими на одну и ту же решетку и расположенными в соседних сверхколонках). Отсюда можно заключить, что первый анализатор расположен в 17 поле и включает в себя простые клетки. Известно также, что сложные клетки (17 и 18 поля) тормозились при стимуляции такими протяженными решетками. Это говорит о том, что между одинаковыми элементарными фильтрами, обслуживающими соседние участки поля зрения, есть тормозные связи. Следовательно, второй анализатор включает в себя сложные клетки и имеет иную локализацию (в том же 17 или 18 поле коры).

    Гипотеза о некоторых способах преобразования частотного описания. Основная идея, лежащая в основе развиваемой гипотезы, состоит в том, что разбросанные по многим сверхколонкам анализатора сведения о наличии в разных точках изображения одинаковых пространственных частот или одинаковых ориентации, или одинакового цвета целесообразно (с точки зрения последующих преобразований) упорядочить таким образом, чтобы они были привязаны к определенной "координате", соответствующей оси - оси частот, оси ориентации, оси цветовых оттенков.

    Основные положения гипотезы. Предполагаем, что информация для последующих преобразований поступает от анализатора пространственных частот 1 типа, т. е. имеющего на своих выходах наиболее полную информацию об изображении. Анализатор схематически показан на рис. 149 как участок коры с несколькими сверхколонками, а внутри них - с колонками детекторов разных пространственных частот, разной ориентации и цвета. Волокна с выхода анализатора идут по крайней мере в двух направлениях. Часть идет в более высокие отделы зрительной системы (например, для запоминания этого описания). Другая часть идет в особое нейронное образование или особый "блок", функция которого состоит в том, чтобы отбирать с многочисленных выходов анализатора только часть передаваемой им информации. Какая это часть, зависит от решаемой зрительной задачи. Назовем этот блок "управляемым селектором информации" или просто "селектором".

    Рис. 149. а)схема, иллюстрирующая два типа (I и II) пространственнно-частотных преобразований. 1 - пространственнно-частотный анализатор, 2 - "селектор", 3 - управляющий блок "селектора", 4 - "повторитель" - воспроизведение преобразованного "изображения", 5 - перекодирование для передачи детальной информации, 6 - запоминание детальной информации, содержащейся в изображении (его полного описании); б) схема "селектора" для преобразования пространственно-частотного описания изображения. 1 - "селектор", 2 - управляющий блок селектора, 3 - волокна идущие из пространственно-частотного анализатора, 4 - волокна, выходящие из селекторa. Заштрихована область, относящаяся к низким пространственным частотам, x - ось пространственных частот, у - ось ориентации, z - ось цветов.
    Представим управляемый селектор информации трехмерной структурой, по осям которой откладывается пространственная частота x, ориентация у и цвет z. Структура составлена из "кубиков" (см. рис. 149, б). Поэтому, говоря о координате но любой из осей, мы имеем в виду не точку, а положение кубика на этой оси. Внутри одного кубика представлены сведения от всех участков изображения о присутствии в изображении определенных частоты, ориентации и цвета, соответствующих координатам кубика.

    Чтобы обеспечить передачу в кубик сведений о наличии на разных участках изображения, скажем, определенной частоты, в этот кубик должны приходить волокна от фильтров (детекторов) этой частоты не из всех сверхколонок анализатора, но только от тех колонок внутри них, у которых ориентация и цвет соответствуют координатам кубика 1). Далее, предполагается, что, пройдя "селектор", волокна поступают в следующее нейронное образованно, которое назовем "повторителем" (рис. 149, а). Повторитель но своей структуре точно воспроизводит структуру исходного анализатора: в нем имеются клетки, соответствующие каждому детектору и они тоже объединены в колонки. Волокно от любого детектора анализатора, пройдя "селектор", попадает на соответствующую клетку повторители.

    Функции "селектора" состоит в том, чтобы устранять часть информации, идущей от анализатора к повторителю за счет торможения определенных волокон. Вытормаживаться в этой модели может целиком весь пучок подокон, проходящих через один кубик или через несколько кубиков "селектора". Благодаря упорядоченности кубиков по осям частот, направлений и цветов, нетрудно представить возможную организацию управляющего сигнала, приходящего на селектор и осуществляющего направленное вытормаживание. Например, сигнал, пришедший из некоторого управляющего центра в виде некоторой аналоговой величины, с помощью известного преобразования "величина - место" может быть приложен к любой точке каждой из осей селектора.

    В результате селектор может устранить из информации, передаваемой на повторитель, определенную информацию об ориентации, о цвете, о дипазоне определенных частот. Существенно, что устраненная, а также и оставленная информация никак не связана с каким-либо местом изображения; как говорят, это - нелокальная информация. Пример: подчеркивание перепадов освещенности. Обычно изображение содержит широкий спектр пространственных частот - низкие частоты соответствуют плавным изменениям освещенности, высокие - резким перепадам освещенности и мелким деталям. Если каким-либо образом устранить из спектра пространственных частот изображения высокие частоты, а низкие оставить, то восстановленное изображение будет размытым, нерезким. Если же устранить низкие частоты, то в восстановленном изображении будут подчеркнуты перепады освещенности, что приведет к выделению контуров.

    Любую из этих функций можно осуществить, используя описанный ранее "селектор". В конкретном случае можно представить устранение низких частот из описания изображения посредством вытормаживания всех кубиков низкочастотной части "селектора". на рис. 149, б это его нижняя часть. Предположение о возможности выделения контуров такого рода механизмом на довольно высоком уровне обработки (выше 17 поля коры) не противоречит тому, что контуры могут быть получены уже в сетчатке 1). Согласно изложенной в гл. IX гипотезе выделение контуров в изображении может выполняться в акте зрительного восприятия неоднократно, на разных уровнях зрительной системы, в зависимости от решаемой задачи. Например, при узнавании информация о контурах нужна для разных целей - для выделения границ объектов и выделения его из фона, для бинокулярного слияния по границам (см. предыдущую главу), для выделения локальных признаков и схематического узнавания. Все эти операции выполняются, по-видимому, на разных уровнях зрительной системы, и, возможно, для их выполнения каждый раз необходимо выделять контуры заново.

    Другие примеры. К числу других примеров использования описанного выше "селектора" для извлечения существенной информации можно отнести извлечение информации о виде текстуры. В самом деле, текстуры, будучи весьма регулярными изображениями, содержат весьма ограниченный пространственно-частотный спектр. Значит, любая текстура будет представлена в "селекторе" "возбуждением" вполне определенных кубиков. Нетрудно теперь представить, что с помощью некоторого специального управляющего сигнала в "селекторе" может быть произведен поиск возбужденных кубиков и, тем самым,- считывание описания текстуры. Это описание может быть использовано для узнавания текстуры путем сравнения его с другими описаниями характерных текстур, хранящимися в памяти.

    Изменения пространственно-част?тного описания пpи трансформациях входного изображения. Преобразование поворота. Еще один пример - использование селектора для инвариантного относительно небольшого поворота узнавания изображения. Для такого узнавания можно последовательно "поворачивать" проекцию изображения в коре. С помощью "селектора" вращение осуществить несложно - достаточно сдвинуть все возбужденные кубики параллельно оси ориентации на столько шагов, на сколько нужно повернуть изображение (рис. 149, б). Преобразование сдвига. При небольших смещениях глаз - при дрейфе и микроскачках, т. е. при сдвиге изображения на сетчатке - распределение зон возбуждения в "селекторе" сдвигаться не будет (т. е. будет выполняться своего рода "стабилизация видимого мира").

    Преобразование подобия. Рассмотрим, как изменится спектр при изменении величины изображения на сетчатке Очевидно, ориентационные компоненты спектров не изменятся, частотные же компоненты незначительно изменятся. Если изображение стало но величине больше, то доля низкочастотных составляющих закономерно увеличится, а высокочастотных - уменьшится. Это означает, что спектр изображения сдвинется параллельно оси частот (рис. 149, б).

    В случае суперпозиции упомянутых преобразований спектр изображения меняться не будет, а будет сдвигаться как целое в плоскости, параллельной (х, у). Проведенное качественное рассмотрение позволяет сделать два вывода.

    1) При сличении спектра предъявленного изображения со спектрами разных классов изображений, имеющихся в зрительной памяти, достаточно поступательно сдвигать спектр в плоскости, параллельной (х, у). Это обеспечивает узнавание, инвариантное относительно преобразований сдвига, поворота на небольшой угол 1) и растяжения. 2) Размер изображения можно приближенно оценить по величине самых низкочастотных компонент спектра.

    Заключение. В предыдущем параграфе были приведены аргументы о существовании и зрительной коре двух разных анализаторов пространственных частот - первого, на простых клетках, и второго - на сложных, причем второй отличается от первого наличием латерального взаимодействия между сверхколонками. Изложенная в этом параграфе гипотеза позволяет отождествить второй анализатор с "селектором". Возможно, что выявленное в электрофизиологических опытах латеральное торможение между сложными клетками есть лишь отражение более сложной картины тормозного взаимодействия, управляемого с более высоких уровней коры. Входными волокнами селектора могут быть не только волокна от простых клеток (от первого анализатора), но и волокна от сложных клеток, чувствительных к пространственной частоте. Последнее предположение основано на двух фактах. Во-первых, как уже выше упоминалось, сложные клетки, возможно, имеют независимые от простых входы от НКТ. Во-вторых, сами сложные клетки распадаются на два типа, из которых один тип - клетки, высоко чувствительные к пространственной частоте. Таким образом, в зрительной коре могут помещаться два независимых анализатора пространственных частот. Их назначение - получение пространственно-частотного описания объекта.



  • Поражения мозга
  • Психофизиология
  • Процесс узнавания
  • Анализ зрения
  • Механизмы узнавания
  • Модели зрения

  • TBN.ru - naoe, ?eaouea ii i?aaeeai