Вестибуло-окулярный рефлекс:
история вопроса, современные проблемы и подходы

 

"Every time I read a paper that says
the cerebellum mediates motor learning,
it makes me want to vomit."
A cerebellar researcher.

Содержание

 

На главную страницу | Биологово | Напишите мне письмо! TopList


Краткое предуведомление:

Этот литературный обзор был защищён  мною в качестве курсовой в апреле 2001 года на кафедре Биофизики Физического факультета МГУ. Поскольку у нас на кафедре нет специалистов по данному вопросу, а тема этого обзора не является на самом деле основной темой моей научной деятельности, сделан он достаточно халявно. Многие высказанные в работе тезисы лишены указаний на литературные источники, впрочем, это следствие скорее отсутствия времени и сил, чем отсутствия самих источников. Картинки от руки перерисованы с указанных в списке литературы статей или просто украдены оттуда же. А в общем-то, можно надеятся, что почти всё из написанного здесь - чистая правда :)

Хахалин Арсений


 

Введение

Вестибуло-окулярный рефлекс (в дальнейшем – VOR, от английского термина Vestibulo-Ocular Reflex) является одной из популярных модельных систем при исследованиях мозжечка. Это связано с тем, что этот рефлекс довольно близко приближается к представлениям об идеальном объекте исследования – он относительно прост и, в то же время, демонстрирует все основные свойства и особенности моторных систем. Однако данные, полученные в последние годы, поставили перед исследователями ряд новых проблем и вопросов.

Проявление VOR состоит в компенсаторном движении глаз при активном или пассивном вращении головы, которое стабилизирует изображение на сетчатке, сохраняя взгляд направленным на цель. Даже в полной темноте, без зрительной опоры, VOR действует прекрасно: пассивный поворот головы в некотором направлении вызывает отклонение глаз в обратном направлении на тот же угол – взгляд остаётся неподвижным.

В реальной жизни VOR представляет из себя достаточно сложную систему взаимодействующих элементарных рефлексов, которые используют информацию от десяти сенсоров в двух лабиринтах для управления двенадцатью мускулами двух глаз. Однако в лабораторных экспериментах эту систему обычно удаётся сильно редуцировать. Достоинства VOR, как предмета для изучения, состоят прежде всего в относительной простоте его проявления (долгое время казалось, что VOR может быть охарактеризован единственным численным параметром); возможности значительной редукции количества входных и выходных сигналов (а значит, надеждой на достаточно простой внутренний механизм реализации); относительном постоянстве проявления для самых разных животных (от золотых рыбок до человека). При этом VOR легко поддаётся изменению при обучении, что делает его особенно заманчивым объектом для изучения процессов моторного научения, локализации участков пластичности и выяснения их механизмов.

Как было упомянуто, долгое время считалось, что проявление VOR можно охарактеризовать единственным численным значением – коэффициентом усиления (gain), который определяется, как отношение угловой амплитуды отклонения глаза к угловому отклонению головы. В норме этот коэффициент равен -1, что соответствует отклонению в обратную сторону с той же амплитудой. Однако легко представить себе ситуацию, когда для стабилизации изображения на сетчатке, следовало бы отклонять глаза на какой-то другой угол. Для этого достаточно надеть на глаза увеличивающие или уменьшающие очки. Давний опыт ношения очков людьми подсказывает, что и в этом случае мозг может достаточно быстро приспособиться, так, что изображение на сетчатке опять станет неподвижным при поворотах. Так и происходит – коэффициент усиления VOR изменяется и принимает новое, нецелое значение. В ходе некоторых экспериментов были попытки использовать также зеркальные призмы, которые обращают для надевшего их правое и левое. Как показывает опыт, мозг достаточно быстро приспосабливается и в этом случае (коэффициент усиления становится формально положительным), однако динамика VOR при этом становится слишком отличной от нормальной, что затрудняет анализ получаемых данных. [2] Сейчас эксперименты в основном проводятся с двумя, в некотором смысле, крайними способами обучения: коэффициент усиления = 0 и коэффициент усиления = -2 (х0- и х2-обучение). В первом случае при обучении цель, фиксируемая взглядом, перемещается синхронно с вращением головы (в первых экспериментах это достигалось размещением её на внутренней поверхности одетых на голову животному непрозрачных очков). В этом случае для того, чтобы изображение цели на сетчатке было неподвижным, глаз не должен сдвигаться при вращении головы, тогда направление взгляда будет отслеживать цель. Во втором случае цель также смещается синхронно с вращением головы, однако в обратном направлении. В этом случае для её фиксации глаза должны совершать обратное компенсаторное вращение (как и в нормальном х1 случае), однако с удвоенной амплитудой.

Остановимся кратко на методах, позволяющих упростить исследуемый рефлекс. Во-первых, мы можем ограничиться только горизонтальной составляющей VOR, забыв о вертикальной и вращательной (торсионной) составляющих. Это достигается правильным размещением оси вращения, при котором взгляд смещается лишь вправо-влево и возбуждается лишь один из трёх полукружных каналов вестибулярного аппарата – горизонтальный. Второй важный момент состоит в том, что следует осуществлять вращение всего тела в целом, а не только головы, чтобы, таким образом, избавиться от взаимодействия с установочыми рефлексами на голову и взгляд, связанными с сигналами натяжения от мышц шеи. В случае вращения всем телом единственными афферентными входами для VOR будут вестибулярные сигналы с полукружных каналов и зрительные сигналы. Третьим существенным моментом является то, что все эксперименты по замеру выработанного VOR (но не по его обучению, конечно) должны проводиться в темноте, для того чтобы исключить на этом этапе корректирующее воздействие зрительной информации.

 

Роль мозжечка для выработки и проявления VOR

Клинические проявления повреждений мозжечка были изучены достаточно давно. В набор этих проявлений кроме атаксии (нарушения координации частей тела в пространстве), интенционного тремора (размашистых колебаний, дрожания конечностей при выполнении направленных действий) и дисметрии (неспособности заранее оценить необходимые для достижения цели мышечные усилия) всегда входили глазодвигательные расстройства. После разрушения мозжечка взгляд становится блуждающим, появляется так называемый "маятникообразный нистагм" – спонтанные повороты глазных яблок из стороны в сторону.

Так как мозжечок внутренне функционально структурирован и различные его отделы связаны с различными моторными функциями, довольно быстро удалось определить, что в к глазодвигательным системам относится его область, известная в анатомии как flocculus (в русской литературе – "клочок"), а также непосредственно прилежащий к ней paraflocculus. Эти эволюционно древние области мозжечка расположены в основании его задней доли. Клетки этих областей активизируются при различных сознательных и автоматичных движениях глаз (саккады, свободное отслеживание цели, VOR) [15], причём, как оказалось, можно выделить клетки, связанные только с горизонтальным или только с вертикальным перемещением взгляда [3], то есть имеет место не функциональная, а ориентационная специализация.

Однако, несмотря на очевидность участия мозжечка в глазодвигательных процессах, последствия разрушения или временной деактивации мозжечка для проявления, собственно, VOR различаются для разных животных. В каком-то смысле ситуация здесь повторяет общую для физиологии мозжечка картину: очевидно, что мозжечок сильнейшим образом вовлечён в двигательные процессы, но он не необходим для их выполнения. И при его удалении эти процессы более или менее страдают, лишаются каких-то, может быть, весьма характерных своих черт, но не пропадают до конца. Так у кроликов флоккулотомия приводит к значительму уменьшению величины выработанного VOR (коэффициента усиления), у обезьян такого уменьшения не происходит. Видимо, в эволюционном ряду роль мозжечка для реализации VOR становилась всё более абстрактной (интегративной), реализация же более простых нейронных механизмов отводилась всё более глубоким структурам (ядрам ствола мозга). [1, 15] Мы ещё вернёмся к этому вопросу, сейчас же следует отметить только, что удаление мозжечка у всех животных безусловно сказывается на процессах обучения VOR, делая его либо совершенно невозможным, либо катастрофически снижая и изменяя параметры этого обучения. Таким образом, следует, вероятно, в первую очередь сосредоточиться на мозжечке, как на структуре, связанной с научением VOR , оставляя пока в стороне вопрос о его реализации.

Строение мозжечка

Уникальная упорядоченность строения коры мозжечка была известна достаточно давно. Строгие закономерности её архитектуры бросались в глаза ещё первым исследователям, давая им повод образно сравнивать мозжечок с кристаллом.

Основным структурным элементом коры мозжечка являются клетки Пуркинье. Эти крупные клетки залегают вблизи от поверхности коры, их чрезвычайно разветвлённые дендриты направлены к этой поверхности. Клетки Пуркинье расположены правильными рядами, ветвление их дендритов происходит практически в одной плоскости. Перпендикулярно этой плоскости у самой поверхности коры пролегают ряды параллельных волокон, являющихся Т-образно разветвлёнными аксонами залегающих глубже, в гранулярном слое, клеток-зёрен. Параллельные волокна осуществляют огромное количество синаптических переключений с дендритами последовательно пронизываемых ими клеток Пуркинье, являясь основным информационным входом коры. Аксоны клеток Пуркинье являются единственным выходом мозжечка. Легко заметить, что такая архитектура является пространственно максимально ёмкой реализацией стандартного для модельных нейронных сетей механизма, при котором входной вектор значений (активности параллельных волокон) умножается на вектор весов (синаптические переключения), образуя выходной вектор (активности клеток Пуркинье). Таким образом, мозжечок является, возможно, одной из немногих мозговых структур, работа которых кажется чрезвычайно близкой к простейшей математической модели, и потому, в принципе, должна неплохо ею описываться.

Возбуждние клеток-зёрен производится мшистыми волокнами, начинающимися в ядрах моста и приносящими сигналы из самых различных структур мозга. Клетки-зёрна чрезвычайно мелки и многочисленны, в 1 мм3 гранулярного слоя их насчитывается до 2 миллионов. Это обеспечивает сильную избыточность информационных входов в кору. Согласно микроанатомическим исследованиям, каждая клетка Пуркинье получает входы от примерно 200 000 параллельных волокон!

Другим входом коры является уникальная именно для мозжечка структура – лазающие волокна. Эти волокна, начинаясь в ядрах ствола мозга (в нижних оливах), поднимаются к коре, где оплетают дендриты клеток Пуркинье, образуя чрезвычайно сильную связь за счёт образования множества возбуждающих синаптических контактов. О роли лазающих волокон нужно говорить отдельно, в сущности, роль эта ещё не вполне ясна, так как единой функциональной схемы мозжечка ещё не построено. Так или иначе, сигнал приходящий по этим волокнам можно условно назвать "сигналом ошибки", хотя в каждом конкретном случае, видимо, необходимо конкретизировать, что именно мы имеем в виду. Несомненно только, что активация лазающего волокна приводит к очень сильному разряду клетки-Пуркнье, который сопровождается длительным понижением весов её синаптических входов (это обширно исследуемое явление называется долговременной депрессией – Long-Term Depression – LTD, и является одним из наиболее специфических свойств мозжечка, как нейронной сети). [1]

Следует отметить, что при внутриклеточном отведении можно достаточно легко отличить разряды клеток Пуркинье, связанные с активацией параллельных и лазающих волокон, так как они сильно отличаются по форме и продолжительности. Первые называются "простыми разрядами" (simple spikes) и имеют вид коротких, одиночных импульсов. Вторые называются "сложными" (complex spikes) и представляют из себя серию из примерно десятка следующих друг за другом одиночных разрядов, общая продолжительность комплексного спайка составляет порядка 10 мс.

Кроме того, в коре мозжечка присутствуют несколько видов внутренних интернейронов: клетки Гольджи, корзинчатые и звёздчатые клетки. Все они являются тормозными и, видимо, служат для своеобразной "нормировки" входов и выходов нейронной сети. Клетки Гольджи получают на вход усреднённую активность мшистых волокон, своим выходом тормозя клетки-зёрна, и осуществляя таким образом "фокусировку" входа нейронной сети. Корзинчатые и звёздчатые клетки в качестве входа используют параллельные волокна, а в качестве выхода – различные участки аксона и дендритов клеток Пуркинье, осуществляя, видимо, некоторую нормировочную настройку их ответов.

Для правильного понимания работы мозжечка следует учитывать, что клетки Пуркинье являются тормозными, и, следовательно, эффект LTD, уменьшающий их обычно высокую фоновую импульсацию, является растармаживающим, увеличивая, таким образом, ответ нейронов какой-либо из зависимых структур (а нашем случае – ответ нейронов вестибулярных ядер).

 

Теории мозжечка. Теории научения. LTD

Первые теории мозжечка основывались главным образом на клинических наблюдениях за больными с органическими поражениями мозжечка, а также на экспериментах по его удалению или деактивации у животных. Уже описанная выше клиническая картина этих повреждений, а также тот факт, что при удалении мозжечка сложные движения как бы распадались на ряд последовательных простых (потеря синергии), заставляли думать о мозжечке, как о некотором координаторе движений. Первые теории подходили к мозжечку, как к разностному компаратору, то есть элементу, получающему на вход разность действительного и желаемого положения управляемого объекта (руки, пальца, глазного яблока и т. д.) в пространстве, и имеющему на выходе сигналы, уменьшающие эту разность. Возможно, в некотором смысле такая ситуация имеет место у животных с менее развитой нервной системой, а также в случаях наиболее простого управления.

В дальнейшем в ходе экспериментов с внутриклеточным отведением было установлено, что наиболее характерным сигналом для лазающих волокон, возбуждающим их с наибольшей вероятностью, является неожиданный сигнал от сенсорного входа. В частности, почти всегда лазающие волокна отзываются разрядами на ноницептивные (болевые) сигналы. [1] Это наводило на мысль, что лазающие волокна передают в кору мозжечка некоторый сигнал ошибки, приводящий к настройке, изменению синаптических весов. В этом смысле болевые сигналы являются крайними проявлениями "сигналов ошибки", так как напрямую свидетельствуют о неправильной работе того или иного моторного механизма. Другое возможное название для сигналов лазающих волокон – "контрольные сигналы" или "сигналы управления".

Такой подход к осмыслению роли лазающих волокон кажется логичным и последовательным и в свете сказанного о нейронной организации коры мозжечка. В рамках классической модели, разряд лазающего волокна осуществляет "фиксацию" паттерна, имевшегося в момент разряда на входе клетки Пуркинье (вектор активностей параллельных волокон). В дальнейшем поступление на вход аналогичного паттерна (распределения активностей) вызовет пониженный ответ клетки Пуркинье, а значит, растормаживание управляемых нейронов вестибулярных ядер. Таким образом может быть реализовано классическое обучение нейронной сети, при котором каждому набору входных активностей ставится в соответствие некоторый набор выходных.

Ситуация осложняется тем, что, как показали эксперименты на препаратах, LTD может быть вызван также сильной одновременной активизацией входных параллельных волокон. Однако это явление можно объяснить, как осуществление дополнительной нормировки или настройки входного динамического диапазона.

 

Системы с обратными связями. Модель разностного компаратора. Проблемы высоких частот. Предикторы Смита

Простейшая модель мозжечка рассматривает его как разностный компенсатор (компаратор), который непрерывно отслеживает ошибку – разницу между желаемым и осуществлённым действием – и производит контроль, выдавая сигналы, сводящие эту ошибку к минимуму. Эта схема подразумевает наличие единственной обратной связи, по которой приходит сигнал об ошибке, а также единственного дублирующего канала, по которому в мозжечок поступает копия эффертных (моторных управляющих) и афферентных сигналов.

Однако при ближайшем рассмотрении эта заманчивая своей простотой схема оказывается не лишена ряда очень существенных, критических недостатков. Вообще говоря, именно на этом этапе мы переходим от общего введения к формулировке конкретной проблемы, которую нам предстоит решить.

Во-первых, остаётся неясным, как именно мозжечок на основе абстрактного "сигнала ошибки" вычисляет конкретные управляющие сигналы, или, проще говоря, направление, в котором следует изменять нынешнее положение управляемого объекта. Представляется очень маловероятным, чтобы мозжечок априорно что-то "знал" о структуре этого объекта, – из общих соображений это "знание" должно формироваться в ходе обучения, а не быть заложено в мозжечок изначально, "генетически". Более того, это "представление об управляемом объекте" должно быть сформулировано на обычном для нейронной сети языке весовых коэффициентов, то есть корреляций между входными и выходными векторами активностей. Указанные доводы заставляют нас серьёзно усложнить модель, так как теперь в неё необходимо ввести механизмы обучения, которые бы обеспечивали правильное накопление подобных корреляций.

С экспериментальной точки зрения это положение можно прокомментировать следующим образом: если мозжечок действует как компаратор и имеет некоторое изначальное представление о структуре управляемого объекта, зависимость интенсивности сигнала ошибки от времени будет иметь вид некоторой монотонно убывающей функции. Если же мозжечок способен формировать это представление "на ходу", то, при смене некоторых условий, определяющих необходимость адаптации, сигнал ошибки пройдёт сначала через фазу некоторого неубывающего поведения (например, будет возрастать или демонстрировать полустохастические режимы), и только потом начнёт убывать, как в первом случае. [8] Процесс коррекции ошибки, таким образом, разделится на два временных этапа: построение внутреннего представления и, собственно, устранение ошибки методом сравнения с этим представлением.

Второе, более кардинальное замечание, касается характерных времён работы мозжечка и работы обратных связей. Осуществляемые движения могут быть довольно быстрыми и достигать характерных времён порядка 10 мс (например, работа на клавиатуре, движения при письме и, конечно, движения глаз). Эти движения нуждаются в коррекции ничуть не меньше, чем медленные, однако время формирования сигнала ошибки для любого моторного процесса имеет время порядка 100 мс. В случае проприорецептивных сигналов это связано с инертностью мышц и рецепторов, задержками проведения, в случае зрительных сигналов – со сложностью обработки поступающей информации, большим количеством переключений и большой протяжённостью проводящих путей. В этих условиях схема с прямой коррекцией ошибки явно перестаёт работать и требуется придумать что-то другое.

Обратимся для примера к нашей непосредственной теме. Пока эксперименты по изменению величины VOR проводились при малых частотах (до 1 Гц), получаемые результаты хорошо согласовывались с простейшей теорией. Однако для частот больших 1 Гц теория предсказывала невозможность научения. Так, например, при синусоидальной стимуляции (см. раздел с описанием экспериментальных методик) для частоты 5 Гц теория предсказывала "обратное" или "неправильное" обучение, так как задержка сигнала ошибки в 100 мс обеспечивала бы его приход в противофазе с тем движением головы, которое служило основой для его выработки. [2] Однако эксперименты показали, что в таких условиях VOR не только довольно хорошо вырабатывается, но и демонстрирует ряд новых интересных свойств. [4, 13] Результаты этих экспериментов послужили неоспоримым доводом в пользу построения новых теорий мозжечка, однако достигнутый в этом направлении прогресс пока что оставляет желать лучшего.

"Противоречие высоких частот" заставило ряд исследователей обратиться к структурной схеме, известной в теории функциональных схем как "Предикторы Смита" (Smith Predictors). [8] Эти схемы представляют из себя развитие простейшей схемы "Контроллер – Объект – Обратная связь", необходимое в случае, когда обратная связь имеет слишком большие задержки по сравнению с характерным временем процесса. Параллельно контроллеру в схему включается модель контролируемого объекта, которая предсказывает контроллеру ответ объекта без столь фатальной задержки. Это позволяет управлять объектом не больших частотах, отстающий же сигнал ошибки можно использовать для коррекции модели, если эта коррекция достаточно очевидна.

Если же, как в случае мозжечка, коррекция модели также представляет из себя сложную задачу (эта коррекция также должна происходить "сама по себе", мы, как и прежде, не вправе требовать от мозжечка "знания" модели), схему приходится ещё раз усложнить. При этом вводится дополнительная линия задержки и/или вторая модель, аналогичная первой. Работу схемы в этом случае можно представить себе следующим образом: на основе сигналов от модели (без задержки) контроллер вырабатывает управляющие сигналы. Сигнал ошибки от объекта приходит с некоторой задержкой и сравнивается с искусственно задержанным (!) ответом модели (или с ответом второй модели, которая отстаёт от первой во времени на определённую величину). В этом случае можно произвести правильную модификацию модели по нейросетевым (корреляционным) принципам. В случае двух моделей первую надо затем синхронизовать со второй.

Указанная схема далеко не является идеальной в отношении её приложимости к мозжечку. Так неясно, как именно в биологической сети может быть реализована указанная искусственная линия задержки. Специального удлиннения путей проведения и организация за этот счёт цепей обратной связи с задержкой не было обнаружено, более того, такие цепи, видимо, противоречат базовой концепции "адаптивности" мозга млекопитающих (хотя вполне могут быть обнаружены в нервной системе беспозвоночных). Другим возможным выходом является введение своеобразной "избирательности" модификации синаптических весов, при которой при поступлении сигнала ошибки веса изменяются в корреляции с вектором активности, имевшим место какое-то определённое время назад (порядка 100 мс). Однако такое предположение представляется не менее искусственным, хотя ряд исследователей продолжают отстаивать его, видимо, отчаявшись предложить какие-либо иные механизмы для преодоления проблемы задержек.

С экспериментальной точки зрения, подобный "предиктор Смита" может быть выявлен при определении всё той же закономерности изменения интенсивности сигнала ошибки в зависимости от времени. В этом случае, при предъявлении необученной сети проблемной ситуации, в начале сигнал ошибки должен быть практически нулевым (а не максимальным, как в случае классического компаратора!). Это связано с тем, что в самом начале модель объекта ещё не построена, и, собственно говоря, управляющий сигнал ещё не с чем сравнивать. Сигнал ошибки очень мал и имеет некоторый неупорядоченный, "шумовой" вид. Затем, по мере обучения модели, сигнал ошибки должен расти, достигая некоторого максимума, и только потом, на второй стадии, снижаться, уже вследствие приведения объекта к поведению выработанной модели. Подобные кривые действительно были получены для ряда мозжечковых систем (свободное преследование цели конечностью, формирование некоторых специальных инструментальных навыков), но не были продемонстрированы для выработки VOR. Возможно это связано с очень малым, в сущности, количеством экспериментов с внутриклеточной регистрацией, поскольку проведение такой регистрации на животном, которое должно подвергаться высокоамплитудным, высокочастотным вращениям со стереотаксической фиксацией головы, очень сложно технически. Именно такие эксперименты на сегодняшний день представляли бы наибольший интерес и, безусловно, должны быть отнесены к числу первоочередных задач в данной области.

 

Нейронная организация рефлекторной цепи. Построение структурной схемы. Варианты Ито. Локализация участков пластичности

Основой нейронной архитекторы, реализующей VOR является простая трёхнейронная дуга: первичные афференты от лабиринтов – вестибулярное ядро – окуломоторное ядро. Своеобразной "надстройкой" над этой простой структурой является мозжечковая система, получающая афферентацию как от первичных (ипсилатеральных), так и от вторичных (ипси- и контралатеральных) вестибулярных нейронов (по моховидным волокнам), а также сигналы обратной связи от зрительных анализаторов (через переключения в претектальной области и области dorsal cap). Выход мозжечка – аксоны клеток Пуркинье – переключается на нейроны ипсилатеральных вестибулярных ядер, образуя добавочную петлю. [1, 3]

На протяжении долгого времени не утихал спор о локализации участков пластичности, ответственных за адаптацию VOR. [5, 15] Данные о последствиях флоккулотомии для различных животных указывали на то, что по крайней мере какая-то составляющая наученного VOR сохраняется при этой процедуре у всех их, в большей или меньшей степени. Это дало основание полагать, что по крайней мере одной из зон пластичности являются вестибулярные ядра ствола мозга. Другое основание для подобного заключения было найдено в экспериментах по стимуляции "ступенькой скорости", в ходе которых животное почти мгновенно приводилось в быстрое вращение со постоянной скоростью, а затем так же практически мгновенно останавливалось. Такой метод идеально подходит для изучения динамики VOR, поскольку позволяет различать ранние и поздние ответы (в той мере, в которой фронт этой "ступеньки скорости" в действительности можно считать резким), в отличие от метода синусоидальной стимуляции. В ходе этих экспериментов было установлено, что динамический ответ VOR имеет сложную структуру. В первые 10-15 мс после приложения ускорения следует ранняя, мало модифицируемая компонента ответа. Разные исследователи склонны или вообще отказывать этой компоненте в способности к адаптации или считают её малой. Позже мы ещё вернёмся к этому вопросу (см. теорию двух каналов). Затем, с задержками около 20-45 мс, следует поздняя компонента ответа, которая демонстрирует значительную адаптацию по величине достигнутого плато. В ряде экспериментов были получены данные и по динамике на больших масштабах времени (порядка сотен мс), на которых плато приобретает вид монотонно возрастающей или убывающей функции. Удовлетворительной интерпретации этих данных не было получено, в отличие от данных о ранних и поздних ответах, которые, как кажется, хорошо согласуются с нашими представлениями о нейронной организации рефлекторной дуги. Времена ранних ответов вполне соответствуют временам переключения трёхнейронной дуги, тогда как поздние ответы возникают, видимо, как сигнал от мозжечкового ответвления. Аналогичные результаты были получены и при искусственном "прозванивании" указанных нейронных цепей.

Таким образом, следует полагать, что в адаптацию VOR должны быть, скорее всего, вовлечены 1 или 2 участка пластичности: мозжечок, вестибулярные ядра или обе эти области. В настоящее время наиболее признанной является теория двух участков [5], при этом главным аргументом в её пользу являются наличие двух ответов с разными временами задержки, которые могут входить в состав конечного сигнала в разных "соотношениях" по амплитуде, а также поведение адаптационной системы VOR на больших частотах, которое будет рассмотрено ниже.

Следующим этапом для нас должно было бы стать построение структурной схемы для данной нейронной структуры, подразумевающей расшифровку основных сигналов и простановку весов и временных характеристик нейронных переключений. Первые шаги в этом направлении были сделаны Ито. [1] Он рассмотрел различные модели обратных связей, охватывающих систему, поставил вопрос о фазовых соотношениях между сигналами (какой именно сигнал приходит по первичным афферентам: сигнал о скорости головы или её ускорении? Какой именно сигнал приходит по цепи обратной связи, или, говоря иначе, для какой координаты вычисляется "ошибка": для скорости движения взгляда или его положения относительно цели?). Эти вопросы, которые могут показаться несущественными со структурной точки зрения, играют существенную роль при попытках математического моделирования динамики сети. Также оставался неясным вопрос о характерных временах проведения, переключения и адаптации отдельных элементов схемы.

 

Идеи построения математической модели. Линейное приближение, переход к действительным значениям активности. Простейший пример

Построение математической модели можно начать с простейшего одноканального линейного приближения. При этом мы:

1) Пренебрегаем в некотором смысле наиболее существенным свойством нейронной сети: тем, что она работает с векторами значений активности и переходим к скалярному случаю, полагая активности всех клеток той или иной структуры одинаковыми. Это приближение может быть использовано только если входные и выходные сигналы всех рассматриваемых структур имеют достаточно узкие распределения времён задержек (по сравнению со средним временем задержки), и при этом близкие или линейно зависимые значения активностей в каждый момент времени. По сути дела, это предложение соответствует интуитивно очевидному представлению о канале, несущем только один сигнал.

В некоторых случаях удаётся применять это приближение и к каналом с довольно широким "шумовым" распределением активностей, если паттерн этого широкого распределения вследствие нерегулярных изменений активностей отдельных элементов усредняется по времени. Однако этот случай относится к числу специальных и в случае системы VOR, видимо, места не имеет.

2) Пренебрегаем существенной в случае обработки многих равноправных независимых каналов нелинейностью всех элементов сети (нелинейными функциями нейронов). В этом случае каждый элемент схемы будет характеризоваться только весом своих входов или, в более "продвинутых" схемах – ещё и характерным временем задержки τ. В ещё более сложном, но всё ещё линейном случае, нейрон можно характеризовать ядром линейного интегрального выражения для вычисления активности:

(1)

3) В действительности активности нейронов, естественно, не имеют знака, поскольку представляют собой характеристику частоты (и, в некоторых случаях, амплитуды) разрядов аксона. Поэтому наиболее естественной числовой характеристикой активности была бы положительная величина (например, среднее количество импульсов в единицу времени) изменяющаяся от нуля до некоторого максимального значения и в покое равная некоторому среднему значению спонтанной импульсации. Однако для моделирования такое представление не очень удобно, и если можно перейти к более простому, это надо сделать непременно.

В случае с моделированием VOR это, видимо, вполне возможно. Система, реализующая этот рефлекс, симметрична по отношению к правому и левому, причём импульсации клеток соответствующих ипсилатеральных и контралатеральных элементов системы имеют противоположное значение для системы (способствуют или препятствуют вращению в головы в противоположные стороны и т. д.). Это означает, что мы можем условно "свести" эти соответствующие элементы воедино, позволяя при этом активностям клеток принимать как положительные, так и отрицательные значения. Очевидно, что в линейном приближении эти картины эквивалентны. Состоянию покоя в этом случае будет соответствовать нулевая активность.

При анализе синусоидальных колебаний мы можем перейти даже к комплексным представлениям активностей (для анализа возникающих разностей фаз, например), однако в этом случае следует быть аккуратным, выписывая корреляционные соотношения между активностями (например, при обучении сети), поскольку в эти соотношения должны войти только действительные части комплексных активностей.

Представим здесь для иллюстрации уравнения для простейшей схемы – первой схеме Ито, соответствующей системе VOR с одной отрицательной обратной связью, несущей сигнал зрительной ошибки.

Выпишем уравнения, соответствующие схеме:

(2)

Здесь Е – сигнал, управляющий движением глаз (скоростью вращения глазного яблока), Н – сигнал от вестибулярного органа (в этом приближении равный угловой скорости вращения головы), этот же сигнал мы считаем приходящим к клеткам Пуркинье по параллельным волокнам, Т – скорость перемещения цели. Р – активность клеток Пуркинье, err – сигнал ошибки, вычисляемый как разность скоростей направления взгляда и направления на мишень (такой способ вычисления ошибки может показаться неоправданным, но в этом приближении, когда нас интересует лишь качественное воспроизведение картины, он вполне удовлетворят нашим требованиям. Переход от скоростей взгляда и мишени и их координатам вызовет лишь появление определённого сдвига фаз, который на этом этапе нас не интересует). w – весовые коэффициенты синапсов "параллельные волокна – клетки Пуркинье". Все указанные величины являются функциями времени, зависимость от времени в уравнениях (2) опущена для краткости для всех величин, кроме сигнала ошибки, который входит во второе и четвёртое уравнения системы с задержкой τ (порядка 100 мс). α – некоторый положительный коэффициент, характеризующий скорость адаптации синапсов.

Введя ещё большие упрощения, систему можно разрешить аналитически. Пусть:

 (3)

Первое уравнение системы (3) характеризует наш способ обучения, при котором цель движется синхронно с движениями головы, А – некоторый постоянный коэффициент (А = 1 для случая х0-научения (цель сопровождает направление пассивного взгляда, А = 0 для нормального случая (неподвижная мишень), А = –1 для случая х2-научения). Второе уравнение характеризует малость характерных времён изменения сигнала стимуляции по сравнению со временем проведения ошибки. В случае синусоидальной стимуляции это означает, что частота вращения ν должна быть меньше 1 Гц. Тогда, разрешая систему (2)-(3) относительно w, получаем дифференциальное уравнение:

 (4)

Решение этого уравнения зависит от Н, однако качественно оно всегда представляет из себя функцию, монотонно асимптотически приближающуюся к предельному значению wend = 2 – A.

Если не полагать τ малым, решение системы может перестать сходиться к стационарному решению или сойтись к решению, не являющемуся оптимальным для управления (проблема высоких частот, упоминавшая выше). Именно поэтому эта простейшая схема была признана неудовлетворительной, как только были получены результаты по научению VOR на высоких частотах синусоидальной стимуляции (1-10 Гц).

 

Описание экспериментов. Методики

Наиболее интересные эксперименты по исследованию VOR были поставлены на обезьянах, ввиду известной схожести их мозга с человеческим. (Как уже указывалось, существует подозрение, что в эволюционном ряду роль различных элементов нейронной цепи в реализации VOR существенным образом менялась, что делает выбор объекта исследования достаточно критичным). В то же время, эксперименты на обезьянах очень дороги, поскольку повреждения, наносимые животным в ходе исследования, весьма значительны, так что после серии экспериментов животных приходится усыплять. В частности именно поэтому все основные работы, результаты которых упоминаются здесь, были выполнены в Америке.

В настоящей работе я привожу краткое описание наиболее сложных экспериментов, производившихся в лаборатории С. Лисбергера в 1978-1998 гг. [2, 3, 7, 13]

Животное (макака резус или беличья игрунка) жёстко зафиксированы в кресле. Голова животного приведена в необходимое положение, так что плоскость вращения проходит через плоскость горизонтального полукружного канала. При этом голова закрепляется на специальном жёстком основании при помощи четырёх болтов, под анестезией ввинченных в череп, что обеспечивает достаточно жёсткую фиксацию. В глаз животному внедряется магнитная катушка – маленькое кольцо из проводящего материала. При движении глаза изменяется индуктивная связь этой катушки с внешними высокочастотными катушками, и по изменению этой связи можно с точностью до долей градуса определить направление взгляда. [10] В большинстве экспериментов производилась также трепанация черепа и в мозжечок вживлялись электроды для внутриклеточной регистрации разрядов клеток Пуркинье.

В первых сериях экспериментов на животное были одеты очки с линзами или очки с нарисованной на внутренней стороне мишенью. Мишень представляла собой яркую точку в темноте и представляла для обезьяны значимый стимул. В более поздних экспериментах в качестве цели использовался прямоугольный узор, проецируемый на полукруглый экран после отражения от подвижного зеркала. Поворачивая зеркало при помощи сервомеханизма, можно было добиться заданного движения цели. Кресло с закреплённым в нём животным также приводилось во вращение сервомотором. Если направление взгляда животного отклонялось от направления на центр прямоугольника не более чем на заданный угол, оно с некоторой частотой получало жидкое вознаграждение через трубку, введённую в рот. Погрешности при определении положения цели и величин вестибулярной стимуляции составляли порядка 10%.

Использовалось несколько различных режимов стимуляции:

1) Синусоидальная стимуляция с частотами в диапазоне от 0.5 до 10 Гц.

2) Стимуляция "ступенькой скорости". Кресло по возможности быстро (~50 мс) приводилось во вращение, после чего двигалось с постоянной угловой скоростью (~30°/с мс) в течении времени, достаточного для прекращения всех переходных (главным образом механических) процессов (~500 мс). Затем кресло так же резко останавливалось, выдерживалось некоторое время (~500 мс) в покое и движение повторялось в обратную сторону. В случае обучения цель была включена всё время, в случае снятия динамики и амплитуды обученного VOR, в моменты приложения ускорения цель отключали, таким образом VOR снимался в темноте, без зрительного контроля.

3) Стимуляция "ступенькой скорости" с отложенным движением цели. [13] В ходе этих экспериментов кресло и цель двигались так же, как в предыдущем случае, однако при обучении цель подсвечивалась только в течение недолгого промежутка времени, совпадавшего либо с началом движения (разгон и начало движения с постоянной скоростью), либо с серединой (движение с постоянной скоростью), либо с концом (остановка). Так как зрительные сигналы ошибки, очевидно, вырабатываются только при включённой цели, с помощью этих "смещений" можно было изменять время перекрывания отстающих сигналов ошибки и синхронных вестибулярных сигналов, поступающих в обучающуюся нейронную сеть.

 

Проблемные результаты исследования динамики

В ходе экспериментов со стимуляцией "ступенькой скорости" была впервые получена упоминавшаяся сложная картина динамики VOR, при котором движение глаза распадается на две фазы: ранний и поздний ответы. На рисунке приведены усреднённые графики для VOR с малым (0.5), нормальным (1) и большим (1.7) коэффициентами усиления по скорости. Из этих графиков видно, что по мере уменьшения коэффициента усиления всё более заметной становится сложная структура сигнала. Он начинается со своеобразного быстрого "выброса" (ранний ответ), резкого движения глаза в направлении, противоположном движению головы, причём величина этого "выброса" практически не меняется по мере уменьшения коэффициента усиления. При больших коэффициентах этот "выброс" становится незаметен, так как сливается с передним фронтом плато (поздний ответ). При нормальном VOR их амплитуды примерно равны.

При этой же схеме стимуляции были проведены внутриклеточные записи разрядов нейронов вестибулярного нерва (в состав которого входят как первичные так и вторичные нейроны). Оказалось, что по характеру ответов среди этих нейронов чётко выделяются две полярные группы и всё разнообразие переходных состояний между ними. Первая крайняя группа нейронов обладает скорее тонической, регулярной импульсацией. Эти нейроны имеют высокие значения фоновой активности, а график их активности в зависимости от времени достаточно чётко воспроизводит плато на графике записи движения глаза. Вторая группа нейронов обладает нерегулярной, фазической импульсацией в виде отдельных выбросов, причём выбросы эти соответствуют выбросам раннего ответа на графике движения глаза. Ответы нейронов первой группы отстают от переднего фронта стимуляции на 5-10 мс, нейроны второй группы – на 7-17 мс, что также совпадает с задержками на графиках отклонения глазных яблок.

Следует отдельно отметить, что имеет место именно "непрерывное" распределение нейронов между этими двумя крайними типами, так что достигаются все режимы ответов. При построении графиков зависимости времени запаздывания ответа от отношения (амплитуда начального выброса / амплитуда плато), получается достаточно размытая тенденция к уменьшению запаздывания при росте указанного отношения.

При записи ответов этих же клеток на синусоидальную стимуляцию были получены вполне закономерные результаты. Все клетки давали "синусоидально" модулированный ответ, причём те из них, которые демонстрировали большие задержки ответа на прямоугольные импульс, давали больший сдвиг фаз.

 

Схема двух каналов. Схема рекуррентной сети

При построении модели проведения указанных разнообразных сигналов можно ограничиться всего двумя – медленным сигналом "плато" и быстрым сигналом "выброса", считая все остальные варианты их линейными комбинациями.

Первой и наиболее простой идеей является модель взвешенного суммирования этих двух каналов. При этом выбор весовых коэффициентов этого суммирования и становится основным механизмом пластичности VOR, поскольку форма ответов отдельных нейронов представляется неизменной, по крайней мере качественно, при изменении коэффициента усиления VOR. [4, 10]

Однако в дальнейшем С. Лисбергером и Т. Зейновски была предложена рекуррентная модель нейронной сети, которая при движении к устойчивому состоянию демонстрирует динамику, весьма сходную с динамикой движения глаза в ответ на резкое приложение скорости. [6] Схема этой сети приведена на рисунке. Видно, что эта схема отличается от простейшей наличием положительной обратной связи, сходной с таковой во второй схеме Ито. Здесь Р – клетка Пуркинье, Т1 и Т2 – вставочные нейроны, первый соответствует пути от вестибулярного ядра через моховидные волокна в мозжечок, второй – аналогичному пути от окуломоторного ядра. Для обоих этих нейронов в модели существенно, что они обладают не только некоторыми модифицируемыми весами переключения, но и переходными характеристиками, так что их активность определяется соотношением типа (1). В наиболее простом случае эти характеристики экспоненциально спадают к нулю и имеют характерные времена τ1 и τ2. Е – клетка вестибулярного ядра, её выход является управляющим сигналом для мышц, вращающих глазное яблоко.

Система уравнений для такой системы имеет вид:

(5)

, где Kτ[ ] – линейный оператор, подобный (1):

(6)

Компьютерные симуляции показали, что система приходит к стационарному режиму только при равных коэффициентах w1 и w2, так что они не могут отражать механизмы пластичности в данной модели. Величины же характерных времён τ1 и τ2, напротив, сильнейшим образом меняют ответ системы. Характерные графики зависимостей Е(t) для сходных τ1 и τ2 представляют из себя более-менее плавный выход на плато стационарного состояния, тогда как разные τ1 и τ2 (различие в два-три раза) приводят к очень характерным временным зависимостям ответа системы: сначала имеет место резкий выброс (в этот момент активность одного нейрона существенно превышает активность второго), затем система приходит к стационарному состоянию. Стационарное значение выхода системы определяется весовыми коэффициентами w1 и w2. Даже без рисунка (которого, к сожалению, нет) можно понять, что указанные динамические картины действительно весьма сходны с наблюдаемыми в действительности динамическими ответами системы VOR.

Таким образом, указанный подход может оказаться плодотворным при анализе быстрых и медленных ответов. В действии системы, подобной данной, можно искать происхождение формы сигналов быстрого и медленного каналов в ответах нейронах вестибулярного ядра.

 

Проблемные результаты в области высоких частот

Как уже не раз указывалось, простейшая теория предсказывала отсутствие научения при высокочастотной синусоидальной стимуляции, и, в частности, "неправильное" или "обратное" научение при частоте 5 Гц, когда задержка проведения и характерное время обращения сигнала в свою противоположность имеют своеобразный "резонанс". Однако проведённые в последние годы эксперименты показали, что обучение на этих частотах имеет место, хотя и не так эффективно, как на низких. Более того, на этих частотах демонстрируется такое интересное и не объяснённое до сих пор свойство, как "частотная настройка ответа": VOR, выученный на некоторой частоте в диапазоне 1-10 Гц лучше всего воспроизводится на той же самой частоте. [13]

Результаты такого обучения представлены на рисунке. Отдельные графики соответствуют разным частотам обучения, оси абсцисс – разным частотам тестовой стимуляции, оси ординат – относительным изменениям проявленных значений VOR. Обучение продолжалось равное время для всех частот. Закрашенные значки соответствуют обучению на х2 VOR, пустые – обучению на х0, разные виды значков – опытам с разными обезьянами из экспериментальной группы. Видно, что лучше всего обучение происходит, как и следовало полагать, на малых частотах, воспроизводится оно при этом на всех частотах тестирования. Однако совершенно неожиданным является то, что даже на частоте 10 Гц, когда время проведения сигнала превышает характерное время его изменения, обучение всё-таки происходит, VOR проявляет значимую тенденцию к уменьшению или увеличению. Хорошо заметна и упомянутая "частотная настройка", когда на кривой воспроизведения VOR для разных частот неожиданно обнаруживается максимум на частоте обучения.

В этом же разделе будет логичным упомянуть о результатах другого эксперимента, проведённого по описанной выше "методике стимуляции N3". В ходе этого эксперимента, напомним, цель была погашена и включалась только на короткий промежуток времени, соответствующий началу, середине и концу "ступеньки скорости". На рисунке приведены изменения раннего и позднего VOR (левый и правый графики соответственно) при указанных трёх вариантах стимуляции (левые, средние и правые столбцы точек на каждом графике соответственно). При этом вестибулярный стимул длился 600 мс, зрительный – 150 мс, периоды совпадения этих двух стимулов имели место на промежутках 0-150 мс, 225-375 и 150-600 мс соответственно. Ранним VOR считался ответ в промежутке 40-50 мс после фронта вестибулярной стимуляции, поздним – ответ в промежутке 450-575 мс.

Достаточно последовательного теоретического объяснения этих данных, а также данных о частотной настройке VOR, до сих пор сделано не было.

 

Сравнение обучения на высоких и низких частотах. Критерии на сигналы обучения

Основную проблему изучения адаптационных процессов в мозжечке можно формулировать разными способами. В качестве одной из многих формулировок задачи, которая стоит перед исследователями VOR, можно предложить следующую: "Определить, какие именно сигналы и как обуславливают адаптацию величины VOR". Очевидно, что знание всех элементов, участвующих в адаптации, вместе со знанием значения всех сигналов, поступающих на эти элементы, является практически полным знанием о системе, по которому можно восстановить большую часть аспектов её внутренней работы.

Попытаемся из совершенно общих соображений сформулировать критерии, которым должны удовлетворять сигналы, ответственные за изменение коэффициента VOR. Речь в данном случае идёт о парах сигналов, поскольку именно закрепление корреляций между парой входов является основным методом обучения в нейронных сетях.

1) (Достаточность) По набору сигналов, обеспечивающих обучение, система должна однозначно определять направление требуемого изменения коэффициента VOR.

Это означает, что мы имеем возможность сразу исключить из числа кандидатов на определяющие те пары сигналов, фазовые соотношения между которыми меняются при изменении частоты.

2) (Необходимость) Сигналы, обеспечивающие обучение, должны демонстрировать сходные соотношения между собой при любой стимуляции, если только она вызывает сходное изменение величины VOR. [9, 14]

Будем применять эти критерии к имеющимся в нашем распоряжении сигналам. Основная проблема на этом пути состоит в том, что мы не можем разделить сигналы разных входов мозжечка, так как входные волокна уложены слишком плотно и сложно для хорошего внутриклеточного отведения. Эта проблема (проблема невозможности снятия входных сигналов) является общей для моторной нейрофизиологии, поскольку проводящие пути слишком хорошо уложены и слишком хорошо изолированы, чтобы повреждение, неизбежное при снятии показаний активности отдельных волокон, не было совершенно фатальным для нормальной работы проводящего нерва. Поэтому хотя нас интересуют именно входные сигналы, мы будем вынуждены манипулировать с выходными: с внутриклеточными отведениями от клеток Пуркинье. При этом мы в большинстве случаев (если импульсация клеток не слишком велика) можем отличить комплексные разряды от простых, тем самым дифференцировав входа по моховидным и лазающим волокнам, однако в пределах моховидных волокон мы не можем произвести никакого разделения, хотя, как было указано, эти волокна приносят в мозжечок набор различных входов от вестибулярного аппарата (первичные и вторичные, входы различной динамики, от различных областей рецептора и т.д.), входы положительной и отрицательной обратных связей от вестибулярного и окуломоторного ядер и т.д.

В нашем распоряжении, фактически, лишь три вида сигналов: 1) простые разряды клеток Пуркинье (соответствующие последствиям обработки всего указанного разнообразия входов и являющиеся, в то же время, прямой составляющей сигнала, управляющего положением глазного яблока); 2) сложные разряды клеток Пуркинье (сигналы ошибки от зрительной системы); 3) вестибулярные входные сигналы, которые мы не можем зафиксировать, но которые, по крайней мере можем предсказать, зная закон движения головы. Эти сигналы были зарегистрированы в серии экспериментов [14]. Животное с нормальной величиной VOR подвергалось обычной процедуре обучения, но активность её клеток Пуркинье измерялась в процессе этого обучения. Таким образом были записаны все три вида сигналов для разных частот стимуляции. Рассмотрим все варианты парного взаимодействия этих сигналов:

Простые разряды – вестибулярный стимул. Как оказалось, эта пара сигналов не соответствует первому критерию, поскольку если для малых частот (0.5 Гц) простые разряды клеток Пуркинье были синфазны с вращением головы при х0 обучении и находились в противофазе при х2 обучении, то при высокой частоте (5 Гц) они были в противофазе с вестибулярной стимуляцией в обоих, х0 и х2 случаях. [6] Напомним, что частота 5 Гц является в некотором смысле критической [1], так как именно на ней время задержки сигнала ошибки совпадает с полупериодом стимуляции, и именно при этой частоте следует ожидать наибольших отличий поведения системы от простейшей схемы. Таким образом, мы можем ожидать, что все частоты между 0.5 и 5 Гц будут вызывать в некотором смысле "промежуточный тип" поведения сети и для анализа фазовых закономерностей мы можем ограничиться тестированием этих двух крайних случаев, пропустив все промежуточные частоты.

Комплексные разряды – вестибулярный стимул. Результаты экспериментов показали, что при первой характерной частоте (0.5 Гц) максимумы импульсации лазающих волокон соответствовали максимумам вестибулярного сигнала при х2- и минимумам при х0-обучении. При обучении на частоте 5 Гц ситуация была обратной (при х2-обучении максимумы активности соответствовали минимумам скорости вращения головы, а при х0 – максимумам). Однако, несмотря на разные фазовые соотношения между сигналами в этих двух случаях, ситуации х0- и х2-обучения различимы на обоих частотах.

Простые разряды – комплексные разряды. Нетрудно догадаться, что эта пара не годится для обучения по той же причине, по которой не подходит для обучения первая пара. Простые разряды клеток Пуркинье на частоте 5 Гц перестают различаться по фазе для х0- и х2-обучения, а потому не могут нести информации, необходимой для обучения мозжечка.

Таким образом, из имеющихся в наличии сигналов единственной парой, пригодной для обучения, является пара "Комплексные разряды – вестибулярный стимул", то есть обучение может происходить путём накопления корреляций между входами, поступающими на параллельные и лазающие волокна. В каком-то смысле, мы вернулись на исходные позиции, так как полученный нами результат формально ничем не отличается от постулата мозжечкового обучения, выдвинутого нами в самом начале. Два существенных момента, которые надо отметить в этой связи, таковы: 1) По крайней мере мы можем исключить из рассмотрения модели, в которых активность клеток Пуркинье с выхода мозжечковой системы без значительной задержки подаётся на её вход. 2) Зафиксированные нами фазовые соотношения между сигналами ошибки и вестибулярными сигналами в точности соответствуют ожидавшимся, то есть при переходе от частоты 0.5 Гц к частоте 5 Гц произошла смена фазы на π. Однако вопреки нашим ожиданиям, обучение при этом не исчезло и никакого сбоя не произошло.

Для объяснения самой возможности выработки VOR на высоких частотах, следует предложить модель, которая позволит абстрагироваться от конкретных фазовых совпадений или несовпадений синусоидальных сигналов. Одно из возможных направлений уже было нами указано в разделе "Предикторы Смита". Система может как бы "выучить" входной сигнал, а также свой на него ответ, и только потом произвести модификацию реального ответа на основе этого "внутреннего" представления возмущающего сигнала и контролируемой системы. Другой подход, или, по крайней мере, попытка такого подхода, была предложена С. Лисбергером [14]. В своей модели выработки VOR при высокочастотной синусоидальной стимуляции он вводит в качестве входа клеток Пуркинье набор сигналов, представляющих из себя синусоиды одной частоты (частоты стимуляции) со всевозможными сдвигами фаз.

 

Схема Лисбергера (модель многих фаз)

При анализе фазовых соотношений между сигналами вторичных вестибулярных афферентов и исходной вестибулярной стимуляцией было установлено, что среди сигналов, передаваемых по отдельным волокнам, присутствуют таковые с различными фазовыми сдвигами [3]. Данные о величине и распределении фазовых сдвигов по выборке проводящих клеток в литературе не приводятся, однако, видимо, можно предполагать, что распределение это достаточно широко. [11] C этих позиций модель Лисбергера, в которой фазовые сдвиги предполагаются равномерно распределёнными, является некоторым вполне допустимым приближением реальной ситуации.

Построим систему уравнений, соответствующую данной формальной модели. Введём некоторое множество входов по параллельным волокнам с "равномерным" распределением фазовых сдвигов. При этом для простоты (последующего моделирования) ограничимся некоторым набором из N штук параллельных волокон:

 (7)

Каждому входу поставим в соответствие свой вес wi и запишем систему, аналогичную выписанным раньше:

 (8)

Всего – N+2 уравнений. Здесь Е – как и раньше управляющий моторный сигнал, Р – активность клетки Пуркинье, t' – переменная интегрирования, τ – время задержки сигнала ошибки, Ψ(t) – ядро интегрального оператора, являющееся временной развёрткой структуры сложного разряда. Присутствующее в остальных системах слагаемое +Н в формуле для Е в данном случае опущено и формально введено внутрь суммы второго уравнения системы.

Эта система, в отличие от других приведённых в этой работе, не обладает такой общностью. Она выписана для конкретного (синусоидального) вида стимуляции. Она требует явного введения зависимости сигнала ошибки от времени, например, в виде найденных в работе [14] эмпирических соотношений:

 (9)

Здесь θ – фазовый сдвиг между максимумом контралатеральной (в случае х0-) или ипслилатеральной (в случае х2-обучения) скорости и максимумом сигнала ошибки, приходящего по лазающим волокнам, ν – частота стимуляции, τ – время задержки проводящих путей (100-120 мс).

В системе произведена попытка учёта сложной структуры комплексного разряда клетки Пуркинье, но даже на частотах порядка 10 Гц роль такой поправки вряд ли будет очень велика. Так или иначе, система (8) неполна. С её помощью можно произвести лишь несколько итераций и попытаться проследить начальную тенденцию изменения величины VOR. Однако при попытке "состыковать" эту систему, например, с системой (2) или (5) и произвести потом численный расчёт, мы получаем стохастические режимы, которые, очевидно, не могут реализовываться в реальной нейронной сети. Таким образом, предложенная С. Лисбергером система либо нуждается в серьёзном дополнении, либо не может объяснить динамику изменения синаптических связей, приводящих к адаптации VOR.

 

Теория молекулярной избирательности

Выше уже упоминался простой, но далеко не изящный выход из сложившегося в области моделирования адаптации VOR затруднения. Можно предположить, что при модификации входных синапсов клеток Пуркинье по приходе разряда лазающего волокна наибольшую роль играет не активность параллельных волокон в настоящий момент, а активность, имевшая место 100 мс назад. При этом по мере того, как множатся неудачные попытки обнаружить в нейронных цепях, обеспечивающих VOR, обратные связи задержки, которые могли бы привести к накоплению подобных корреляций, всё больше исследователей обращаются, как к последней надежде, к структурным свойствам клеточных мембран. [13, 14, 15]

Времена задержки для сигнала ошибки составляют 100-120 мс, и если мы хотим, чтобы функция задержки обеспечивалась клеточной мембраной или околомембранными структурами синаптических окончаний, нам придётся вообразить некоторый молекулярный механизм, который бы хранил "память" о величине прошедшего импульса параллельного волокна в течение 100 мс, причём хранил его несмотря на всё новые импульсы, поступающие по тому же волокну. Время хранения информации об этом импульсе должно при этом достаточно точно соблюдаться, чтобы не происходило чрезмерного "размытия" корреляционной функции. Поиски такого механизма продолжаются, но строгость и сложность сформулированных требований заставляет считать по крайней мере маловероятным, что он когда-либо будет обнаружен.

Кроме того, существование такого механизма кажется противоречащим основным идеям построения мозга высших животных, а именно – принципу адаптивности его формирования. Процесс формирования мозговых структур должен быть асимптотически устойчивым по отношению к разного рода возмущениям, таким, как вариации анатомического строения, микротравмы, биохимические особенности организма, вызванные генетическими причинами, заболеваниями или экологическими параметрами и т. д. Все структуры нервной системы в той или иной степени демонстрируют эту адаптивность и устойчивость – демонстрируют именно потому, что лишь очень малая часть параметров этих систем закреплена жёстко. В большинстве случаев системы могут быть настроены и способны самонастраиваться. Введение же жёсткого, биохимического параметра, такого, как избирательное время оптимального взаимодействия входного сигнала и сигнала ошибки, делает систему значительно менее мобильной, создаёт сложности при развитии мозга, поскольку, фактически, заставляет подгонять длину проводящих путей для конкретного сигнала под конкретное значение, и вообще производит на свет огромное количество новых проблем. Такая "временная избирательность" была бы совсем не удивительна в мозге беспозвоночных, с их тонкой генетической настройкой и фиксированной нейронной структурой, но в мозгу млекопитающих возможность существования такого явления представляется весьма сомнительной.

 

Перспективы исследования

При изучении процессов адаптации VOR исследователи неожиданно для себя столкнулись с катастрофической нехваткой данных по внутриклеточной регистрации активности. Как уже было указано, это связано в первую очередь с большой инвазивностью подобных регистраций на приматах, а значит, кроме того, ещё и с большой дороговизной. Поэтому сейчас наиболее востребованной информацией стали бы записи простых и комплексных разрядов клеток Пуркинье в процессе обучения – не только в его начале и конце, но и в промежуточных состояниях; не только для синусоидальной стимуляции, но и для других типов стимуляций.

В теоретической же части необходимо развивать идеи систем с обратными связями, возможно, следует обратиться ещё раз к теории "предикторов". Модель многих фаз Лисбергера тоже нуждается в доработке и развитии, потому что даже если она не сможет качественно решить проблему и потребует введения каких-то более решительных допущений, подобные суммирования и интегрирования по распределениям параметров скорее всего понадобятся при количественных расчётах режимов работы нейронной цепи VOR.

Не стоит относиться слишком пренебрежительно и к теории временной избирательности, поскольку даже если идея узкой полосы чувствительности, отстоящей на 100 мс от момента активации лазающим волокном, действительно окажется несостоятельной и не необходимой, проблема переходных процессов в модифицирумых мембранах останется чрезвычайно важной, так же как и расчёт их временных характеристик.

 

Список литературы

[1] Ito M. (1998) Cerebellar learning in the vestibulo-ocular reflex.
Trends in Cognitive Sciences Vol. 2 No 9

[2] Lisberger S.G. and Fuchs A.F. (1978) Role of primate flocculus during rapid behavioral modification of vestibulo-ocular reflex. I. Purkinje cell activity during visually guided horizontal smooth pursuit eye movements and passive head rotation. J. Neurophysiol. 41: 733-763.

[3] Lisberger S.G. and Fuchs A.F. (1978) Role of primate flocculus during rapid behavioral modification of vestibulo-ocular reflex. II. Mossy fiber firing patterns during horizontal head rotation and eye movement. J. Neurophysiol. 41: 764-777.

[4] Lisberger S.G., Miles F.A. and Optican L.M. (1983) Frequency-selective adaptation: evidence for channels in the vestibulo-ocular reflex? J. Neurosci. 3: 1234-1244.

[5] Lisberger S.G. and Sejnowski T.J. (1993) Cerebellar flocculus hypothesis - reply. Nature 363: 25.

[6] Lisberger S.G. and Sejnowski T.J. (1992) Motor learning in a recurrent network model based on the vestibulo-ocular reflex. Nature 360: 159-161.

[7] Lisberger S.G. (1981) The signal processing and function of the flocculus during smooth eye movement in the monkey. In: the Cerebellum: New Vistas, S. Palay and V. Chan Palay, eds., Elsevier.

[8] Miall R.C., Weir D.J., Wolpert D.M., Stein J.F. (1993) Is the Cerebellum a Smith Predictor? Journal of Motor Behavior, Vol. 25 No 3 203-216

 [9] Michael D. Mauk, Keith S. Garcia, Javier F. Medina and Philip M. Steele (1997) Minireview. Does Cerebellar LTD Mediate Motor Learning? Toward a Resolution without a Smoking Gun In: The Biology of Change, R. Ruben, ed., Elsevier.

[10] Minor et al (1999) Horizontal Vestibuloocular Reflex Evoked by High-Acceleration
Rotations in the Squirrel Monkey. Normal Responses. The Journal of Neurophysiology Vol. 82 No. 3, 1254-1270

[11] Quinn KJ, Schmajuk N, Jain A, Baker JF, Peterson BW (1992) Vestibuloocular reflex arc analysis using an experimentally constrained neural network. Biol Cybern 67:2 113-22

[13] Raymond, J.L. and Lisberger, S.G. (1996) Behavioral analysis of signals that guide learned changes in the amplitude and dynamics of the Vestibulo-ocular reflex. J. Neurosci. 16: 7791-7802.

[14] Raymond J.L. and Lisberger S.G. (1998) Neural learning rules for the Vestibulo-ocular reflex. J. Neurosci. 18: 9112-9129.

[15] Raymond J.L. (1998) Learning in the oculomotor system: from molecules to behavior. Current Opinion in Neurobiology 8: 770-776

Hosted by uCoz