Основы теории нейронных сетей

       

Функционирование сетей APT


Рассмотрим более детально пять фаз процесса функционирования APT: инициализацию, распознавание, сравнение, поиск и обучение.

Инициализация. Перед началом процесса обучения сети все весовые векторы

Функционирование сетей APT
и
Функционирование сетей APT
, а также параметр сходства
Функционирование сетей APT
, должны быть установлены в начальные значения.

Веса векторов

Функционирование сетей APT
все инициализируются в одинаковые малые значения. Эти значения должны удовлетворять условию

Функционирование сетей APT

где

Функционирование сетей APT
— количество компонент входного вектора,
Функционирование сетей APT

— константа, большая 1 (обычно

Функционирование сетей APT
).

Эта величина является критической; если она слишком большая, сеть может распределить все нейроны распознающего слоя одному входному вектору.

Веса векторов

Функционирование сетей APT
все инициализируются в единичные значения, так что

Функционирование сетей APT

Эти значения также являются критическими; показано, что слишком маленькие веса приводят к отсутствию соответствия в слое сравнения и отсутствию обучения.

Параметр сходства

Функционирование сетей APT
устанавливается в диапазоне от 0 до 1 в зависимости от требуемой степени сходства между запомненным образом и входным вектором. При высоких значениях
Функционирование сетей APT
сеть относит к одному классу только очень слабо отличающиеся образы. С другой стороны, малое значение
Функционирование сетей APT
заставляет сеть группировать образы, которые имеют слабое сходство между собой. Для выработки точной классификации полезна возможность изменять коэффициент сходства на протяжении процесса обучения, обеспечивая только грубую классификацию в начале процесса обучения и затем постепенно увеличивая коэффициент сходства. Распознавание. Появление на входе сети входного вектора
Функционирование сетей APT

инициализирует фазу распознавания. Так как вначале выходной вектор слоя распознавания отсутствует, сигнал

Функционирование сетей APT
устанавливается в 1 функцией ИЛИ вектора
Функционирование сетей APT
, обеспечивая все нейроны слоя сравнения одним из двух входов, необходимых для их возбуждения (как требует правило двух третей). В результате любая компонента вектора
Функционирование сетей APT
, равная единице, обеспечивает второй единичный вход, заставляя соответствующий нейрон слоя сравнения возбуждаться и устанавливая его выход в единицу. Таким образом, в этот момент времени вектор
Функционирование сетей APT
идентичен вектору
Функционирование сетей APT
.




Как обсуждалось ранее, распознавание реализуется вычислением свертки для каждого нейрона слоя распознавания, определяемой следующим выражением:

Функционирование сетей APT


где
Функционирование сетей APT
— весовой вектор, соответствующий нейрону
Функционирование сетей APT
в слое распознавания,
Функционирование сетей APT
— выходной вектор нейронов слоя сравнения (в этот момент
Функционирование сетей APT
равно
Функционирование сетей APT
),
Функционирование сетей APT
— возбуждение нейрона
Функционирование сетей APT
в слое распознавания.

Функционирование сетей APT
является пороговой функцией, определяемой следующим образом:

Функционирование сетей APT


где
Функционирование сетей APT
представляет собой порог.



В соответствии с алгоритмом обучения возможно, что другой нейрон в слое распознавания будет обеспечивать более хорошее соответствие, превышая требуемый уровень сходства, несмотря на то, что свертка между его весовым вектором и входным вектором может иметь меньшее значение. Пример такой ситуации показан ниже.

Если сходство ниже требуемого уровня, запомненные образы могут быть просмотрены, чтобы найти образ, наиболее соответствующий входному вектору. Если такой образ отсутствует, вводится новый несвязанный нейрон, который в дальнейшем будет обучен. Чтобы инициализировать поиск, сигнал сброса тормозит возбужденный нейрон в слое распознавания на время проведения поиска, сигнал
Функционирование сетей APT


устанавливается в единицу и другой нейрон в слое распознавания выигрывает соревнование. Его запомненный образ затем проверяется на сходство, и процесс повторяется до тех пор, пока конкуренцию не выиграет нейрон из слоя распознавания со сходством, большим требуемого уровня (успешный поиск), либо пока все связанные нейроны не будут проверены и заторможены (неудачный поиск).

Неудачный поиск будет автоматически завершаться на несвязанном нейроне, так как его веса все равны единице, своему начальному значению. Поэтому правило двух третей приведет к идентичности вектора
Функционирование сетей APT


входному вектору
Функционирование сетей APT
, сходство
Функционирование сетей APT
примет значение единицы и критерий сходства будет удовлетворен.

Обучение. Обучение представляет собой процесс, в котором набор входных векторов подается последовательно на вход сети, а веса сети изменяются при этом таким образом, чтобы сходные векторы активизировали соответствующие им нейроны. Заметим, что это - неуправляемое обучение, здесь нет учителя и нет целевого вектора, определяющего требуемый ответ.

Различают два вида обучения: медленное и быстрое. При медленном обучении входной вектор предъявляется настолько кратковременно, что веса сети не успевают достигнуть своих ассимптотических значений при единичном предъявлении. В этом случае значения весов будут определяться, скорее, статистическими характеристиками входных векторов, чем характеристиками какого-то одного входного вектора.



Динамика сети в процессе медленного обучения описывается дифференциальными уравнениями.

Быстрое обучение является специальным случаем медленного обучения, когда входной вектор прикладывается на достаточно длительный срок, чтобы позволить весам приблизиться к их окончательным значениям. В этом случае процесс обучения описывается только алгебраическими выражениями. Кроме того, компоненты весовых векторов
Функционирование сетей APT
принимают двоичные значения, в отличие от непрерывного диапазона значений, требуемого в случае быстрого обучения. В данной лекции мы опишем только быстрое обучение.

Рассмотренный далее обучающий алгоритм используется как в случае успешного, так и в случае неуспешного поиска.

Пусть вектор весов
Функционирование сетей APT
(связанный с возбужденным нейроном
Функционирование сетей APT


распознающего слоя) равен нормализованной величине вектора
Функционирование сетей APT
. Эти веса вычисляются следующим образом:

Функционирование сетей APT


где
Функционирование сетей APT
Функционирование сетей APT
-я компонента выходного вектора слоя сравнения,
Функционирование сетей APT
— номер выигравшего нейрона в слое распознавания,
Функционирование сетей APT
— вес связи, соединяющей нейрон
Функционирование сетей APT
в слое сравнения с нейроном
Функционирование сетей APT
в слое распознавания,
Функционирование сетей APT
— константа > 1 (обычно 2).

Компоненты вектора весов
Функционирование сетей APT
, связанного с новым запомненным вектором, изменяются таким образом, что становятся равны соответствующим двоичным величинам вектора
Функционирование сетей APT
:

Функционирование сетей APT


где
Функционирование сетей APT
является весом связи между выигравшим нейроном
Функционирование сетей APT
в слое распознавания и нейроном
Функционирование сетей APT
в слое сравнения.


Содержание раздела