Быстрый поиск

Дипломная работа: Технология извлечения знаний из нейронных сетей: апробация, проектирование ПО, использование в психолингвистике

Министерство образования Российской Федерации

Омский Государственный Университет

Математический факультет

Горбань Павел Александрович

ТЕХНОЛОГИЯ ИЗВЛЕЧЕНИЯ ЗНАНИЙ ИЗ НЕЙРОННЫХ СЕТЕЙ:

АПРОБАЦИЯ, ПРОЕКТИРОВАНИЕ ПО,

ИСПОЛЬЗОВАНИЕ В ПСИХОЛИНГВИСТИКЕ

Дипломная работа

Научный руководитель:

Член-корреспондент РАН

В.В. Шайдуров

Омск – 2002

Оглавление

Введение.. 4

Цель работы.. 4

Основные задачи исследования. 4

Основные результаты работы, полученные лично автором.. 4

Апробация работы.. 5

Публикации. 5

Глава 1. Проблема извлечения знаний и обзор методов извлечения знаний 6

1.1 Знание и приобретение знаний. 6

1.1.1 "Знание". 6

1.1.2. Приобретение знаний. 8

1.2. Методы извлечения и приобретения знаний. 8

1.2.1. Приобретение знаний, обучение и обобщение по примерам в теории классических экспертных систем. 9

1.2.1.1. Трудности при разработке экспертных систем. 11

1.2.2. Методы извлечения знаний из таблиц данных. 12

1.2.2.1. Технология извлечения знаний из таблиц данных. 12

1.2.2.2. Таблица эмпирических данных. 13

1.2.2.3. Статистические методы извлечения знаний из таблицы данных. 15

1.2.3. Методы идентификации систем. 15

1.2.4. Другие методы обработки данных. 16

1.3. Требования к технологии извлечения знаний. 17

Глава 2. Нейронные сети.. 19

2.1. Коннекционизм.. 19

2.2. Элементы нейронных сетей. 20

2.3. Основные архитектуры нейронных сетей. 21

2.4. Обучение нейронных сетей как минимизация функции ошибки. 22

Глава 3. Упрощение нейронной сети. 27

3.1. Что такое упрощение нейронной сети и зачем оно нужно. 27

3.2. Задача извлечения знаний из нейронной сети. 28

3.3. Методы упрощения нейронных сетей. 29

3.3.1. Контрастирование синапсов нейросети. 30

3.3.2. Контрастирование нейронов нейросети. 32

3.3.3. Контрастирование входных сигналов нейросети. 35

3.3.4. Бинаризация синапсов. 36

3.3.5. Упрощение нелинейных преобразователей нейронов. 37

3.3.6. Дополнительные модификации алгоритмов контрастирования. 37

3.3.7. Методы модификации структуры обученной сети. 38

3.4. Требования к процессу упрощения сети для извлечения знаний. 38

3.5. Упрощающие операции над нейронной сетью.. 39

3.6. Процедура комплексного упрощения нейронной сети. 40

Глава 4. Методы извлечения знаний из искусственных нейронных сетей 41

4.1. Существующие методы извлечения знаний из обученной нейросети 41

4.1.1. Методы на основе квантования сигналов сети. 42

4.1.2. Методы извлечения знаний параллельно с обучением нейросети. 44

4.1.3. Методы извлечения знаний из обученной нейросети. 46

4.2. Методы извлечения знаний: требования к методам.. 50

4.3. Методология извлечения явных знаний, использующая технологию комплексного упрощения нейросети. 52

4.4. Приемы повышения вербализуемости нейронной сети. 56

4.4.1. Добавление синдрома в набор входных симптомов. 56

4.4.2. Построение иерархии продукционных правил. 57

4.4.3. Ручное конструирование сети из фрагментов нескольких логически прозрачных сетей. 59

Глава 5. Нейросетевой анализ структуры индивидуального пространства смыслов.. 60

5.1. Семантический дифференциал. 60

5.2. MAN-многообразия. 63

Литература.. 65

Публикации автора по теме диплома.. 69

Приложение 1. Плакаты для защиты диплома. 71

Приложение 2. Статья: Горбань П.А. Нейросетевой анализ структуры индивидуального пространства смыслов. "Нейрокомпьютеры": разработка, применение. 2002, No 4. С. 14-19. 84

Введение

Цель работы

Целью дипломной работы является апробация гибкой технологии извлечения знаний из нейронных сетей, настраиваемой с учетом предпочтений пользователя. Тестирование, пробная эксплуатация и разработка новой версии программных средств, реализующих данную технологию. Проведение исследований индивидуальных пространств смыслов на основе данной технологии.

Основные задачи исследования

1. Анализ разработанных методов извлечения явных знаний из нейронных сетей с указанием их ограничений и областей применимости.

2. Апробация гибкой настраиваемой на основе предпочтений пользователя технологии извлечения знаний, опирающейся на предварительное проведение комплексного упрощения нейронной сети, выполняющегося с учетом сформированных пользователем требований к результирующему виду извлекаемых знаний.

3. Тестирование, пробная эксплуатация и разработка новой версии программных средств, реализующих данную технологию.

4. Усовершенствование метода семантического дифференциала Осгуда при помощи технологии разреживания обучаемых нейронных сетей.

Основные результаты работы, полученные лично автором

1. Предложены следующие приемы, упрощающие и делающие более гибким процесс вербализации (семантического анализа осмысления в терминах проблемной области) извлеченного из сети набора правил:

a) На основе гипотезы о неединственности извлекаемых правил и учитывая, что разные фрагменты сети (поднаборы правил) будут более или менее правдоподобны и интерпретируемы, предложено конструирование новой, более понятной пользователю нейронной сети из наиболее просто интерпретируемых фрагментов других сетей, решающих ту же задачу.

b) Предложено добавление выходного сигнала некоторого фрагмента сети (содержательно интерпретируемого и правдоподобного с точки зрения пользователя) в качестве нового интегрального признака в число независимых признаков таблицы данных, и решение задачи извлечения знаний на основе полученного расширенного набора признаков.

2. Разработано техническое задание на новую версию программы-нейроимитатора, реализующую предложенные технологии.

3. Усовершенствован метод семантического дифференциала Осгуда при помощи технологии разреживания обучаемых нейронных сетей. Проведена серия экспериментов, заключающихся в исследовании индивидуальных смысловых пространств, проинтерпретированы их результаты. Предложена гипотеза о структуре индивидуального пространства смыслов: оно состоит из многообразия малой размерности, задаваемого культурой («ман-многообразия» от немецкого безличного местоимения «man») и сравнительно небольшого множества индивидуальных отклонений, которые могут быть важны для диагностики. Каждая культура имеет небольшое количество специфических для нее ман -многообразий (субкультур).

Апробация работы

Основные положения работы докладывались на VI, VII Всероссийских семинарах "Нейроинформатика и ее приложения", (Красноярск, 1998, 2000 гг), I, Всероссийской научно-технической конференции "Нейроинформатика" (Москва, МИФИ, 1999 г.), VI Международной конференции "Математика. Компьютер. Образование" (1999г, Пущино), International Joint Conference on Neural Networks (1999г, Washington, DC, USA), XXXVII Международной научной студенческой конференции "Cтудент и научно-технический прогресс": Информационные технологии. Новосибирск, НГУ, 1999 (награждена Дипломом 3 степени).

Публикации

По теме диплома автором опубликована 1 статья в научном журнале и 4 тезиса докладов.

Глава 1. Проблема извлечения знаний и обзор методов извлечения знаний

Введение

Первый параграф определяет понятия "знание" и "приобретение знания".

Второй параграф посвящен обзору существующих методов извлечения и приобретения знаний. Рассматриваются существующие в теории классических экспертных систем методы приобретения знаний, рассматриваются использующиеся для извлечения знаний из таблиц данных методы статистического анализа, математического моделирования и идентификации.

Третий параграф описывает набор требований к направленной на конечного пользователя технологии извлечения знаний.

1.1 Знание и приобретение знаний

1.1.1 "Знание"

Под знанием понимается достаточно широкий спектр информации. В [1,с.430-432] представлена следующая классификация типов знаний:

1. Базовые элементы знания (информация о свойствах объектов реального мира). Связаны с непосредственным восприятием, не требуют обсуждения и используются в том виде, в котором получены.

2. Утверждения и определения. Основаны на базовых элементах и заранее рассматриваются как достоверные.

3. Концепции – перегруппировки или обобщения базовых элементов. Для построения каждой концепции используются свои приемы (примеры, контрпримеры, частные случаи, более общие случаи, аналогии).

4. Отношения. Выражают как элементарные свойства базовых элементов, так и отношения между концепциями. К свойствам отношений относят их большие или меньшие правдоподобие и связь с данной ситуацией.

5. Теоремы и правила перезаписи частный случай продукционных правил (правил вида "если…, то…, иначе…") с вполне определенными свойствами. Теоремы не представляют пользы без экспертных правил их применения.

6. Алгоритмы решения. Необходимы для выполнения определенных задач. Во всех случаях они связаны со знанием особого типа, поскольку определяемая ими последовательность действий оказывается оформленной в строго определенном порядке, в отличие от других типов знаний, где элементы знания могут появляться и располагаться без связи друг с другом.

7. Стратегии и эвристика. Врожденные или приобретенные правила поведения, которые позволяют в конкретной ситуации принять решение о необходимых действиях. Человек постоянно пользуется этим типом знаний при формировании концепций, решении задач и формальных рассуждениях.

8. Метазнание. Присутствует на многих уровнях и представляет знание того, что известно, определяет значение коэффициента доверия к этому знанию, важность элементарной операции по отношению ко всему множеству знаний. Сюда же относятся вопросы организации разного типа знаний и указания, где, когда и как они могут быть использованы.

В настоящей работе первому типу знаний будет соответствовать информация об измеримых (или наблюдаемых) свойствах объектов реального мира. Именно эта информация сведена в таблицу данных типа "объект-признак". Остальным типам знаний соответствуют ограничения на диапазоны значений, которые могут принимать признаки объекта (второй тип), информация о взаимозависимости признаков и о возможности описания одних признаков через другие, информация о статистических свойствах значений признаков,… Фактически, нас интересует знание второго и последующих типов знание, которое человек добывает в процессе анализа информации, рассуждений, обобщений, проведения аналогий.

Естественным является требование представления знаний в виде, допускающем "тиражирование" возможность передачи знаний другим людям. Для первого типа знаний возможно получение как объективных (точно измеренных) значений свойств объектов реального мира, так и субъективных, персонализированных, чувственных оценок значений этих свойств. Для знаний последующих типов для возможности передачи вводятся требования объективизации, достоверности, непротиворечивости [1].

Информационные единицы (знания) обладают гибкой структурой [2]. Для них выполняется "принцип матрешки" – рекурсивная вложенность одних информационных единиц в другие (это наблюдается и на примере вышеприведенной классификации из [1]).

Каждая информационная единица может быть включена в состав любой другой, и из каждой информационной единицы можно выделить некоторые составляющие ее единицы. Т.е. между отдельными информационными единицами возможно установление отношений типа "часть – целое", "род – вид" или "элемент – класс".

Для информационных единиц одного уровня иерархии семантика отношений может носить декларативный или процедурный характер [2]: две или более информационных единицы могут быть связаны декларативными отношениями "одновременно", "причина – следствие" или "быть рядом", либо процедурными отношениями типа "аргумент – функция".

Можно различать отношения структуризации, процедурные отношения, каузальные отношения и семантические отношения. С помощью первых задаются иерархии информационных единиц, вторые несут процедурную информацию, позволяющую находить (вычислять) одни информационные единицы через другие, третьи задают причинно-следственные связи, четвертые соответствуют всем остальным отношениям [2].

1.1.2. Приобретение знаний

Приобретением знаний называется выявление знаний из источников и преобразование их в нужную форму (например, перенос в базу знаний экспертной системы) [2]. Источниками знаний могут быть книги, архивные документы, содержимое других баз знаний и т.п., т.е. некоторые объективизированные знания, переведенные в форму, которая делает их доступными для потребителя. Другим типом знаний являются экспертные знания, которые имеются у специалистов, но не зафиксированы во внешних по отношению к ним хранилищах. Экспертные знания являются субъективными. Еще одним видом субъективных знаний являются эмпирические знания, полученные путем наблюдения за окружающей средой. Ввод в базу знаний объективизированных знаний не представляет проблемы, выявление и ввод субъективных экспертных знаний достаточно трудны. Для извлечения и формализации экспертных знаний разработано множество стратегий интервьюирования эксперта и множество моделей представления знаний [2].

В когнитивной психологии изучаются формы репрезентации знаний, характерные для человека: представление класса понятий через его элементы; представление понятий класса с помощью базового прототипа, отражающего наиболее типичные свойства объектов класса; представление с помощью признаков [3]. Форма репрезентации знаний определяет используемую методологию выявления знаний и модель представления знаний.

1.2. Методы извлечения и приобретения знаний

К настоящему времени сформировалось три основных направления извлечения знаний. Эти направления могут использовать одни и те же математические методы; подходы, первоначально разработанные в рамках некоторого направления, могут применяться для решения задач из другого направления. Вот эти направления:

1. Методы самообучения и приобретения знаний в теории классических экспертных систем (Параграф 1.2.1).

2. Извлечение знаний из таблиц данных. Включает теорию статистических выводов и другие методы анализа данных (Параграф 1.2.2).

3. Теория идентификации систем (Параграф 1.2.3).

1.2.1. Приобретение знаний, обучение и обобщение по примерам в теории классических экспертных систем

Исследуется автоматизированный процесс получения знаний, объясняющих имеющиеся факты и способных объяснять, классифицировать или предсказывать новые. В общем виде задача формулируется так [2]: по совокупности наблюдений (фактов) F, совокупности требований и допущений к виду результирующей гипотезы H и совокупности базовых знаний и предположений, включающих знания об особенностях предметной области, выбранном способе представления знаний, наборе допустимых операторов, эвристик и др., сформировать гипотезу Н: HÞF (Н "объясняет" F).

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12