ОПИСАНИЕ
|
|
Н.Г. Загоруйко.
|
|
Прикладные
методы анализа данных и знаний.
|
|
Главная цель машинной обработки
экспериментальных или статистических данных состоит в автоматическом
обнаружении скрытых в них закономерностей. Эти закономерности или знания
позволяют понять сущность изучаемого процесса и, опираясь на имеющиеся
данные, предсказывать новые факты. Первая часть книги содержит описание
основных понятий, используемых в данной области. Во второй части
представлен широкий круг методов и алгоритмов, с помощью которых из данных
извлекаются новые знания. Большие объемы знаний также требуют машинной
обработки с целью обнаружения закономерностей более высокого уровня или
метазнаний. Третья часть книги посвящена методам анализа знаний.
|
|
В книге отражены оригинальные результаты, полученные
автором и его сотрудниками. Большая часть приведенных в ней алгоритмов
давно и широко применяется при решении прикладных задач из области
геологии, медицины, экономики, океанологии, речевой технологии и многих
других.
|
|
Студентам разных специальностей книга
позволит познакомиться с основными идеями, используемыми в современных
методах анализа данных и знаний. Аспиранты, специализирующиеся в области
прикладной статистики и искусственного интеллекта, могут найти в ней
предмет для постановки новых направлений исследований. Практики из любой
прикладной области, связанные с необходимостью анализировать информацию в
процессе принятия решений, узнают о новых средствах поддержки их
деятельности.
|
|
СОДЕРЖАНИЕ
|
|
Часть I. Введение в анализ данных.
|
|
Глава 1. Основные
понятия.
|
|
§1. Чем отличаются “данные” от “знаний”?
§2. Что такое анализ данных?
§3. Принятие решений по прецедентам и моделям.
§4. Что такое анализ знаний?
§5. Что такое закономерность?
|
|
Глава 2.
Классификация задач анализа данных.
|
|
§1. Теория измерений.
1.1. Типы измерительных шкал.
1.2.
Сравнительная информативность шкал.
§2. Классификация задач анализа данных.
|
|
Глава 3. Базовые
гипотезы, лежащие в основе методов анализа данных.
|
|
§1. Гипотеза компактности.
§2. Гипотеза λ-компактности.
|
|
|
|
Часть II. Методы анализа данных.
|
|
Глава 4. Задачи
таксономии.
|
|
§1. Природа задач таксономии.
§2. Алгоритмы таксономии класса FOREL.
2.1. Алгоритм FOREL.
2.2. Алгоритм FOREL-2.
2.3. Алгоритм SKAT.
2.4. Алгоритм KOLAPS.
2.5. Алгоритм BIGFOR.
2.6. Иерархическая таксономия.
§3. Динамическая таксономия.
3.1. Алгоритм DINA.
3.2. Алгоритм SETTIP.
§4. Таксономия с суперцелью.
4.1. Алгоритм ROST.
§5. Таксономия в анизотропном пространстве.
§6. Сравнение алгоритмов таксономии.
§7. Выбор числа таксонов.
§8. Примеры решения практических задач.
8.1. Задачи палеонтологии и геологической
разведки.
8.2. Задачи социологии и экономики.
8.3. Задачи биологии.
8.4. Задачи океанологии.
8.5. Задачи распознавания речевых сигналов
(“кодовая книга”).
8.6. Другие области применения.
§9. Некоторые дополнительные замечания о таксономии.
|
|
Глава 5.
Распознавание образов.
|
|
§1. Алгоритмы построения решающих правил.
§2. Статистические решающие правила.
§3. Алгебраические методы построения решающих правил.
§4. Распознавание большого числа образов.
4.1. Метод отбора сильнейшего конкурента
(МСК).
4.2. Метод попутного разделения (ПОРА).
4.3. Метод покоординатного вычеркивания
(МПВ).
§5. Оценка потерь.
§6. Гипотеза компактности и распознавание образов.
§7. Построение решающих правил по конечной выборке.
§8. Решающие правила, опирающиеся на прецеденты.
8.1. Минимизация набора прецедентов
(алгоритм STOLP).
8.2. Метод “дробящихся эталонов” (алгоритм
ДРЭТ).
8.3. Таксономические решающие функции
(алгоритм ТРФ).
§9. Логические решающие правила.
9.1. Алгоритм CORAL.
9.2. Алгоритм DW.
§10. Представительность выборки.
|
|
Глава 6. Выбор
системы информативных признаков.
|
|
§1. Постановка задачи.
§2. Критерии информативности признаков.
§3. Метод последовательного сокращения (алгоритм Del).
§4. Метод последовательного добавления признаков (алгоритм Add).
§5. Метод случайного поиска с адаптацией (алгоритм СПА).
§6. Направленный таксономический поиск признаков (алгоритм
НТПП).
|
|
Глава 7. Заполнение
пробелов и обнаружение ошибок в эмпирических таблицах.
|
|
§1. Обзор работ по теме заполнения пробелов.
§2. Базовый алгоритм ZET заполнения
пробелов.
§3. Некоторые варианты алгоритма ZET.
3.1. Обнаружение грубых ошибок (алгоритм ZET-R).
3.2. Прогнозирование динамических рядов
(алгоритм ZET-D).
§4. Примеры применения алгоритмов семейства ZET.
4.1. Применение в экономике.
4.2. Применение в геологии и медицине.
4.3. Применения в технике.
§5. Алгоритмы семейства WANGA.
5.1. Алгоритм WANGA-R.
5.2. Алгоритм WANGA-I.
5.3. Алгоритм WANGA-0.
5.4. Алгоритм WANGA-N.
|
|
Глава 8.
Прогнозирование многомерных временных рядов.
|
|
§1. Введение.
§2. Обучающийся генетический алгоритм прогнозирования LGAP.
2.1. Формирование базовых штаммов.
2.2. Отбор компетентных штаммов.
2.3. Выработка частных вариантов прогноза.
2.4. Получение окончательного прогноза.
§3. Критерии для оценки точности прогноза.
§4. Возможности распараллеливания алгоритма LGAP.
§5. Экспериментальная проверка алгоритма LGAP.
§6. Коллективно-групповые методы распознавания (класс
алгоритмов КГМ).
|
|
Глава 9. Согласование разнотипных шкал.
|
|
§1. Расстояние между объектами в пространстве разнотипных
признаков.
§2. Расстояние между разнотипными признаками.
|
|
Глава 10. Алгоритмы
таксономии в λ-пространстве.
|
|
§1. Алгоритм λ-KRAB.
§2. Алгоритм λ-KRAB-2.
§3. Выбор числа таксонов.
|
|
Глава 11. Методы
распознавания образов в λ-пространстве.
|
|
§1. Правило k ближайших соседей
(алгоритм λ-NNR).
§2. Выбор прецедентов (алгоритм λ-STOLP).
§3. Групповое распознавание.
3.1. Алгоритм λ-ТРФ.
3.2. Алгоритм λ-GURAM.
|
|
Глава 12. Другие
задачи анализа данных в λ-пространстве.
|
|
§1. Критерии информативности λ-пространства.
§2. Задачи заполнения пробелов.
§3. Пакет прикладных программ ОТЭКС.
|
|
Глава 13. Анализ
данных и Data Mining.
|
|
§1. Что такое Data Mining?
§2. Переоткрытие некоторых законов
природы.
2.1. Закон Ома.
2.2. Закон Менделя.
2.3. Периодичный закон Менделеева.
|
|
|
|
Часть III. Анализ знаний и структур.
|
|
Глава 14. Метрика в
пространстве знаний.
|
|
§1. Меры близости между предикатами.
§2. Расстояние между знаниями.
|
|
Глава 15. Методы
анализа знаний.
|
|
§1. Таксономия знаний.
§2. Распознавание образов в пространстве знаний.
§3. Выбор информативного подмножества предикатов.
§4. Заполнение пробелов в базе знаний.
|
|
Глава 16. Методы
анализа структурных объектов.
|
|
§1. Метод динамического программирования.
§2. Метод скрытых Марковских процессов (СМП).
§3. D-алгоритм для таксономии траекторий.
§4. Иерархические структуры.
§5. Расстояние между иерархиями.
5.1. Расстояние по виду структуры.
5.2. Расстояние по весовым индексам.
§6. Таксономия иерархий.
§7. Распознавание иерархических
структур.
|
|
Глава 17. Анализ
данных, знаний и структур в системах искусственного интеллекта.
|
|
§1. Экспертные системы партнерского типа.
§2. Отличительные характеристики ЭС и ПС.
§3. Состояние разработок в области партнерских систем.
3.1. Блок диалога.
3.2. Блок логического вывода.
3.3. Блок анализа данных.
3.4. Блок анализа моделей.
3.5. Блок “Гомеостат”.
3.6. Особенности системы ЭКСНА.
§4. Анализ данных, знаний и структур, связанных с изучением
проблемы устойчивого развития.
|
|