E-Book Overview
Учебно-методическое пособие по организации и управлению знаниями. Анализ данных в системе Statistica: корреляционный, регрессионный, дисперсионный анализ, кластерный, дискриминантный и факторный анализ. Также рассматриваются методы "Дерево решений" и нейронные сети.
E-Book Content
В.В. Лабоцкий
УПРАВЛЕНИЕ ЗНАНИЯМИ (технологии, методы и средства представления, извлечения и измерения знаний)
УДК 658.1.681.3(07) ББК 65.290-2фя73 Л12
Лабоцкий В.В. Л12 УПРАВЛЕНИЕ ЗНАНИЯМИ (технологии, методы и средства представления, извлечения и измерения знаний). – Мн.: Соврем. шк., 2006, - 392 с. ISBN 985-6807-13-1 Для студентов и аспирантов, преподавателей, научных работников, менеджеров-аналитиков, руководителей организаций, а также всех, кто в своей практической деятельности ощущает необходимость использования знаний – как экономического ресурса, интересуется проблемами организации и управления знаниями, использованием технологий, методов и средств создания знаний, их оценки, получения к ним доступа, накопления, измерения, хранения, анализа, обработки и их использования.
УДК 658.1.681.3(07) ББК 65.290-2фя73 © Лабоцкий В.В., 2006 2
Содержание ОТ АВТОРА 5 ВВЕДЕНИЕ 7 1. АНАЛИЗ ДАННЫХ В СИСТЕМЕ STATISTICA 11 1.1. ПОЧЕМУ ИМЕННО STATISTICA?....................................................... 11 1.2. ОСНОВНЫЕ ЭЛЕМЕНТЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ ........................................................................ 12 2. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ 22 2.1. ОБЩИЕ СВЕДЕНИЯ ........................................................................... 22 2.2. STATISTICA. ПРОВЕРКА РЕЗУЛЬТАТОВ КОНТРОЛЬНОГО ПРИМЕРА В BASIC STATISTICS ............................................................................. 22 2.3. СОЗДАНИЕ ОТЧЕТА .......................................................................... 31 3. РЕГРЕССИОННЫЙ АНАЛИЗ 33 3.1. ОБЩИЕ СВЕДЕНИЯ. ПРОСТАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ ..................... 33 3.1.1. Функция регрессии ................................................................. 33 3.2. ПОСЛЕДОВАТЕЛЬНОСТЬ РЕГРЕССИОННОГО АНАЛИЗА ..................... 33 3.3. МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ ...................................... 37 3.4. НЕЛИНЕЙНЫЕ МОДЕЛИ, СВОДЯЩИЕСЯ К ЛИНЕЙНЫМ ...................... 38 3.5. ПРОВЕРКА ПРЕДПОСЫЛОК РЕГРЕССИОННОГО АНАЛИЗА ................. 39 3.5.1. Проверка нормальности закона распределения ошибок .... 39 3.5.2. Проверка на однородность случайных ошибок................... 39 3.5.3. Проверка на автокорреляцию случайных ошибок .............. 40 3.6. ОПИСАНИЕ ТИПОВОГО ПРИМЕРА..................................................... 40 3.7. STATISTICA. ПРОВЕРКА РЕЗУЛЬТАТОВ КОНТРОЛЬНОГО ПРИМЕРА В MULTIPLE REGRESSION ..................................................................... 43 4. ДИСПЕРСИОННЫЙ АНАЛИЗ 55 4.1. ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ ................................ 55 4.2. STATISTICA. ПРОВЕРКА РЕЗУЛЬТАТОВ КОНТРОЛЬНОГО ПРИМЕРА В ANOVA............................................................................................ 57 4.3. МНОГОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ ............................. 61 5. КЛАСТЕРНЫЙ АНАЛИЗ 65 5.1. ОБЩИЕ СВЕДЕНИЯ ........................................................................... 65 5.2. СТАНДАРТИЗАЦИЯ ДАННЫХ ............................................................ 67 5.3. МЕТОДЫ КЛАСТЕРНОГО АНАЛИЗА ................................................... 67 5.4. STATISTICA. ПРОВЕРКА РЕЗУЛЬТАТОВ КОНТРОЛЬНОГО ПРИМЕРА В CLUSTER ANALYSIS........................................................................... 68 6. ДИСКРИМИНАНТНЫЙ АНАЛИЗ 74 6.1. ОБЩИЕ СВЕДЕНИЯ ........................................................................... 74 6.2. STATISTICA. ПРОВЕРКА РЕЗУЛЬТАТОВ КОНТРОЛЬНОГО ПРИМЕРА В DISCRIMINANT ANALYSIS.................................................................. 74 6.3. ВЫВОД РЕЗУЛЬТ