Скачать 142.04 Kb.
|
ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования «Санкт-Петербургский государственный электротехнический университет "ЛЭТИ" имени В.И.Ульянова (Ленина)» (СПбГЭТУ) РАБОЧАЯ ПРОГРАММА дисциплины ТЕХНОЛОГИЯ АНАЛИЗА И ИЗВЛЕЧЕНИЯ ЗНАНИЙ Для профиля "Программное обеспечение и администрирование информационно-вычислительных систем и сетей" магистерской программы: "Управление информационными системами и ресурсами" Санкт-Петербург 2007 Санкт-Петербургский государственный электротехнический университет “ЛЭТИ” “УТВЕРЖДАЮ”Проректор по учебной работе проф. ___________ Кузьмин Н.Н. “_____”_______________2007 г. РАБОЧАЯ ПРОГРАММА Дисциплины ТЕХНОЛОГИЯ АНАЛИЗА И ИЗВЛЕЧЕНИЯ ЗНАНИЙ Для профиля "Программное обеспечение и администрирование информационно-вычислительных систем и сетей" магистерской программы: "Управление информационными системами и ресурсами" Факультет КТИ Кафедра автоматизированных систем обработки информации и управления Курс – 5 Семестры – 10 Общая трудоемкость – 4 зачетных единицы Виды занятий: Формы отчетности: 1. Аудиторные занятия, в т.ч.: 56 ч. 1.1. Лекции 42ч. Экзамен 10 семестр 1.2. Лабораторный практикум 14ч. 2. Самостоятельная работа 88 ч. Всего часов 144 ч. 2007 Рабочая программа обсуждена на заседании кафедры ВТ .................. 2007 г., протокол № ...... Рабочая программа составлена в соответствии с государственными образовательными стандартами для подготовки магистров по направлению "Информатика и вычислительная техника" Дисциплина «Технология анализа и извлечения знаний» преподается на основе ранее изученных дисциплин:
Рабочая программа одобрена методической комиссией ФКТИ "___ " _____________ 2007 г. АННОТАЦИЯ ДИСЦИПЛИНЫ Дисциплина обеспечивает теоретическую и практическую подготовку в области средств и методов анализа информации и извлечения из нее новых знаний. Программа дисциплины включает в себя изучение основных направлений анализа данных, основных методов, алгоритмов и моделей извлечения из больших объемов данных новых, ранее неизвестных и полезных знаний, методов анализа текстовой информации и методов визуального анализа данных. Лекционные материалы дисциплины по каждому разделу подкрепляются примерами. DISCIPLINE ANNOTATION The discipline provides theoretical and practical preparation in the field of tools and methods of information analysis and new knowledge extraction. The program of discipline includes studying the basic directions of data analysis, basic methods, algorithms and models of data mining, methods of text information analysis and methods visual data analysis. Lecture materials of discipline on each section are supported with examples. Цели и задачи дисциплины Целью дисциплины является формирование у студентов представления о развитии средств и методов анализа информации и извлечения из нее новых знаний.. Дисциплина «Технология анализа и извлечения знаний» изучает теорию и практику применения и разработки основных средств и методов анализа информации и извлечения из нее новых полезных знаний. В процессе её изучения студенту необходимо освоить следующие задачи:
Требования к уровню освоения дисциплины В результате изучения дисциплины студенты должны:
Содержание рабочей программы Введение (12) Тема 1. OLTP системы Системы поддержки принятия решений (СППР). Базы данных (БД) СППР. Иерархические БД. Сетевые БД. Реляционные БД. Правила Кода для реляционных баз данных. Постреляционные БД. OLTP системы. Понятие транзакции. Неэффективность OLTP систем для анализа данных.(2) Тема 2. Хранилище данных Концепция хранилища данных (ХД). СППР с физическим ХД. СППР с виртуальных ХД. Достоинства и недостатки ХД. Витрины данных (ВД). СППР с ВД. СППР с ХД и ВД. Организация ХД. Информационные потоки в ХД. ETL – процесс. Очистка данных. ХД и анализ.(2) Тема 3. Многомерный анализ данных Многомерная модель данных. Представление данных в виде многомерного куба. Операции среза, вращения и детализации. Определение OLAP – системы. Двенадцать правил Кода. Дополнительные правила Кода. Тест FASMI. (2) Архитектура систем OLAP систем. Многомерный OLAP (MOLAP). Реляционный OLAP (ROLAP). Схема звезда и снежинки. Гибридный OLAP (HOLAP). Средства оперативного анализа данных. (2) Тема 4. Интеллектуальный анализ данных (Data Mining) Определение Data Mining (DM). Классификация задач DM. Задача классификации и регрессии. Задача поиска ассоциативных правил. Задача кластеризации. Практическое применение DM. Предсказательные и описательные модели DM. Методы DM. Процесс обнаружения знаний.(2) Тема 5. Средства анализа данных Библиотека Weka. Структура библиотеки. Поддерживаемые методы. Библиотека Xelopes. Структура библиотеки. Поддерживаемые методы. Средства Oracle Data Mining. Средства Microsoft. Другие средства Data Mining.(2) Базовый курс (22) Тема 6. Задача классификации и регрессии Постановка задачи. Представление результатов. Правила классификации. Деревья решений. Математические функции.(2) Методы построения правил классификации. Методы построения деревьев решения. Методика «разделяй и властвуй». Алгоритм покрытия.(2) Метод построения математических функций. Линейные методы. Нелинейные методы. Метод Support Vector Machine. Анализ временных рядов. Методы прогнозирования. (2) Тема 7. Задача поиска ассоциативных правил Формальная постановка задачи. Ассоциативные правила. Виды правил. Поддержка. Достоверность. Улучшение. Алгоритм Apriori и его разновидности. (2) Сиквенциальный анализ. Формальная постанова задачи. Разновидности задачи поиска ассоциативных правил. Алгоритм MSAP. (2) Тема 8. Задача кластеризации Понятие кластера и кластеризации. Формальная постановка задачи кластеризации. Понятие расстояния. Матрица отличия. Меры близости. Представление результатов: линейные функции, венские диаграммы, дентограммы.(2) Иерархические алгоритмы кластеризации: агломеративные и дивизимные алгоритмы. Неиерархические алгоритмы. Поиск оптимального разбиения.(2) Нечеткие алгоритмы. K-means алгоритм. Кластеризация данных при помощи нечетких отношений. Алгоритм Fuzzy C Means. Кластеризация по Гюстафсону-Кесселю. Адаптивные методы кластеризации. (2) Целевой курс (8) Тема 9. Визуальный анализ данных (Visual Mining) Процесс визуализации данных. Характеристики средств визуализации данных. Метод геометрических преобразований. Отображение иконок. Методы, ориентированные на пикселы. Иерархические образы. (2) Тема 10. Анализ текстовой информации (Text Mining) Определение Text Mining. Предварительная обработка текста. Задачи Text Mining. Извлечение ключевых понятий из текста. Классификация текстовых документов. Кластеризация текстовых документов. Аннотирование текстов. Средства анализа текстовой информации.(2) Тема 11. Распределенный анализ данных. Проблемы распределенного анализа данных. Существующие подходы к анализу распределенных данных. Использование мобильных агентов для анализа. Варианты анализа распределенных данных.(2) Тема 12. Стандарты Data Mining Существующие стандарты Data Mining. Стандарт CWM. Стандарт CRISP. Стандарт PMML. Стандарт SQL/MM. Стандарт OLE DB для Data Mining. Стандарт JDMAPI. (2) Перечень лабораторных работ
Расчет учебных часов по видам занятий
Самостоятельная работа студентов
Учебно-методическое обеспечение дисциплиныОсновная литература
Дополнительная литература
Зав.отделом учебной литературы Киселева Т.В. Автор к.т.н., доцент Холод И.И. Рецензент к.т.н., доцент Первицкий А.Ю. Зав. кафедрой ВТ д.т.н., профессор Пузанков Д.В. Декан ФКТИ д.т.н., профессор Герасимов И.В.
|
Рабочая программа составлена в соответствии с государственными образовательными... Для профиля "Программное обеспечение и администрирование информационно-вычислительных систем и сетей" |
Рабочая программа составлена в соответствии с государственными образовательными... Для профиля "Программное обеспечение и администрирование информационно-вычислительных систем и сетей" |
||
Рабочая программа дисциплины операционные системы для подготовки... ... |
Гоу впо «Санкт-Петербургский утверждено государственный университет... Закон Российской Федерации “Об образовании” и федеральными государственными образовательными стандартами 3-го поколения, а также... |
||
Рабочая программа дисциплины Для подготовки магистров по направлению 239100 – “Информатика и вт” по инновационной образовательной программе 230150 “Управление... |
Задачами общения. I. Требования к поступающим Программа вступительного экзамена в аспирантуру по иностранному языку разработана в соответствии с государственными образовательными... |
||
Учебное пособие разработано в соответствии с государственным образовательным... Учебное пособие предназначено для студентов, изучающих дисциплину «Базы данных» на третьем курсе. В пособии рассматриваются основы... |
Министерство сельского хозяйства РФ федеральное государственное бюджетное... Программа вступительного экзамена в аспирантуру по иностранному языку разработана в соответствии с государственными образовательными... |
||
Пояснительная записка Программа дисциплины «Технология производства первичных фонограмм» Программа дисциплины «Технология производства первичных фонограмм» федерального компонента сд составлена в соответствии с государственным... |
Методические указания по выполнению контрольно-курсовой работы для... Цели и задачи выполнения контрольно-курсовой работы |
Поиск на сайте Главная страница Литература Доклады Рефераты Курсовая работа Лекции |