Рабочая программа составлена в соответствии с государственными образовательными стандартами для подготовки магистров по направлению "Информатика и вычислительная техника" Дисциплина «Технология анализа и извлечения знаний»




Скачать 142.04 Kb.
Название Рабочая программа составлена в соответствии с государственными образовательными стандартами для подготовки магистров по направлению "Информатика и вычислительная техника" Дисциплина «Технология анализа и извлечения знаний»
Дата публикации 31.05.2014
Размер 142.04 Kb.
Тип Рабочая программа
literature-edu.ru > Информатика > Рабочая программа


ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ

Государственное образовательное учреждение высшего профессионального образования
«Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

имени В.И.Ульянова (Ленина)»

(СПбГЭТУ)

РАБОЧАЯ ПРОГРАММА
дисциплины
ТЕХНОЛОГИЯ АНАЛИЗА И ИЗВЛЕЧЕНИЯ ЗНАНИЙ
Для профиля "Программное обеспечение и администрирование информационно-вычислительных систем и сетей"

магистерской программы: "Управление информационными системами и ресурсами"


Санкт-Петербург

2007

Санкт-Петербургский государственный электротехнический

университет “ЛЭТИ”


“УТВЕРЖДАЮ”




Проректор по учебной работе

проф. ___________ Кузьмин Н.Н.
“_____”_______________2007 г.

РАБОЧАЯ ПРОГРАММА

Дисциплины

ТЕХНОЛОГИЯ АНАЛИЗА И ИЗВЛЕЧЕНИЯ ЗНАНИЙ

Для профиля "Программное обеспечение и администрирование информационно-вычислительных систем и сетей"

магистерской программы: "Управление информационными системами и ресурсами"

Факультет КТИ

Кафедра автоматизированных систем обработки информации и управления

Курс – 5

Семестры – 10
Общая трудоемкость – 4 зачетных единицы

Виды занятий: Формы отчетности:
1. Аудиторные занятия, в т.ч.: 56 ч.

1.1. Лекции 42ч. Экзамен 10 семестр

1.2. Лабораторный практикум 14ч.

2. Самостоятельная работа 88 ч.
Всего часов 144 ч.




2007

Рабочая программа обсуждена на заседании кафедры ВТ

.................. 2007 г., протокол № ......
Рабочая программа составлена в соответствии с государственными образовательными стандартами для подготовки магистров по направлению "Информатика и вычислительная техника"
Дисциплина «Технология анализа и извлечения знаний» преподается на основе ранее изученных дисциплин:

  1. Программирование (1 семестр),

  2. Базы данных (3 семестр),

  3. Технология распределенных баз данных и баз знаний (9 семестр).

Рабочая программа одобрена методической комиссией ФКТИ "___ " _____________ 2007 г.
АННОТАЦИЯ ДИСЦИПЛИНЫ
Дисциплина обеспечивает теоретическую и практическую подготовку в области средств и методов анализа информации и извлечения из нее новых знаний.

Программа дисциплины включает в себя изучение основных направлений анализа данных, основных методов, алгоритмов и моделей извлечения из больших объемов данных новых, ранее неизвестных и полезных знаний, методов анализа текстовой информации и методов визуального анализа данных. Лекционные материалы дисциплины по каждому разделу подкрепляются примерами.

DISCIPLINE ANNOTATION

The discipline provides theoretical and practical preparation in the field of tools and methods of information analysis and new knowledge extraction.

The program of discipline includes studying the basic directions of data analysis, basic methods, algorithms and models of data mining, methods of text information analysis and methods visual data analysis. Lecture materials of discipline on each section are supported with examples.
Цели и задачи дисциплины

Целью дисциплины является формирование у студентов представления о развитии средств и методов анализа информации и извлечения из нее новых знаний..

Дисциплина «Технология анализа и извлечения знаний» изучает теорию и практику применения и разработки основных средств и методов анализа информации и извлечения из нее новых полезных знаний. В процессе её изучения студенту необходимо освоить следующие задачи:

  • усвоить теоретические основы методов анализа информации и извлечения из нее новых знаний;

  • иметь представление об особенностях средств, методов и алгоритмов анализа больших объемов данных;

  • использовать информацию и соответствующие методы и методики для использования существующих и разработки новых методов и алгоритмов анализа данных.


Требования к уровню освоения дисциплины

В результате изучения дисциплины студенты должны:

  1. Знать основные направления анализа данных, задачи решаемые средствами Data Mining и методы их решения.

  2. Уметь применять методы оперативного и интеллектуального анализа данных для решения задач многомерного анализа, классификации, кластеризации и построения ассоциативных правил.

  3. Владеть навыками применения средств анализа для извлечения из данных новых знаний и разрабатывать собственные методы.

Содержание рабочей программы
Введение (12)

Тема 1. OLTP системы

Системы поддержки принятия решений (СППР). Базы данных (БД) СППР. Иерархические БД. Сетевые БД. Реляционные БД. Правила Кода для реляционных баз данных. Постреляционные БД. OLTP системы. Понятие транзакции. Неэффективность OLTP систем для анализа данных.(2)

Тема 2. Хранилище данных

Концепция хранилища данных (ХД). СППР с физическим ХД. СППР с виртуальных ХД. Достоинства и недостатки ХД. Витрины данных (ВД). СППР с ВД. СППР с ХД и ВД. Организация ХД. Информационные потоки в ХД. ETL – процесс. Очистка данных. ХД и анализ.(2)

Тема 3. Многомерный анализ данных

Многомерная модель данных. Представление данных в виде многомерного куба. Операции среза, вращения и детализации. Определение OLAP – системы. Двенадцать правил Кода. Дополнительные правила Кода. Тест FASMI. (2)

Архитектура систем OLAP систем. Многомерный OLAP (MOLAP). Реляционный OLAP (ROLAP). Схема звезда и снежинки. Гибридный OLAP (HOLAP). Средства оперативного анализа данных. (2)

Тема 4. Интеллектуальный анализ данных (Data Mining)

Определение Data Mining (DM). Классификация задач DM. Задача классификации и регрессии. Задача поиска ассоциативных правил. Задача кластеризации. Практическое применение DM. Предсказательные и описательные модели DM. Методы DM. Процесс обнаружения знаний.(2)

Тема 5. Средства анализа данных

Библиотека Weka. Структура библиотеки. Поддерживаемые методы. Библиотека Xelopes. Структура библиотеки. Поддерживаемые методы. Средства Oracle Data Mining. Средства Microsoft. Другие средства Data Mining.(2)
Базовый курс (22)

Тема 6. Задача классификации и регрессии

Постановка задачи. Представление результатов. Правила классификации. Деревья решений. Математические функции.(2)

Методы построения правил классификации. Методы построения деревьев решения. Методика «разделяй и властвуй». Алгоритм покрытия.(2)

Метод построения математических функций. Линейные методы. Нелинейные методы. Метод Support Vector Machine. Анализ временных рядов. Методы прогнозирования. (2)

Тема 7. Задача поиска ассоциативных правил

Формальная постановка задачи. Ассоциативные правила. Виды правил. Поддержка. Достоверность. Улучшение. Алгоритм Apriori и его разновидности. (2)

Сиквенциальный анализ. Формальная постанова задачи. Разновидности задачи поиска ассоциативных правил. Алгоритм MSAP. (2)
Тема 8. Задача кластеризации

Понятие кластера и кластеризации. Формальная постановка задачи кластеризации. Понятие расстояния. Матрица отличия. Меры близости. Представление результатов: линейные функции, венские диаграммы, дентограммы.(2)

Иерархические алгоритмы кластеризации: агломеративные и дивизимные алгоритмы.

Неиерархические алгоритмы. Поиск оптимального разбиения.(2)

Нечеткие алгоритмы. K-means алгоритм. Кластеризация данных при помощи нечетких отношений. Алгоритм Fuzzy C Means. Кластеризация по Гюстафсону-Кесселю. Адаптивные методы кластеризации. (2)
Целевой курс (8)

Тема 9. Визуальный анализ данных (Visual Mining)

Процесс визуализации данных. Характеристики средств визуализации данных. Метод геометрических преобразований. Отображение иконок. Методы, ориентированные на пикселы. Иерархические образы. (2)

Тема 10. Анализ текстовой информации (Text Mining)

Определение Text Mining. Предварительная обработка текста. Задачи Text Mining. Извлечение ключевых понятий из текста. Классификация текстовых документов. Кластеризация текстовых документов. Аннотирование текстов. Средства анализа текстовой информации.(2)

Тема 11. Распределенный анализ данных.

Проблемы распределенного анализа данных. Существующие подходы к анализу распределенных данных. Использование мобильных агентов для анализа. Варианты анализа распределенных данных.(2)

Тема 12. Стандарты Data Mining

Существующие стандарты Data Mining. Стандарт CWM. Стандарт CRISP. Стандарт PMML. Стандарт SQL/MM. Стандарт OLE DB для Data Mining. Стандарт JDMAPI. (2)

Перечень лабораторных работ




Наименование темы работы

Номера тем программы

1

Построение систем многомерного анализа

3

2

Выполнение анализа данных методами data mining

4

3

Создание программ анализа данных с использованием алгоритмов Data Mining

5

4

Реализация алгоритмов построения supervised моделей

6

5

Реализация алгоритмов построения unsupervised моделей

7,8

Расчет учебных часов по видам занятий



темы

Название разделов и тем

Объем учебных часов

Семестр

Литература

Лекц.

Лаб.

раб..

Ауд. занят.

Сам.

раб.

Всего

1

OLTP системы

2

0

2

6

8

10

Л1

2

Хранилище данных

2

0

2

8

10

10

Л1, Д1-Д3

3

Многомерный анализ данных

4

2

6

10

16

10

Л1,
Д1

4

Интеллектуальный анализ данных (Data Mining)

2

2

4

8

12

10

Л1,
Д4, Д5

5

Средства анализа данных

2

4

6

2

8

10

Л1,
Д4, Д5

6

Задача классификации и регрессии

8

2

10

14

24

10

Л1,
Д4, Д5

7

Задача поиска ассоциативных правил

6

2

8

10

18

10

Л1,
Д4, Д5

8

Задача кластеризации

8

2

10

14

24

10

Л1,
Д4, Д5

9

Визуальный анализ данных (Visual Mining)

2

0

2

4

6

10

Л1,



10

Анализ текстовой информации (Text Mining)

2

0

2

4

6

10

Л1,



11

Стандарты Data Mining


2

0

2

4

6

10

Л1,



12

Распределенный анализ данных.

2

0

2

4

6

10

Л1




Всего

42

14

56

88

144








Самостоятельная работа студентов



Вид самостоятельной работы

Разделы или темы рабочей программы (в скобках указан № темы из

рабочей программы)

Объем часов

Форма отчетности

1

Реферат

Современные технологии анализа данных (темы 1-4)

32

Реферат


Задачи анализа данных с учителем (Supervised learning) (тема 6)

14

Реферат

Задачи анализа данных без учителя (Unsupervised learning) (темы 7,8)

24

Реферат

Специальные вопросы анализа данных. (темы 9-11)

12

Реферат

4

Самоподготовка

Изучение средств Data Mining. (тема. 5)

2




Изучение системы распределенного анализа данных. (тема 12)

4






Учебно-методическое обеспечение дисциплины


Основная литература




Название, библиографическое описание

Лек

Л.р.

К-во экз. в библ.

Гриф

Л1

Технологии анализа данных. Data Mining, Visual Mining, Text Mining, OLAP. /А.А.Барсегян, М.С.Куприянов, В.В.Степаненко, И.И.Холод. СПб.: БХВ-Петербург, 2007. 384 с.: ил.

1-12

1, 2 3, 4,5

20

Учебное пособие


Дополнительная литература




Название, библиографическое описание

К-во экз. в

библ.

(на каф.)

Д1

Alex Berson, Stephen J. Smith. Data Warehousing, Data Mining & OLAP. McGraw-Hill. 1997




Д2

W. H. Inmon Building the Data Warehouse. Third Edition. Jhon Wiley & Sons, Inc. 2002




Д3

Ralph Kimball. The Data Warehouse Toolkit. Second Edition. Jhon Wiley & Sons, Inc. 2002




Д4

Michael J. A. Berry, Gordon Linoff. Data Mining Techniques. Jhon Wiley & Sons, Inc. 1997




Д5

Ian W., Elbe F. Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations. Department of computer science University of Waikato.






Зав.отделом учебной литературы Киселева Т.В.
Автор

к.т.н., доцент Холод И.И.
Рецензент

к.т.н., доцент Первицкий А.Ю.
Зав. кафедрой ВТ
д.т.н., профессор Пузанков Д.В.

Декан ФКТИ

д.т.н., профессор Герасимов И.В.


Председатель методической комиссии факультета ФКТИ




к.т.н., доцент

Михалков В.А.

Руководитель методического отдела




к.т.н., доцент

Марасина Л.А.



Добавить документ в свой блог или на сайт

Похожие:

Рабочая программа составлена в соответствии с государственными образовательными стандартами для подготовки магистров по направлению \"Информатика и вычислительная техника\" Дисциплина «Технология анализа и извлечения знаний» icon Рабочая программа составлена в соответствии с государственными образовательными...
Для профиля "Программное обеспечение и администрирование информационно-вычислительных систем и сетей"
Рабочая программа составлена в соответствии с государственными образовательными стандартами для подготовки магистров по направлению \"Информатика и вычислительная техника\" Дисциплина «Технология анализа и извлечения знаний» icon Рабочая программа составлена в соответствии с государственными образовательными...
Для профиля "Программное обеспечение и администрирование информационно-вычислительных систем и сетей"
Рабочая программа составлена в соответствии с государственными образовательными стандартами для подготовки магистров по направлению \"Информатика и вычислительная техника\" Дисциплина «Технология анализа и извлечения знаний» icon Рабочая программа дисциплины операционные системы для подготовки...
...
Рабочая программа составлена в соответствии с государственными образовательными стандартами для подготовки магистров по направлению \"Информатика и вычислительная техника\" Дисциплина «Технология анализа и извлечения знаний» icon Гоу впо «Санкт-Петербургский утверждено государственный университет...
Закон Российской Федерации “Об образовании” и федеральными государственными образовательными стандартами 3-го поколения, а также...
Рабочая программа составлена в соответствии с государственными образовательными стандартами для подготовки магистров по направлению \"Информатика и вычислительная техника\" Дисциплина «Технология анализа и извлечения знаний» icon Рабочая программа дисциплины
Для подготовки магистров по направлению 239100 – “Информатика и вт” по инновационной образовательной программе 230150 “Управление...
Рабочая программа составлена в соответствии с государственными образовательными стандартами для подготовки магистров по направлению \"Информатика и вычислительная техника\" Дисциплина «Технология анализа и извлечения знаний» icon Задачами общения. I. Требования к поступающим
Программа вступительного экзамена в аспирантуру по иностранному языку разработана в соответствии с государственными образовательными...
Рабочая программа составлена в соответствии с государственными образовательными стандартами для подготовки магистров по направлению \"Информатика и вычислительная техника\" Дисциплина «Технология анализа и извлечения знаний» icon Учебное пособие разработано в соответствии с государственным образовательным...
Учебное пособие предназначено для студентов, изучающих дисциплину «Базы данных» на третьем курсе. В пособии рассматриваются основы...
Рабочая программа составлена в соответствии с государственными образовательными стандартами для подготовки магистров по направлению \"Информатика и вычислительная техника\" Дисциплина «Технология анализа и извлечения знаний» icon Министерство сельского хозяйства РФ федеральное государственное бюджетное...
Программа вступительного экзамена в аспирантуру по иностранному языку разработана в соответствии с государственными образовательными...
Рабочая программа составлена в соответствии с государственными образовательными стандартами для подготовки магистров по направлению \"Информатика и вычислительная техника\" Дисциплина «Технология анализа и извлечения знаний» icon Пояснительная записка Программа дисциплины «Технология производства первичных фонограмм»
Программа дисциплины «Технология производства первичных фонограмм» федерального компонента сд составлена в соответствии с государственным...
Рабочая программа составлена в соответствии с государственными образовательными стандартами для подготовки магистров по направлению \"Информатика и вычислительная техника\" Дисциплина «Технология анализа и извлечения знаний» icon Методические указания по выполнению контрольно-курсовой работы для...
Цели и задачи выполнения контрольно-курсовой работы
Литература


При копировании материала укажите ссылку © 2015
контакты
literature-edu.ru
Поиск на сайте

Главная страница  Литература  Доклады  Рефераты  Курсовая работа  Лекции