1 Определение количества информации по Хартли и Шеннону1

Скачать 490.82 Kb.

Название	1 Определение количества информации по Хартли и Шеннону1
страница	1/13
Дата публикации	18.09.2014
Размер	490.82 Kb.
Тип	Литература

literature-edu.ru > Информатика > Литература

1 2 3 4 5 6 7 8 9 ... 13

Чанышев О.Г. Информация, данные, знания

Введение. 1

1. Информация 1

2. Элементы теории измерений 13

3. Прецеденты. Закономерность и гипотеза 17

4. Таксономия. Алгоритмы класса FOREL 21

5. Распознавание образов 28

6. О выборе информативного множества признаков 34

7. Меры близости между предикатами 36

Литература 39

Введение.

Данные – это информация об объектах, представленная как в числовом, так и в символьном виде. Данные в системах искусственного интеллекта (ИИ) анализируются с целью получения закономерностей, на основании которых система может принять решение, дать совет другой системе (например человеку), которая возможно использует его опять же для принятия решения, предсказать развитие той или иной ситуации. Чтобы работать с данными, они должны быть, прежде всего, структурированы. Развитие информационных структур для представления данных в ЭВМ привело к созданию мощных Систем Управления Базами Данных (СУБД), обеспечивающих гибкие методы хранения данных и манипулирования ими.

Выявленные закономерности и другая информация о данных – метаданные – помещается в БД, превращая их в Базы Знаний (БЗ).
Изложение, начиная со второго раздела («Элементы теории измерений»), основано на книге Н.Г. Загоруйко «Прикладные методы анализа данных и знаний» [1]). Но в начале мы обсудим сам термин «информация» и познакомимся с основными понятия теории измерений.

1. Информация

Согласно Философскому энциклопедическому словарю [2], слово «информация» происходит от латинского слова informatio - ознакомление, разъяснение, представление, понятие и может обозначать:

1) сообщение, осведомление о положении дел, сведения о чем-либо, передаваемое людьми;

2) уменьшаемую, снимаемую неопределенность в результате получения сообщений;

3) сообщение, неразрывно связанное с управлением, сигналы в единстве синтаксических, семантических и прагматических характеристик;

4) передачу, отражение разнообразия в любых объектах и процессах (живой и неживой природы).

1.1. Определение количества информации по Хартли и Шеннону^¹

Развитие средств связи (телефон, телеграф, радио) и в начале XX в. потребовало численных методов исследования характеристик трактов передачи сообщений, отвлекаясь от смысла сообщений .

1.1.1. Формула Хартли

Понятия неопределенности и вероятности взаимно обратимы. Выбор одного или нескольких вариантов из множества уменьшает неопределенность. Пусть некоторое событие имеет m равновероятных исходов. Таким событием может быть, например, появление любого символа из алфавита, содержащего m таких символов. Количество информации, которое может быть передано при помощи такого алфавита можно измерить, определив число N возможных сообщений, которые могут быть переданы при помощи этого алфавита. Если сообщение содержит n символов (n – длина сообщения), то N=mⁿ. Для того, чтобы удовлетворить естественным требованиям равенства информации нулю при m=1 и чтобы количество информации, получаемое от двух независимых источников было равно сумме "информаций", Хартли предложил считать количество информации, приходящееся на одно сообщение, равным логарифму общего числа возможных сообщений:

I(N) = log(N)

Если возможность появления любого символа алфавита равновероятна, то эта вероятность p = 1/m. Полагая, что N = m, получим:

I=log(N)=log(m)=log(1/p)=-log(p)

Количество информации на каждый равновероятный сигнал равно минус логарифму вероятности отдельного сигнала. Чем меньше вероятность получения сообщения, тем более оно информативно.

За единицу количество информации приняли ее количество, получаемое при выборе одного из двух взаимоисключающих вариантов. Для этого в последней формуле следует взять логарифм по основанию 2.

Тогда

I=-log₂p=-log₂(1/2)=log₂2=1 BIT (BInary uniT)

1.1.2. Определение информации Шенноном

На практике при определении количества информации необходимо учитывать как количество различных сообщений от источника, так и разную вероятность их получения.

Пусть имеем на достаточно длинном отрезке сообщения k элементарных различных сигналов в количестве

N₁,N₂..,N_k,

ΣN_i=N.

f₁, f₂, ..., f_k - частоты соответствующих сигналов (f_i=Ni/N).
При возрастании длины отрезка сообщения каждая из частот стремится к фиксированному пределу, т.е.

lim(f_i)=p_i,(i = 1, 2, ..., k),

и p_i можно считать вероятностью сигнала. Полное количество информации, доставаемое N сигналами, будет примерно равно (при достаточно большом N)
-N

Чтобы определить среднее количество информации, приходящееся на один сигнал, нужно это число разделить на N. В результате будет получено асимптотическое соотношение - формула Шеннона.

В случае равной вероятности сигналов, формула формула Шеннона переходит в формулу Хартли.

Поскольку не всегда возможно установить перечень состояний системы и вычислить их вероятности, а также в силу ограниченности шенноновской теории только синтаксической стороной сообщения, были выдвинуты иные концепции и толкования понятия «информация».

1 2 3 4 5 6 7 8 9 ... 13

Добавить документ в свой блог или на сайт

Похожие:

	Школьная газета как средство формирования Причины таких изменений вызваны резким увеличением количества информации. А на стыке веков в 2000 году на Давоском форуме Тони Блэр,...		Поиск информации в Интернет В таблице приведены запросы к поисковому серверу. Расположите обозначения запросов в порядке возрастания количества страниц, которые...
	Автоматизированная система регистрации на услуги одо «Автопроспектсервис» Анализ технологии обработки информации в предметной области и определение требований к асои 4		Практическое пособие. Оглавление А. Личные мотивы выдачи информации.... Определение людей, которым с точки зрения объекта предельно нежелательно знать чернящие его данные. 82
	Рейтинг-план по курсовым работам Факультет ппф курс 2-3 Группы: о-11, сдп-11, о-12, сдп-12 Поиск и определение источников информации по теме курсовой работы, составление списка литературы и других источников		Конфиденциальность гарантируется получателем информации Нарушение порядка представления статистической информации, а равно представление недостоверной статистической информации влечет ответственность,...
	Программа Visual Graph может работать как в Unix системах, так и в Windows Визуализация информации — это процесс преобразования больших и сложных видов абстрактной информации в визуальную форму. Универсальным...		План Введение. Определение и виды эксперимента. Основные принципы... К числу самых своеобразных и трудноосваиваемых методов сбора социологической информации относится эксперимент. Уже одно название...
	Программа междисциплинарного экзамена по специальности 075200 «компьютерная безопасность» Понятие информации. Количество информации в равновероятных и неравновероятных сообщениях		Колесник В. Д., Полтырев Г. Ш. Курс теории информации Сети ЭВМ и телекоммуникации, сетевые технологии, распределенные автоматизированные системы обработки информации и управления

Литература