1 Определение количества информации по Хартли и Шеннону1




Скачать 490.82 Kb.
Название 1 Определение количества информации по Хартли и Шеннону1
страница 4/13
Дата публикации 18.09.2014
Размер 490.82 Kb.
Тип Литература
literature-edu.ru > Информатика > Литература
1   2   3   4   5   6   7   8   9   ...   13

1.9. Тезаурусная модель коммуникации



Для учета эффектов, связанных с «субъективно-знаниевыми» различиями приемника и передатчика в коммуникационных процессах, являющимися следствиями различных объемов знаний в предметной области сообщения, была предложена тезаурусная модель. Она интересна тем, что сохраняя идеологическую связь с психологическим подходом к процессам мышления и феномену понимания, позволяет очень наглядно и просто проиллюстрировать эти процессы.

Слово THESAURUS означает сокровище, богатство, запас. Термин был применен  впервые в 13-м веке учителем Данте флорентийцем Бруннет Латини (1220-1294) как название энциклопедии [7]. В наше время этот термин был введен Кэмбриджской группой по изучению языка (Великобритания) в 1956 г. [8].

Согласно "Современному словарю иностранных слов":

Тезаурус [гр. Thesauros запас]

1) словарь, в котором максимально полно представлены все слова языка с исчерпывающим перечнем примеров их употребления в текстах; в полном объеме осуществим лишь для мертвых языков;

2) идеографический словарь, в котором показаны семантические отношения (синонимические, родо-видовые и др.) между лексическими единицами;

3) в информатике - полный систематизированный набор данных о какой-либо области знаний, позволяющий человеку или вычислительной машине в ней ориентироваться.

Толковые словари в электронном виде, используемые для описания терминологии какой-либо отрасли знаний в автоматизированных системах поиска информации, получили название информационно-поисковых тезаурусов. Относительно недавно «тезаурус» стал обозначать структурированное знание (но теперь уже структурированное знание стало модно называть «онтологией»). Он задает систему семантических, смысловых связей между понятиями. Каждое понятие в тезаурусе может объясняться через набор других понятий, что приводит к появлению семантического поля. Фактически тезаурус читателя - приемника информации – это вербализованная совокупность его представлений об исследуемой предметной области.

Графически тезаурус - это семантическая сеть. Поэтому тезаурусную модель коммуникационных процессов (передатчик информации – приемник (адресат) информации) можно было бы с полным основанием назвать «знаниевой», однако - это уже дело вкуса.

Сущность тезаурусной модели коммуникации изложу по статье Леонова [7] (ссылки [9,10] взяты из эой же статьи).

«Подлинная семантическая (смысловая) информация у адресата возникает в процессе взаимодействия принимаемого им сообщения и его тезауруса. В специальной литературе этот этап информационного процесса иногда называют этапом прохождения информации через семантический фильтр….Количественные оценки степени содержательности тезауруса в принципе возможны. Так, часть докладов 6-й Международной конференции по наукометрии и инфометрии, прошедшей 16-19 июня 1997 г. в Иерусалиме и организованной одноименным международным обществом ISSI, была посвящена этим вопросам (http://shum.cc.huji.ac.il/~bluer/ISSI/).»

Пусть передатчик, обладающий тезаурусом Tout, передает какое-то сообщение - фрагмент своего тезауруса TfTout - приемнику, обладающему тезаурусом Tinp.Tf при приеме сообщения сравнивается с Tinp. Рассмотрим возможные варианты этого процесса.

Если $TfTinp, то никаких изменений в Tinp не происходит, следовательно, приемник не извлекает из сообщения никакой информации.

Если R=TfTinp≠, Tout≠Tinp, то R может быть воспринята приемником.

Если R= то приемник не извлечет из сообщения никакой информации и изменения его тезауруса не произойдет.

Чем больше Tinp, тем больше вероятность того, что $TfTinp, и количество информации, получаемое из сообщения, будет зависеть в итоге от величины Tinp.

Нелинейная зависимость приращения тезауруса приемника dT от исходного объема тезауруса T, при получении им сообщения, качественно изображена ниже.



Таким образом, минимальному значению величины тезауруса Tinp,min (точка 1) соответствует нулевое количество полученной из сообщения информации. Такое же (нулевое) количество информации соответствует и максимальному тезаурусу Tinp,max (точка 3). Наибольшее же количество информации Imax извлекается приемником из сообщения при величине его тезауруса, близкой к средней (точка 2).

При значительной разнице тезаурусов источника и приемника информации количество информации, извлекаемое из сообщения приемником, невелико. Например, если тезаурус крупного ученого, работающего в какой-либо области науки, значительно шире среднего тезауруса специалиста в этой области, то знакомящиеся с его работами коллеги вероятнее всего не смогут извлечь из них сколько-нибудь значительного количества информации, т.е. не поймут их.

«По мере продвижения к точке 3 происходит не только увеличение его тезауруса, но и уменьшение стимула исследователя к его пополнению, поскольку углубляющаяся детализация знаний относительно объекта исследования приводит к уменьшению относительной ценности вновь поступающей информации. Этот эффект ... можно интерпретировать как закон нарастающей трудности в достижении полной информированности [42-8]. Поэтому по мере приближения тезауруса исследователя к позиции 3 возрастает и относительный объем затрат на единицу новой информации - среди известной информации все труднее найти неизвестную. "В результате наступает "информационная старость", своеобразный "информационный голод" от "пресыщения", а по существу – исчерпание полезной информации.

Именно эта двойственность природы тезауруса отражает одну из объективных предпосылок возникновения смежных научных дисциплин - интеграции наук: по мере углубления познания в процессе развития отдельной конкретной науки, все более детального расчленения ее предмета на частные направления информация, приносимая их изучением, утрачивает свою ценность. На этом этапе возникает объективная потребность расширения объекта познания, объединения нескольких научных направлений, на стыке которых научные исследования снова обретают свою ценность" [43-9]. Иными словами, для того чтобы процесс расширения тезауруса имел достаточно высокий стимул и соответственно доставлял столь же адекватное удовлетворение, необходимо чтобы тезаурус исследователя был постоянно выше того уровня, который необходим для адекватного восприятия поступающей информации. Наиболее оптимальная технология его расширения для этой цели, это освоение основных понятий и идей смежных отраслей знания.»
Очевидно, что можно говорить о тезаурусе человечества как о сумме накопленных им знаний. Можно исследовать как тезаурусы отдельных специалистов, так и тезаурусы областей знания.

Объекты внешнего мира и отношения между ними отражаясь мозгом человека, образуют его тезаурус плана содержания. Вербализованная часть плана содержания (слова,поставленные в соответствие элементам плана содержания - информационным единицам - узлам и дугам - отношениям) составляет тезаурус плана выражения. Планы содержания и планы выражения не обязательно идентичны, поскольку «слово не покрывает понятия». Однако исследовать тезаурус плана выражения существенно легче, чем структуру нейронных ансамблей - физических (физиологических) носителей информации плана содержания.
1   2   3   4   5   6   7   8   9   ...   13

Похожие:

1 Определение количества информации по Хартли и Шеннону1 icon Школьная газета как средство формирования
Причины таких изменений вызваны резким увеличением количества информации. А на стыке веков в 2000 году на Давоском форуме Тони Блэр,...
1 Определение количества информации по Хартли и Шеннону1 icon Поиск информации в Интернет
В таблице приведены запросы к поисковому серверу. Расположите обозначения запросов в порядке возрастания количества страниц, которые...
1 Определение количества информации по Хартли и Шеннону1 icon Автоматизированная система регистрации на услуги одо «Автопроспектсервис»
Анализ технологии обработки информации в предметной области и определение требований к асои 4
1 Определение количества информации по Хартли и Шеннону1 icon Практическое пособие. Оглавление А. Личные мотивы выдачи информации....
Определение людей, которым с точки зрения объекта предельно нежелательно знать чернящие его данные. 82
1 Определение количества информации по Хартли и Шеннону1 icon Рейтинг-план по курсовым работам Факультет ппф курс 2-3 Группы: о-11, сдп-11, о-12, сдп-12
Поиск и определение источников информации по теме курсовой работы, составление списка литературы и других источников
1 Определение количества информации по Хартли и Шеннону1 icon Конфиденциальность гарантируется получателем информации
Нарушение порядка представления статистической информации, а равно представление недостоверной статистической информации влечет ответственность,...
1 Определение количества информации по Хартли и Шеннону1 icon Программа Visual Graph может работать как в Unix системах, так и в Windows
Визуализация информации — это процесс преобразования больших и сложных видов абстрактной информации в визуальную форму. Универсальным...
1 Определение количества информации по Хартли и Шеннону1 icon План Введение. Определение и виды эксперимента. Основные принципы...
К числу самых своеобразных и трудноосваиваемых методов сбора социологической информации относится эксперимент. Уже одно название...
1 Определение количества информации по Хартли и Шеннону1 icon Программа междисциплинарного экзамена по специальности 075200 «компьютерная безопасность»
Понятие информации. Количество информации в равновероятных и неравновероятных сообщениях
1 Определение количества информации по Хартли и Шеннону1 icon Колесник В. Д., Полтырев Г. Ш. Курс теории информации
Сети ЭВМ и телекоммуникации, сетевые технологии, распределенные автоматизированные системы обработки информации и управления
Литература


При копировании материала укажите ссылку © 2015
контакты
literature-edu.ru
Поиск на сайте

Главная страница  Литература  Доклады  Рефераты  Курсовая работа  Лекции