2. Элементы теории измерений3
Исходная информация об объектах анализа (данные) чаще всего представляется в виде числовых таблиц (матриц B=||bij||), строки которых соответствуют объектам, а столбцы отражают свойства (признаки, характеристики) этих объектов. Т.е. элемент bij есть значение j-го признака i-го объекта. Полностью объект описывается всем множеством элементов i-ой строки. Информация обо всех объектах, записанные в такой таблице “объект-свойство”, называется таблицей данных.
Если вы ведете протокол измерений «объект-свойство» для собственного пользования, то вы свободны в выборе языка ведения протокола. Только сами помните, что измеряли и как кодировали результаты измерений. Если же протокол будет использоваться другими людьми, а тем более, если он предназначен для использования компьютерными программами, требуется обеспечить однозначное понимание смысла любым пользователем.
Из множества возможных способов отображения наблюдаемого мира получили распространение всего несколько, ставшие общепринятыми. Их изучением занимается теория измерений.
Ниже представляются основные сведения из этой теории, необходимые для описания методов анализа данных.
2.1. Типы измерительных шкал
В процессе измерения участвуют два объекта: измерительный прибор и измеряемый объект. Теория измерений оперирует понятиями эмпирическая система с отношениями и символьная система с отношениями
E=(A,R) - эмпирическая система, где A - множество измеряемых объектов, R - отношения между ними.
N=(M,P) - символьная система, где M - множество символов, P - конечный набор отношений на этих символах.
Договоренность использовать фиксированное отображение системы E на N означает выбор некоторого определенного правила отображения g. Тройка (E,N,g ) называется шкалой.
Мы можем договориться о некотором другом способе отображения w, и тогда будем иметь дело с другой шкалой (E,N,w).
Например, в g записываем вес в килограммах, а в w - в тоннах. Цифровая запись оказывается различной при одинаковом эмпирическом содержании. Это означает, что выбраны не любые способы отображения, а только такие, которые связаны взаимно однозначными преобразованиями. Т.е. имеется такое преобразование f, что
g=f(w), w=f’(g)
Преобразование f объединяет шкалы в группу, которая называется типом шкалы.
В практике научных исследования получили распространение шкалы всего нескольких типов.
1. АБСОЛЮТНАЯ ШКАЛА. Допустимое преобразование для шкал данного типа представляет из себя тождество. Пример: 9=IX.
2. ШКАЛА ОТНОШЕНИЙ. Между разными протоколами, фиксирующими один и тот же эмпирический факт на разных языках должно выполняться отношение y=αx.
Один и тот же смысл имеют протоколы: 16 кг, 16 000 г, 0.016 т, 1 пуд.
Этот тип шкалы удобен для записи величин, имеющих единицу измерения - длин, весов, скоростей и т.п.
3. ШКАЛА ИНТЕРВАЛОВ. Здесь между протоколами y, x допустимы линейные преобразования y=αx+b. Это означает, что в разных протоколах может использоваться разный масштаб единиц (α) и разные начала отсчета b. Пример: шкалы для измерения температуры (Цельсия, Кельвина, Фаренгейта).
4. ШКАЛА ПОРЯДКА. Допустимыми в данных шкалах являются все монотонные преобразования, т.е. такие, которые не нарушают порядок следования значений измеряемых величин. Такие протоколы появляются, например, при сравнении тел по твердости. Записи «1,2,3» и «5.3, 12.5, 109.2» содержат одинаковую информацию о том, что первое тело является самым твердым, второе - менее, а третье - еще менее твердым.
Разновидностью шкал порядка являются шкалы рангов, идущие от 1 вверх по возрастанию (например, ранги слов в тексте с совпадающими частотами). Разновидностью шкал порядка являются шкалы баллов. При этом используются целы числа в ограниченном диапазоне значений: от 1 до 5 или от 1 до 12 (оценки успеваемости в школе), от 0 до 6 или 10 (в спорте).
Протоколы шкал порядков содержат информацию только о трех эмпирических отношениях «больше», «меньше» и «равно».
5. ШКАЛА НАИМЕНОВАНИЙ. В этих шкалах фиксируются только два отношения «равно» и «не равно». Следовательно, допустимы любые преобразования, лишь бы разные объекты имели разные обозначения (имена). Примеры: национальность, названия населенных пунктов и т.п. (Если два разных населенных пункта имеют одинаковые названия, то добавляются уточнители, которые уже вместе с названием являются уникальным наименованием).
|