Скачать 5.74 Mb.
|
Трудность, с которой сталкиваются начинающие при использовании интервальной нормализации, состоит в том, что обычные статистические таблицы не приспособлены для психометрики: нужно отыскивать значение процентильного ранга внутри таблицы, а соответствующую сигма-оценку – с краю. Для облегчения ориентации приведем фрагмент таблицы соответствий PR, а и стенов (табл. 4): Таблица 4
В обычных таблицах из соображений симметрии даны лишь значения для PR > 50. Для PR < 50 соответствующие значения находятся из тех же таблиц σ = ψ -1(1- PR/100). Например, для PR =35 мы находим 1 - PR/100 = 1 - 0,35 = 0,65, затем - по табл. ψ -1 = 0,39 и берем это значение с отрицательным знаком -0,39. Для нормализации удобно пользоваться графическим методом (нормальной бумагой, стандартной 5-образной кривой и т. п.). В результате нормализации интервалы между исходными сырыми баллами переоцениваются в соответствии с нормальной моделью. В отличие от процентильной шкалы, нормальная шкала придает больший вес (в дифференциации испытуемых) краям распределения: различия между испытуемыми, набравшими 95 и 90 процентилей, оцениваются как более высокие, чем различия между испытуемыми, набравшими 65 и 60 процентилей. В применении к шкалам оценок (рейтинговым шкалам) метод нормализации интервалов называется «методом последовательных интервалов» (Клигер С. А. и др., 1978, с. 75-81). В результате применения процедуры нормализации исследователь-психометрист получает для нормативной выборки таблицу перевода сырых баллов в нормализованные баллы. На основе этих таблиц часто строят графики: деления сырых баллов наносят на числовую ось с неравными интервалами, так что эмпирическое распределение частот максимально близко приближается к нормальной форме. Пример такой графической нормализации - профильные листы MMPI (Анастази А., 1982, с. 129). Так как нормальное распределение описывается всего двумя параметрами: средним М (мерой положения) и средним квадратическим (или стандартным) отклонением а (мерой рассеяния), то диагностические нормы в случае нормализованных шкал описываются в единицах отклонений от среднего по выборке; например, заключают, что испытуемый А показал результат, превышающий средний балл на две сигмы, испытуемый В -результат, оказавшийся ниже среднего балла на одну сигму, и т. п. На процентильной шкале этому соответствуют процентильные ранги 95 и 16 соответственно. Переход к нормальному распределению создает очень удобные условия для количественных операций с диагностической шкалой: как со шкалой интервалов с ней можно производить операции линейного преобразования (умножение и сложение), можно описывать диагностические нормы в компактной форме (в единицах отклонений), можно применять линейный коэффициент корреляции Пирсона, критерии для проверки статистических гипотез, построенные в применении к нормальному распределению, т. е. весь аппарат традиционной статистики (основанной на нормальном распределении). ! Неправомерность онтологизации нормального закона. В традиционной психометрике нормальное распределение выступает в роли инструментального понятия, облегчающего оперирование с данными. Но это не означает, что можно забывать об искусственном происхождении нормального распределения. Традиции западной тестологии, основанные еще Ф. Гальтоном, предполагают однородность теоретических представлений психометрики и биометрики. Точно так же как происхождение нормального распределения при исследовании вариативности биологических характеристик человеческого организма связывается с наличием взаимодействия постоянного фактора генотипа и изменчивых случайных факторов фенотипа, - происхождение межиндивидуальных психологических различий связывается с генетическим кодом, якобы предопределяющим положение индивида на оси нормальной кривой. В действительности же нет никаких оснований приписывать появление нормальной кривой, часто получаемой с помощью специальных статистических непростых процедур, действию механизма наследственности. В тех случаях, когда на большой выборке удается получить нормальное распределение без каких-либо искусственных способствующих этому мер, это опять-таки не означает вмешательства генетики. Закон нормального распределения воспроизводится всякий раз, когда на измеряемое свойство (на формирование определенного уровня способностей индивида) действует множество разных по силе и направленности факторов, независимых друг от друга. История прижизненных средовых воздействий, которые испытывает на себе субъект, также подобна последовательности независимых событий: одни факторы действуют в благоприятном направлении, другие - в неблагоприятном, а в результате взаимопогащение их влияний происходит чаще, чем тенденциозное однонаправленное сочетание (большинство благоприятных или большинство неблагоприятных), т. е. возникает нормальное распределение. Массовые исследования показывают, что введение контроля над одним из средовых популяционных факторов (уровень образования родителей, например) приводит к расслоению кривой нормального распределения: выборочные кривые оказываются смещенными относительно друг друга (Анастази А., 1982, с. 201). Эти результаты служат ярким подтверждением социокультурного происхождения статистических диагностических норм, что одновременно служит основанием для серьезных предосторожностей при переносе норм, полученных на одной популяции, на другие популяции. Однородными можно считать только те популяции, по отношению к которым действует одинаковый механизм выборки: ив ситуации создания (стандартизации) теста, и в ситуации его диагностического применения. Здесь приходится учитывать и такие нюансы выборочного механизма, как феномен нормальных добровольцев. Если выборку стандартизации формировать на студентах, добровольно согласившихся участвовать в тестировании, а применение теста планируется на сплошных выборках (в административном порядке), то это грозит определенными ошибками в диагностических суждениях, так как психологический портрет «добровольца» в существенных чертах отличается от портрета испытуемого, соглашающегося на тестирование только под административным давлением (Шихирев П.Н, 1979, с. 181). Подсчет параметров и оценка типа распределения. Для описания выборочного распределения, как правило, используются следующие известные параметры: 1. Среднее арифметическое значение: , (3.1.1) где xj – балл i-го испытуемого; yi -значение i-го балла по порядку возрастания; pi - частота встречающегося i-го балла; n - количество испытуемых в выборке (объем); m - количество градаций шкалы (количество баллов).
, (3.1.2) где - сумма квадратов тестовых баллов для и испытуемых. 3. Асимметрия: (3.1.3) где - среднее арифметическое значение; S - стандартное отклонение; θ - среднее кубическое значение: , С - среднее квадратическое: 4. Эксцесс: , (3.1.4) где Q - среднее значение четвертой степени: . Стандартная ошибка среднего арифметического значения (математического ожидания) оценивается по формуле: (3.1.5) На основе ошибки математического ожидания строятся доверительные интервалы: ) Если тестовый балл какого-либо испытуемого попадает в границы доверительного интервала, то нельзя считать, что испытуемый обладает повышенным (или пониженным) значением измеряемого свойства с заданным уровнем статистической значимости. Асимметрия и эксцесс нормального распределения должны быть равны нулю. Если хотя бы один из двух параметров существенно отличается от нуля, то это означает анормальность полученного эмпирического распределения. Проверку значимости асимметрии можно произвести на основе общего неравенства Чебышева: (3.1.6) где Sa - дисперсия эмпирической оценки асимметрии: , (3.1.7) где р - уровень значимости или вероятность ошибки первого рода: ошибки в том, что будет принят вывод о незначимости асимметрии при наличии значимой асимметрии (в формулу подставляют стандартные р = 0,05 или р = 0,01 и проверяют выполнение неравенства). Сходным образом оценивается значимость эксцесса: (3.1.8) где Sе - эмпирическая дисперсия оценки эксцесса: . (3.1.9) ] Гипотезы об отсутствии асимметрии и эксцесса принимаются с вероятностью ошибки р (пренебрежимо малой), если выполняются неравенства (3.1.6) и (3.1.8). Более легкий метод проверки нормальности эмпирического распределения основывается на универсальном критерии Колмогорова. Для каждого тестового балла у. (для каждого интервала равнозначности при дискретизации непрерывной хронометрической шкалы) вычисляется величина D. - модуль отклонения эмпирической и теоретической интегральных функций распределения: (3.1.10) где F- эмпирическая интегральная функция (значение кумуляты в данной точке уj); U — теоретическая интегральная функция, взятая из таблиц1. Среди Dj отыскивается максимальное значение Dmax, и величина сравнивается с табличным значением критерия Колмогорова. В таблице 5 приведены асимптотические критические значения для распределения Колмогорова (при ). Близость эмпирического значения λе к левосторонним стандартным квантилям λt позволяет констатировать близость эмпирического и предполагаемого теоретического распределения с пренебрежимо малой вероятностью ошибки р (0,01; 0,05; 0,10 и т, п.). Близость λе к правосторонним стандартным квантилям λt позволяет сделать вывод о статистически значимом отсутствии согласованности эмпирического и теоретического распределений. Надо помнить, что критерий Колмогорова, очень простой в вычислительном' отношении, обеспечивает надежные выводы лишь при 200: Критерий Колмогорова резко снижает свою эффективность, когда наблюдения группируются по малому количеству интервалов равнозначности. Например, при n = 200 количество интервалов должно быть не менее 20 (примерно по 10 наблюдений на каждый интервал в среднем). Таблица 5
Если проверка согласованности эмпирического распределения с нормальным дает положительные результаты, то это означает, что полученное распределение можно рассматривать как устойчивое -репрезентативное по отношению к генеральной совокупности - и, следовательно, на его основе можно определить репрезентативные тестовые нормы. Если проверка не выявляет нормальности на требуемом уровне, то это означает, что либо выборка мала и нерепрезентативна к популяции, либо измеряемые свойство и устройство теста (способ подсчета) вообще не дают нормального распределения. В принципе отнюдь не обязательно все нормативные распределения сводить к нормальным. Можно с равным успехом пользоваться хорошо разработанными моделями гамма-распределения, пуассоновского распределения и т. п. Критерий Колмогорова позволяет оценить близость вашего эмпирического распределения к любому теоретическому распределению. При этом устойчивым и репрезентативным может оказаться распределение любого типа. Если из нормальности, как правило, следует устойчивость, то обратное неверно -устойчивость вовсе не обязательно предполагает нормальность распределения. Наличие значимой положительной асимметрии (см. рис. 2,а) свидетельствует о том, что в системе факторов, детерминирующих значение измеряемого показателя, преобладают факторы, действующие в одном направлении - в сторону повышения показателя. Такого рода отклонения появляются при использовании хронометрических показателей: испытуемый не может решить задачу быстрее определенного минимально необходимого периода, но может существенно долго задерживаться с ее решением. На практике распределения такого рода преобразуют в приближенно нормальное распределение с помощью логарифмической трансформации: (3.1.11) При этом говорят, что распределение хронометрических показателей подчиняется «логнормальному» закону. Подобную алгебраическую нормализацию тестовой шкалы применяют и к показателям с еще более резко выраженной положительной асимметрией. Например, в процедурах контент-анализа сам тестовый показатель является частотным: он измеряет частоту появления определенных категорий событий в текстах. Для редких категорий вероятность появления значительно меньше 0,5. Формула преобразования (3.1.12) позволяет придать необходимую 5-образную форму кумуляте. Стандартизация шкалы. В психометрике следует различать две формы стандартизации. Под стандартизацией теста понимают прежде всего стандартизацию самой процедуры проведения инструкций, бланков, способа регистрации, условий и т. п. Без стандартизации теста невозможно получить нормативное распределение тестовых баллов и, следовательно, тестовых норм. Под стандартизацией шкалы понимают линейное преобразование масштаба нормальной (или искусственно нормализованной) шкалы. В общем случае формула стандартизации выглядит так: , (3.1.13). где xi - исходный балл по «сырой» шкале, для которой доказана нормальность распределения; - среднее арифметическое по «сырому» распределению; S - «сырое» стандартное отклонение; М- математическое ожидание по выбранной стандартной шкале; σ - стандартное отклонение по стандартной шкале. Если шкала подвергалась предварительной искусственной нормализации интервалов, то формула упрощается: zj =σ zj =M (3.1.14) Приведем параметры для наиболее популярных стандартных шкал: 1) T -шкала Маккола (тест-опросник MMPI и другие тесты): М = 50 и σ = 10, 2) шкала IQ : М = 100 и σ = 15, 3) шкала «стэнайнов» (целые численные значения от 1 до 9 -стандартная девятка): М = 5,0 и σ = 2, 4) шкала «стенов» (стандартная десятка, 16PF Кеттелла): М = 5,5 .и σ = 2. Чтобы различать стандартные баллы, полученные с помощью линейной стандартизации и нелинейной нормализации интервалов, Р. Кеттелл ввел понятие «S-стенов» и «n-стенов». Таблицы «и-стенов», естественно, точнее отражают квантили эмпирического нормального распределения. Приведем образец такой таблицы для фактора А из тест-опросника 16PF; Сырые баллы 0-4 5-6 7 8-9 10-12 13 14-15 16 17-18 19-20 Стены 1 2 3 4 5 6 7 8 9 10 Применение стандартных шкал позволяет использовать более грубые, приближенные способы проверки типа распределения тестовых баллов. Если, например, процентильная нормализация с переводом в стены и линейная нормализация с переводом в стены по формуле (3.1.13) дают совпадающие целые значения стенов для каждого Y, то это означает, что распределение обладает нормальностью с точностью до «стандартной десятки». Применение стандартных шкал необходимо для соотнесения результатов по разным тестам, для построения «диагностических профилей» по батарее тестов и тому подобных целей. Проверка устойчивости распределения. Общая логика проверки устойчивости распределения основывается на индуктивном рассуждении: если половинное (полученное по половине выборки) распределение хорошо моделирует конфигурацию целого распределения, то можно предположить, что это целое распределение будет также хорошо моделировать распределение генеральной совокупности. Таким образом, доказательство устойчивости распределения означает доказательство репрезентативности тестовых норм. Традиционный способ доказательства устойчивости сводится к наличию хорошего приближения эмпирического распределения к какому-либо теоретическому. Но если эмпирическое распределение не приближается к теоретическому, несмотря на значительное увеличение объема выборки, то приходится прибегать к более общему индуктивному методу доказательства. Простейший его вариант может быть сведен к получению таблиц перевода сырых баллов в нормализованную шкалу по данным всей выборки и применению этих таблиц для каждого испытуемого из половины выборки; если распределение нормализованных баллов из половины выборки хорошо приближается к нормальному, то это значит, что заданные таблицами нормализации тестовые нормы определены устойчиво. Близость к нормальному распределению проверяется с помощью критерия Колмогорова (при n <200 целесообразно использовать более мощные критерии: «хи-вадрат» или «омега-квадрат»). При этом под «половиной выборки» подразумевается случайная половина, в которую испытуемые зачисляются случайным образом -с помощью двоичной случайной последовательности (типа подбрасывания монетки и т. п.). В более общем случае такой простейший метод установления однородности двух эмпирических распределений может быть применен и при разбиении выборки по какому-либо систематическому признаку. Если, в частности, по какому-либо из популяционно значимых признаков (пол, возраст, образование, профессия) психолог получает значимую неоднородность эмпирических распределений; то это значит, что относительно данных популяционных категорий тестовые нормы должны быть специализированы (одна таблица норм - для мужчин, другая - для женщин и т. д.). Более статистически корректный метод проверки однородности двух распределений, полученных при расщеплении выборки на равные части, опять же связан с применением критерия Колмогорова. Для этого с табличным значением сравнивается: (3.1.15) где Ке - эмпирическое значение статистики Колмогорова; Fj1 - кумулятивная относительная частота для у-того интервала шкалы по первой половине выборки; Fj2 - та же частота для второй половины; n - полный объем выборки. Точные значения квантилей распределения Колмогорова для определения размеров выборки можно найти в кн.: Мюллер П. и др., 1982. Применение критерия Колмогорова не зависит от нормальности целого распределения и от необходимости производить нормализацию интервалов. * * * Итак, априорная предпосылка нормальности распределения тестовых баллов основывается скорее на принципах операционального удобства, чем на теоретической необходимости. Психометрически корректные процедуры получения устойчивых тестовых норм возможны с помощью специальных методов непараметрической статистики (критерий «хи-квадрат» и т. п.) для распределений произвольной формы. Выбор статистической модели распределения - законный произвол психометриста, пока сам тест выступает в качестве единственного эталона измеряемого свойства. В этом случае остается лишь тщательно следить за соответствием сферы применения диагностических норм той выборке испытуемых, на которой они были получены. Произвольность в выборе статистической модели шкалы исчезает, когда речь заходит о внешних по отношению к тесту критериях. Репрезентативность критериальных тестов. В таких тестах в качестве реального эталона применяется критерий, ради которого создается тест, - целевой критерий. Особое значение такой подход имеет в тех областях практики, где высокие результаты могут дать узкоспециализированные диагностические методики, нацеленные на очень конкретные и узкие критерии. Такая ситуация имеет место в обучении: тестирование, направленное на получение информации об уровне усвоения определенных знаний, умений и навыков (При профессиональном обучений), должно точно отражать уровень освоения этих навыков и тем самым давать надежный прогноз эффективности конкретной профессиональной деятельности, требующей применения этих навыков. Так возникают «тесты достижений», по отношению к которым критериальный подход обнаружил свою высокую эффективность (Гуревич К. М, Лубовский В. И,, 1982). Рассмотрим операциональную схему шкалирования, применяемую при создании критериального теста. Пусть имеется некоторый критерий С, ради прогнозирования которого психодиагност создает тест X. Для простоты представим С как дихотомическую переменную с двумя значениями: 1 и 0. С, = 1 означает, что j-й субъект достиг критерия (попал в «высокую» группу по критерию), Сj=0 означает, что i-й субъект не достиг критерия (попал в «низкую» группу). Психодиагност применяет на нормативной выборке тест X, и в результате каждый индивид получает тестовый балл Xi. После того как для каждого индивида из выборки становится известным значение С (иногда на это требуются месяцы и годы после момента тестирования), психодиагност группирует индивидов по порядку возрастания балла Xi и для каждого деления исходной шкалы сырых тестовых баллов подсчитывает эмпирическую вероятность Р попадания в «высокую» группу по критерию С. На рис. 5 показаны распределения вероятности Р (Ci = 1) в зависимости от Xi 200> |
Ответы к экзамену по литературоведению Литературоведение как наука Литературоведение — одна из двух филологических наук — наука о литературе. Другая филологическая наука, наука о языке, — языкознание,... |
Михаил Геннадьевич Делягин Как самому победить кризис. Наука экономить, наука рисковать «Как самому победить кризис. Наука экономить, наука рисковать: простые советы / Михаил Делягин.»: Act: Астрель; Москва; 2009 |
||
Тема педагогическая психология как наука Именно это сближает педагогическую психологию с психологией труда, предметом которой является развитие психики человека под влиянием... |
Тезисы доклада «Стратегия и тактика как философская и практическая проблема» Сохраняем также, как правило, орфографию и пунктуацию участников дискуссии в Интернете |
||
Российской Федерации Министерство образования и науки Российской... Теоретическая и практическая составляющие подготавливают учащихся к изучению других предметов по направлению «коммуникология – наука... |
Российской Федерации Министерство образования и науки Российской... Теоретическая и практическая составляющие подготавливают учащихся к изучению других предметов по направлению «коммуникология – наука... |
||
Российской Федерации Министерство образования и науки Российской... Теоретическая и практическая составляющие подготавливают учащихся к изучению других предметов по направлению «коммуникология – наука... |
Российской Федерации Министерство образования и науки Российской... Теоретическая и практическая составляющие подготавливают учащихся к изучению других предметов по направлению «коммуникология – наука... |
||
Вопрос №1: История как наука (предмет, цель…) История – наука конкретная, требующая точного знания хронологии (дат) явлений, событий, фактов |
Лаак Я. тер Л01 Психодиагностика: проблемы содержания и методов Л01 Психодиагностика: проблемы содержания и методов.— М.: Издательство «Институт практической психологии», Воронеж: нпо «модэк»,... |
Поиск на сайте Главная страница Литература Доклады Рефераты Курсовая работа Лекции |