Обработка эмпирических данных первичная обработка данных



Скачать 249.79 Kb.
НазваниеОбработка эмпирических данных первичная обработка данных
Дата15.04.2013
Размер249.79 Kb.
ТипДокументы
источник
1. /учебные и наглядные пособия/Белова О.В. Общая психодиагностика.doc
2. /учебные и наглядные пособия/ВПИ Куликов/глава 1.doc
3. /учебные и наглядные пособия/ВПИ Куликов/глава 2.doc
4. /учебные и наглядные пособия/ВПИ Куликов/глава 3.doc
5. /учебные и наглядные пособия/ВПИ Куликов/глава 4.doc
6. /учебные и наглядные пособия/ВПИ Куликов/глава 5.doc
7. /учебные и наглядные пособия/ВПИ Куликов/глава 6.doc
8. /учебные и наглядные пособия/ВПИ Куликов/оглавление.doc
9. /учебные и наглядные пособия/ВПИ Куликов/предисловие.doc
10. /учебные и наглядные пособия/ВПИ Куликов/приложения.doc
11. /учебные и наглядные пособия/Гуревич К.М., Борисова Е.М. ''Психологическая диагностика''.doc
12. /учебные и наглядные пособия/Дзуки_ Введ в методологию соц_псих исследования/Дзуки Введ в методологию соц_псих исследования.rtf
13. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/ЕЛБ-ДУД.DOC
14. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/Курс психодиагностики.doc
15. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/Обработка теста-психодиагностика.doc
16. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/Общая психодиагностика Белова.doc
17. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/Общее представление о психодиагностке.doc
18. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/Пол Клайн.doc
19. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/Понятие о психометрии.doc
20. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/Применение экспертных оценок при прогн..doc
21. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/Теоретическое обоснование методики.doc
22. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/Учеб. пособие Г.С.Абрамова.doc
23. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/беседа-практическое занятие.doc
24. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/беседа-рекомендации.doc
25. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/биографический метод изучения личности.doc
26. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/гипотеза.doc
27. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/квалификационные требования к психологу.doc
28. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/конструирование тестов (Пол Клайн).doc
29. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/лекция-методика проведения.doc
30. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/методология межсистемных взаимодействий.doc
31. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/методы моделирования.doc
32. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/наблюдение и изучение документов.doc
33. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/наблюдение.doc
34. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/общая характеристика методов.doc
35. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/опрос.doc
36. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/применение методов экспертных оценок в прогнозировании.doc
37. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/псих-экспериментальная-конспект.doc
38. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/психодиагностика НГУ.doc
39. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/психодиагностика-конспект.doc
40. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/психодиагностика-текст.doc
41. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/психологическое исследование Куликов.doc
42. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/психофизиологические методы.doc
43. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/социально-психологическая адаптация.doc
44. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/социально-психологическое изучение документов.doc
45. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/теоретич обоснование методики (Елбаев-Дударев).doc
46. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/тест-психодиагностика.doc
47. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/требования к психологу.doc
48. /учебные и наглядные пособия/Курс лекции и проблемы психодиагностики/этапы и программа ВПИ.doc
49. /учебные и наглядные пособия/Лекции по экспер. психологии/Контрольные вопросы по экспер. психологии.doc
50. /учебные и наглядные пособия/Лекции по экспер. психологии/Лекции по эксперементальной психологии.doc
51. /учебные и наглядные пособия/Лекции по экспер. психологии/Лекция-методика проведения.doc
52. /учебные и наглядные пособия/Лекции по экспер. психологии/Псих-практикум.doc
53. /учебные и наглядные пособия/Проблемы экспериментальной психолгии/Баннистер Репертуар. решетки.doc
54. /учебные и наглядные пособия/Проблемы экспериментальной психолгии/ВПИ Дзуки.doc
55. /учебные и наглядные пособия/Проблемы экспериментальной психолгии/Выборки в ВПИ.doc
56. /учебные и наглядные пособия/Проблемы экспериментальной психолгии/Гипотеза исследования.doc
57. /учебные и наглядные пособия/Проблемы экспериментальной психолгии/Задачи и цели прикладного исследования.doc
58. /учебные и наглядные пособия/Проблемы экспериментальной психолгии/Исследование психол. явлений в ВК.doc
59. /учебные и наглядные пособия/Проблемы экспериментальной психолгии/Качественные методы ВПИ.doc
60. /учебные и наглядные пособия/Проблемы экспериментальной психолгии/Методологические проблемы ВПИ.doc
61. /учебные и наглядные пособия/Проблемы экспериментальной психолгии/ПДМ.doc
62. /учебные и наглядные пособия/Проблемы экспериментальной психолгии/Перспекивы компьютерного тестирования.doc
63. /учебные и наглядные пособия/Проблемы экспериментальной психолгии/Писх. принципы исследования в полку.doc
64. /учебные и наглядные пособия/Проблемы экспериментальной психолгии/Понятие методологии научного исслед..doc
65. /учебные и наглядные пособия/Проблемы экспериментальной психолгии/Разраб. теста достижений.doc
66. /учебные и наглядные пособия/Проблемы экспериментальной психолгии/Типы выборок.doc
67. /учебные и наглядные пособия/Проблемы экспериментальной психолгии/Эксперимент Ноотропил.doc
68. /учебные и наглядные пособия/Проблемы экспериментальной психолгии/Эксперимент по изуч. агрессивности.doc
69. /учебные и наглядные пособия/Проблемы экспериментальной психолгии/Этапы и программа ВПИ.doc
70. /учебные и наглядные пособия/Психодиагностика-Кузнецова.doc
71. /учебные и наглядные пособия/Шапарь Практическая психология инструментарий.doc
72. /учебные и наглядные пособия/конструирование тестов (Пол Клайн).doc
73. /учебные и наглядные пособия/эксперименты и квазиэксперименты Кэмпбелл.doc
Методические указания автор-составитель О. В. Белова Новосибирск: Научно-учебный центр психологии нгу, 1996
I. общая схема и этапы психологического исследования 1 Общая схема исследования
2. разработка концепции и планирование исследования концепция исследования
Сбор эмпирических данных
Обработка эмпирических данных первичная обработка данных
Изложение исследования наглядное представление результатов
Указатель литературы по методам исследования
Протокол эксперимента
Методические рекомендации по проведению «наука» Санкт-Петербург 1994 Предисловие
Приложение 1 Значение критерия t для отбраковки выпадающих
Учебное пособие / Под ред. К. М. Гуревича и Е. М. Борисовой. М.: Изд-во урао, 1997. 304 с
Книга представляет собой курс лекций, прочитанный в Новосибирском государственном университете в рамках программы Tempus-Tacis. Рекомендуется студентам, изучающим психологию
Курс: Основы психодиагностики
Регистрационный бланк фамилия И. О. Подраздедение
Методическое пособие по общей психодиагностике адресовано слуша­телям спецфакультетов психологии, а также начинающим психологам
Файл материалов для изучения
Пол Клайн глава создание надежных тестов II: личностные опросники. Разработка заданий
2файл материалов для изучения 2I. Общее понятие о психометрии и области ее применения
Применение методов экспертных оценок при прогнозировании
Абрамова Г. С. А 16 Практическая психология. Издание третье, стереотипное. — Екатеринбург: "Деловая книга", 1998. 368 с
План-схема проведения практического занятия по теме: беседа (интервью)
Важно умение психолога говорить и задавать вопросы на языке, понятном обследуемому, ориентируясь, на его уровень знаний, на интересы, индивидуальные особенности
Биографический метод изучения личности
Гипотеза исследования
1. 1Наименование военной специальности "психология"
Пол Клайн глава создание надежных тестов II: личностные опросники. Разработка заданий
Методика подготовки и проведения учебной лекции по психологии
1995 г. Ю. Я. Голиков, А. Н. Костин
Метод ы моделрования
Наблюдение и изучение документов как методы сбора психологической информации
Особенности метода
Общая характеристика методов
Методы опроса
Применение методов экспертных оценок при прогнозировании
Практикум по психологии. Психологический эксперимент. (Методические указания). М. Мгу 1985. Практикум по экспериментальной и прикладной психологии. Учебное пособие. Л. Лгу 1990
Методическое пособие по общей психодиагностике адресовано слушателям спецфакультетов психологии, а также начинающим психологам
Психодиагностика как наука и как практическая деятельность
Психодиагностика общее представление о психодиагностике
Методические рекомендации по проведению «наука» Санкт-Петербург 1994 Предисловие
Психофизиологические методы
Социально-психологическая адаптация: содержание, типы, механизмы
Социально-психологическое изучение документов
Название этапов
Регистрационный бланк фамилия И. О. Подраздедение
Требования к специалистам, осуществляющим психологическую и психофизиологическую диагностику 2
Этапы и программа военно-психологического исследования
Учебные-и-наглядные-пособия
Практикум по психологии. Психологический эксперимент. (Методические указания). М. Мгу 1985. Практикум по экспериментальной и прикладной психологии. Учебное пособие. Л. Лгу 1990
Методика подготовки и проведения учебной лекции по психологии
Литература: Анцупов Методы изучения политработником социально-психологических явлений в полку (на корабле)
Предисловие теоретические истоки и назначение репертуарных личностных методик
Книга представляет собой курс лекций, прочитанный в Новосибирском государственном университете в рамках программы Tempus-Tacis. Рекомендуется студентам, изучающим психологию
Выборка в социально-психологическим исследовании свойство выбоpки отpажать хаpактеpистики изучаемой совокуп
Гипотеза исследования
Цели и задачи исследоваhия цель исследования ориентирует его на конечный результат
Программа изучения психологических явлений в воинском коллективе
З качественные методы в решении практических социально-психологических задач
В. Н. Помогайбин методологические проблемы военно-психологических исследований москва = ву предлагаемое учебное пособие
Военный университет разработка психодиагностической методики определение организаторских способностей личности для прфессионально-психологического отбора младшего командирского звена (сержантов).
Состояние и перспективы развития компьютерного тестирования
1 методологические приhципы исследоваhия психологических
Поhятие методологии hаучhого исследоваhия. Андpеева Г. М. Социальная психология. М.: Изд-во
Д инамика развития современной России требует адекватного обновления основополагающей системы ценностей, целей методов и критериев в образовании. Очевидно, что для применения определенных знаний на практике
Типы выборок 1 Простая случайная Из однородной совокупности, все эле
Тема: «Влияние активизации сознания на психические познавательные процессы»
Программа эксперимента
Этапы и программа военно-психологического исследования
Одобрено утверждаю
Методические рекомендации по про­ведению социально-психологических тренингов, а также уникальный материал по психографологии
Пол Клайн глава создание надежных тестов II: личностные опросники. Разработка заданий
Эксперименты и квазиэксперименты




  1. ОБРАБОТКА ЭМПИРИЧЕСКИХ ДАННЫХ



  2. Первичная обработка данных.

4.1.1. Составление таблиц.

В большинстве случаев обработку целесообразно начать с составления таблиц (сводных таблиц) полученных данных. В таблицу можно свести не только числовые данные. К данным качественного характера также могут быть применены простейшие способы количественной обработки. Для всей выборки и отдельных подборок могут быть подсчитаны частоты встречаемости (количество случаев появления события), а затем и частости (относительные частоты, т.е. частоты, деленные на количество испытании) интересующих вас индикаторов, проявлений некоторого вида.

Так, например, при использовании рисуночного теста "Дерево" можно в качестве параметра рассматривать наличие/отсутствие листьев на ветках в рисунке. Если этот параметр будет определен у всех испытуемых, то позволит подсчитать частость его появления по всей выборке н для отдельных групп внутри ее. В таблицу могут быть сведены данные и по другим параметрам теста "Дерево", а затем подсчитаны частости. Далее можно сделать таблицу, в
которой будут представлены данные не по отдельным испытуемым, а для всей вашей выборки и отдельных групп, например, полярных групп. Это позволит сделать шаг к более целостному представлению информации.

Основной формой таблицы является следующая. По строкам занесены значения показателей каждого испытуемого - в одной строке значения показателей одного испытуемого. По столбцам расположены значения каждого заносимого в таблицу признака (измеренною вами параметра) - в одном столбце находятся значения одного признака по всем испытуемым. Все строки и все столбцы должны быть пронумерованы. Последовательность признаков может быть упорядочена по разным основаниям.

В первых столбцах лучше разместить демографические, социо-демографические показатели: пол, возраст, уровень образования (если важен) и т.д. Затем по убывающей значимости (уровню информативности) измеренные параметры. Параметры, полученные с помощью одной методики, удобней располагать компактно - в одной группе. Испытуемые могут быть расположены по алфавитному порядку их фамилий, по лучше использовать этот принцип на самом нижнем уровне деления. Удобнее расположить испытуемых в соответствии с их принадлежностью к какой-либо подгруппе, которая будет взята вами как единная для сравнения (см. § 2.5.) Внутри таких подгрупп или группы в целом можно упорядочивать испытуемых по полу, возрасту или выраженности некоторого наиболее важного для вас параметра.


ФИО ПОЛ УСК КЕТТЕЛ






1

2

3

4

5

6

7

8

9

10

11

12

1

Скоблин

2

34

9

9

8

0

3

4

12

9

17

16

2

Жила С.

4

37

10

9

7

0

3

3

13

10

17

16

3

Джспгреп К.

7

35

7

9

7

0

3

4

14

10

17

9




среднее








































Сигма





































Рис.2. Форма сводной таблицы данных.


Таблицам необходимо давать, названия, достаточно полно отражающие их содержание и специфику. В ходе продолжительной работы они накапливаются и затем опознаются без названия менее быстро и точно.

В исходную сводную таблицу чаще всего заносят сырые данные. Сейчас преимущественной формой математико-статистической обработки стала компьютерная технология. Если форма распределения эмпирических данных незначительно отличается от нормального распределения, то предварительное центрирование, нормирование или перевод в шкальные (стандартизованные) оценки по имеющимся в данной методике таблицам не требуется. Для начала можно предположить, что выбранный вами метод подходит для обработки средствами параметрической статистики. Получив на первом шаге компьютерных вычислений первичные статистические признаки, можно сделать дальнейшие более точные предположения о форме распределения каждого параметра.


4.1.2. Преобразование формы информации

В таблицу целесообразно внести все интересующие вас признаки в форме десятичного числа. Т.е., предварительно пересчитать .минуты в десятичную часть часа, секунды в десятичную часть минуты, количество месяцев в десятичную часть года и т.д. Это необходимо, поскольку формат данных для большинства используемых сейчас компьютерных программ накладывает свои ограничения. В виде чисел в таблицу можно вписать информацию и о тех параметрах выборки, которые предположительно могут оказаться значимыми факторами, но имеются у вас в качественных показателях. Наиболее простыми операциями могут быть: числовое кодирование (мужчины - 2, женщины - 1; прошедшие обучение - 2, непрошедшие - 1 и т.д.) и перевод качественных показателей в ранги. Число 0 для кодирования лучше не использовать, поскольку некоторые статистические компьютерные программы не смогут обработать такие данные. Это не значит, что в таблицу вообще не могут быть записаны нулевые значения. Я имею в виду те случаи, когда в сформированной рабочей подвыборке какой-либо признак имеет только нулевые значения. Уровень образования можно ранжировать таким образом:

Ранг Уровень образования:

1 - закончены менее 5 классов школы;

2 - закончены 5-8 классов или училище с дипломом о неполном среднем образовании;

3 - закончены 9-11 классов или училище с дипломом о полном среднем образовании;

4 - закончены техникум или колледж, или 1 -2 курса вуза;

5 - закончены 3-6 курсов вуза без диплома о высшем образовании;

6 - закончен вуз с дипломом;

7 - закончены аспирантура или адъюнктура, или ординатура, или другие формы пост дипломного образования со сроком обучения 2 года и более.

Для перевода в числа должностного уровня можно принять следующие градации:

Ранг Должностной статус, категория:

1 - подсобные рабочие, технические исполнители;

2 - квалифицированные рабочие;

3 - инженерно-технические работники, специалисты со средним специальным и высшим образованием;

4 - работники нижнего руководящего звена (бригадиры, начальники участков и т.д.), руководители подразделений, имеющие в подчинении исполнителей, специалисты высокой квалификации;

5 - работники среднего руководящего звена (начальники цехов, отделов и т.д.), руководители основных структурных подразделений, имеющих в своем составе подразделения нижнего уровня, ведущие специалисты;

6 - руководители предприятий, учреждений и организаций, их первые заместители, главные специалисты.

Разумеется, включая в обработку полученные таким образом числовые величины, мы не всегда обнаруживаем ясные, выраженные зависимости этих параметров с остальными. Тем не менее, мы получаем возможность хотя бы предварительной оценки взаимосвязей. Эту оценку можно сделать и другими способами. Например, при компьютерной обработке и использовании системы управления базой данных можно формировать подвыборки по разным основаниям деления, в то числе и но уровню образования или должностному статусу, и проверять различия между отдельными категориями выборки. Во многих случаях эта работа носит характер разведочного анализа, у исследователя чет больших шансов выявить отчетливые закономерности, но проделать ее полезно. Включение, например, в корреляционный анализ таких числовых величин может обнаружить существование или отсутствие взаимосвязей с другими параметрами, позволит не тратить время на более сложные процедуры.


4.1.3. Проверка данных

После создания таблицы на бумаге или электронной таблицы на компьютере необходимо проверить качество полученных данных. Для этого часто достаточно внимательно осмотреть массив данных. Начать проверку слезет с выявления ошибок (описок), которые заключаются в том, что неправильно написан порядок числа. Например, 100 написано вместо 10; 9,4 вместо 94 и г.п. При внимательном просмотре по столбцам это легко обнаружить,
поскольку сравнительно редко встречаются параметры, которые сильно варьируют. Чаще всего, значения одного параметра имеют один порядок или ближайшие порядки. При наборе данных на компьютере важно соблюдать требования к формату данных в используемой статистической программе. Прежде всего, это относится к знаку, который должен отделять в десятичном числе целую часть от дробной (точка или запятая).

Затем массы данных надо проверить на наличие «выскакивающих» вариант - выделяющихся значений, которые могли быть получены в результате неточных измерений, ошибок в записях, отвлечения внимания испытуемого и т.д. Если обнаружены «подозрительные» значения, то необходимо принять обоснованное решение о их выбраковке. Его можно принять, используя достаточно мощный параметрический критерий t. Он рассчитывается по следующей формуле:

V-M
t = ----------- ³tst

s

где:

t - критерий выпада;

V - выпадающее значение признака;

М - средняя величина признака для всей группы, включающей артефакт;

tst - стандартные значения критерия выпадов, определяемые для трех уровней доверительной вероятности по таблице Приложения 1. Смысл критерия в том, чтобы определить, находится ли данная варианта в интервале, характерном для большинства членов выборки, или же вне его.

Допустим, нами принят уровень значимости 0.05 (доверительная вероятность 0.95), а значение критерия составило 1.5. Поскольку 95% вариант лежат в пределах М±1.96s (1.5 меньше 1.96), следовательно данная варианта лежит в указанном интервале. Если же значение критерия больше, например, 2.4, то это означает, что данное значение не относится к анализируемой совокупности (выборке), включающей 95% вариант, а есть проявление иных закономерностей, ошибок и пр. и должно быть поэтому исключено из рассмотрения.

Например, в эксперименте вы предлагаете решать мыслительные задачи и регистрируете в числе других параметров время решения. При просмотре данных обнаруживаете, что у одного из испытуемых время решения заметно больше, чем у остальных. Это бывает связано с тем, что вместо решения очередной задачи, испытуемый начинает «искать закономерность более широкого плана», «выводить общий принцип» или нечто подобное. Об этом он может сообщить экспериментатору, но может и не сообщать. Понятно, что время решения конкретной задачи при этом может сильно отличаться от средней величины. В этом случае вы окажетесь перед необходимостью принять обоснованное решение - включать данное значение в дальнейшую обработку или нет.

Предположим, в вашем эксперименте были получены следующие значения некоторого параметра: 10, 20, 20, 30, 30, 40, 40, 50, 210. Следовательно n=9. Вычислили: M=50; s=61. Можно ли считать значение 210 выпадающим?

210-50

t = ------------------- = 2,6 ;

61

tst (по табл.) = 2,4 (для P=0,95)


Следовательно, значение 210 может считаться выпадающим и должно быть исключено из дальнейшей обработки.

После исключения выпадающих значений первичные статистические параметры вычисляются заново.



  1. Математико-статитстическая обработка.



  2. Анализ первичных статистик.

Для определения способов математико-статистической обработки, прежде всего, необходимо оценить характер распределения по всем используемым параметрам. Для параметров имеющих нормальное распределение или близкое к нормальному, можно использовать методы параметрической статистики которые во многих случаях являются более молодыми, чем методы непараметрической статистики. Достоинством последних является то, что они позволяют проверять статистические гипотезы независимо от формы распределения. Одним из важнейших в математической статистике является понятие нормального распределения. Нормальное распределение - модель варьирования некоторой случайной величины, значения которой определяются множеством одновременно действующих независимых факторов. Число таких факторов велико, а эффект влияния каждого из них в отдельности очень мал. Такой характер взаимовлияний весьма характерен для психических явлений, поэтому исследователь в области психологии чаще всего выявляет нормальное распределение. Однако, так бывает не всегда, поэтому в каждом случае форма распределения должна быть проверена.

Важнейшими первичными статистиками являются:

а) средняя арифметическая - величина, сумма отрицательных и положительных отклонений от которой
равна нулю. В статистике ее обозначают буквой М или x ;

б) cpеднее квадратичное отклонение (обозначаемое греческой буквой s (сигма) и называемое также основным, или стандартным, отклонением) - мера разнообразия входящих в группу объектов, она показывает, на сколько в среднем отклоняется каждая варианта (конкретное значение оцениваемого параметра) от средней арифметической. Чем сильнее разбросаны варианты относительно средины, тем большим оказывается среднее квадратичное отклонение.

в) коэффициент вариант - частное от деления сигмы на среднюю, умноженное на 100%. Обозначается CV:

CV= s/ М * 100%


Cигма - величина именованная и зависит не только от степени варьирования, но и от единиц измерения. Поэтому по сигме можно сравнивать изменчивость лишь одних и тех же показателей, а сопоставлять сигмы разных признаков по абсолютной величине нельзя. Для того, чтобы сравнить по уровню изменчивости признаки любой размерности (выраженные в различных, единицах измерения) и избежать влияния масштаба измерении средней арифметической на величину сигмы применяют коэффициент вариации, который представляет собой по существу приведение к одинаковому масштабу величины s.

Для нормального распределения известны точные количественные зависимости частот и значений, позволяющие прогнозировать появление новых вариант:

  1. Слева и справа от средней арифметической лежит 50% вариант.

  2. В интервале от М-16 до М+16 лежат 68.7% всех вариант.

3) В интервале от М-1.966 до М+1.966 лежат 95% вариант.

Таким образом, ориентируясь на эти характеристики нормального распределения можно оценить степень близости к нему рассматриваемого распределения.


Следующими по важности являются такие первичные статистики как коэффициент асимметрии и эксцесс.

Коэффициент асимметрии - показатель скошенности распределения в левую или правьте сторону по оси абсцисс. Если правая ветвь кривей длиннее левой - говорят о положительной асимметрии, в противоположном случае - об отрицательной.

Эксцесс - показатель островершинности. Кривые, более высокие в своей средней части, островершинные, называются эксцессивными, у них большая величина эксцесса. При уменьшении величины эксцесса кривая становится все более плоской, приобретая вид плато, а затем и седловины - с прогибом в средней части.

Эти параметры позволяют составить первое приближенное представление о характере распределения:

1) у нормального распределения редко можно обнаружить коэффициент асимметрии близкий к единице и более единицы (и -1, и +1);

2) эксцесс у признаков с нормальным распределением обычно имеет величину в диапазоне 2 - 4.

Подчеркну, что это только приблизительная оценка. Точную и строгую оценку нормальности распределения можно получить используя один из существующих методов проверки. (См., например, книгу Г.В.Суходольского "Основы математической статистики для психологов", Л., 1972. Главы 2 и 5.)

Начать с анализа первичных статистик надо еще я по той причине, что они весьма чувствительны к наличию выпадающих вариант. На практике же, очень большие эксцесс и асимметрия часто являются индикатором ошибок при подсчетах вручную или ошибок при введении данных через клавиатуру при компьютерной обработке. Существует правило, согласно которому все расчеты вручную должны выполняться дважды (особенно ответственные - трижды),
причем желательно разными способами, с вариацией последовательности обращения к числовому массиву.

По части никогда не удается полностью охарактеризовать целое, всегда остается вероятность того, что оценка генеральной совокупности на основе выборочных данных недостаточно точна, имеет некоторую большую или меньшую ошибку. Такие ошибки, представляющие собой ошибки обобщения, экстраполяции, связанные с перенесением результатов, полученных при изучении выборки, на всю генеральную совокупность, называются
ошибками репрезентативности. Репрезентативность - степень соответствия выборочных показателей генеральным параметрам.

Статистические ошибки репрезентативности показывают в каких пределах могут отклоняться от параметров генеральной совокупности (от математического ожидания или истинных значений) наши частные определения, полученные на основании конкретных выборок. Очевидно, что величина ошибки тем больше, чем больше варьирование признака и чем меньше выборка. Это и отражено в формулах для вычисления статистических ошибок, характеризующих варьирование выборочных показателей вокруг их генеральных параметров.

В число первичных статистик входит статистическая ошибка средней арифметической. Формула для её вычисления такова:

s

mm = ± -------

n-2

где:

mm - ошибка средней,

s - сигма,

n - число значений признака.


4.2.2. Оценка достоверности отличий.

Одной из наиболее часто встречающихся задач при обработке данных является оценка достоверности отличий между двумя или более рядами значений. В математической статистике существует ряд способов для этого. Для использования большинства мощных критериев требуются дополнительные вычисления, обычно весьма развернутые.

Обсуждая обработку данных, я ориентируюсь на компьютерный ее вариант, который стал в настоящее время наиболее распространенным. Во многих прикладных статистических программах есть процедуры оценки различий между параметрами одной выборки или разных выборок. При полностью компьютеризованной обработке материала нетрудно в нужный момент использовать соответствующую процедуру и оценить интересующие различия. Однако, большинство психологов не имеют свободного и неограниченного доступа для работы с компьютером - либо недостаточен парк ЭВМ, либо психолог как пользователь ЭВМ неподготовлен и может проводить обработку только с помощью квалифицированного персонала. И в том, и в другом случае типичный сеанс работы с компьютером заканчивается тем, что психолог получает принтерные распечатки, содержащие подсчитанные первичные статистики, результаты корреляционного анализа, иногда и факторного (компонентного).

Основной анализ осуществляется позже, не в диалоге с ЭВМ. Исходя из этих рассуждений, будем считать, что перед психологом часто встает задача оценки достоверности различий, используя ранее вычисленные статистики. При сравнении средних значений признака говорят о достоверности (недостоверности) отличий средних арифметических, а при сравнении изменчивости показателей - о достоверности (недостоверности) отклонений сигм
(дисперсий) и коэффициентов вариации.

Достоверность различий средних арифметических можно оценить по достаточно эффективному параметрическому критерию Стьюдента. Он вычисляется по формуле:

M1 - M2

td = ----------------

(m12 +m22)-2

где:

M1 и M2 - значения сравниваемых средних арифметических,

m1 и m2 - соответствующие величины статистических ошибок средних арифметических.


Значения критерия Стьюдента t для трех уровней значимости (p) приведены в Приложении 2. Число степеней свободы определяется по формуле:


d = n1+ n2 - 2,

где:

n1 и n2 - объемы сравниваемых выборок.

С уменьшением объемов выборок (n < 10) критерий Стьюдента становится чувствительным к форме распределения исследуемого признака в генеральной совокупности. Поэтому в сомнительных случаях рекомендуется использовать непараметрические методы или сравнивать полученные значения с критическими (приведенными в таблице) для более высокого уровня значимости.

Решение о достоверности различий принимается в том случае, если вычисленная величина td превышает табличное значение для данного числа степеней свободы. В тексте публикации или научною отчета указывают наиболее высокий уровень значимости из трех: 0.05, 0.01 или 0.001.

Если превышены 0.05 и 0.01, то пишут, (обычно в скобках) Р = 0.01 или p < 0.01. Это означает, что оцениваемые различия все же случайны только с вероятностью не более 1 из 100 шансов. Если превышены табличные значения для всех трех уровней: 0.05, 0.01 и 0.001, то указывают Р = 0.001 или p < 0.001, что означает случайность выявленных различий между средними не более 1 из 1000 шансов.

Пример.

М1= 113.3, m1= 2.4, n1= 13 ; M2= 103.3, m2 = 2.6, n2= 16.


113.3-103.3

td = -------------------- = 2,83

(2,42 + 2,62)-2


для d = 13 + 16 - 2 = 27 вычисленная величина превышает табличную для вероятности Р = 0.01. Следовательно, различия между средними достоверны на уровне 0.01.

Приведенная формула проста, используя ее, можно с помощью простейшего бытового калькулятора с памятью вычислить t критерий без промежуточных записей.

Следует помнить, что при любом численном значении критерия достоверности различия между средними этот показатель оценивает не степень выявленного различия (она оценивается по самой разности между средними), а лишь статистическую достоверность его, т.е. право распространять полученный на основе сопоставления выборок вывод о наличии разницы на все явление (весь процесс) в центом. Низкий вычисленный критерия различия не может служить доказательством отсутствия различия между двумя признаками (явлениями), ибо его значимость (степень вероятности) зависит не только от величины средних, но и от численности сравниваемых выборок. Он говорит не об отсутствии различия, а о том, что при данной величине выборок оно статистически недостоверно: слишком велик шанс, что разница при данных условиях определения случайна, слишком мала вероятность ее достоверности.

Степень выявленного различия желательно оценивать, опираясь на содержательные критерии. Вместе с тем, для психологического исследования весьма характерно наличие множества показателей, которые, по существу, являются условными баллами, и валидность оценивания с помощью них еще предстоит доказать. Чтобы избежать большей произвольности, в таких случаях также приходится опираться на статистические параметры.

Пожалуй, наиболее распространено для этого использование сигмы. Разницу между двумя значениями в одну сигму и более можно считать достаточно выраженной. Если сигма подсчитана для ряда значений более 35, то достаточно выраженной можно рассматривать и разницу в 0,5 сигмы. Однако, для ответственных выводов о том, насколько велика разница между значениями, лучше использовать строгие критерии.


4.2.3. Корреляционный анализ.

Для эффективного использования вычисленных коэффициентов корреляции необходимо представить имеющуюся числовую информацию в подходящем виде. Прежде всего, надо выделить коэффициенты корреляции величина которых превышает критические значения. В психологии чаще всего рассматривают два уровня достоверности 0.05 и 0.01. Критические значения коэффициента корреляции Пирсона приведены в Приложении 3. Целесообразно выделить среди прочих коэффициенты корреляции, превышающие эти уровни достоверности. Можно подчеркнуть коэффициенты с достоверностью 0.05 одной чертой или отметить одной звездочкой, а с достоверностью 0.01 - двумя. Удобно использовать и цветовое кодирование. Если после этого выделить обусловленность или значимых коэффициентов корреляции (превышающих уровень 0.05 или 0.01) довольно много, то для достоверного анализа более удобна полная матрица интеркорреляции. Поэтому, если в принтерной распечатке содержится только половина матрицы, отделенная от другой половины главной диагональю, то ее надо восстановить до полного вида.

Матрица интеркорреляций оцифрована только номерами признаков и содержит только коэффициенты корреляции каждого признака с каждым. Испытуемые и их порядковые номера в таблице исходных данных в ней не представлены.

Поскольку матрица интеркорреляцпй симметрична относительно своей главной диагонали (проходящей из левого верхнего угла в правый нижний), то ее при восстановлении надо «опрокинуть», повернуть относительно этой оси симметрии. Обычно в распечатке каждая строчка начинается с номера признака, затем наткана 1.0 - это коэффициент корреляции данного признака с самим собой. Затем напечатан коэффициент корреляции данного признака со следующим по порядковому номеру и далее коэффициенты корреляции с остальными признаками.

Пример.

Получена распечатка:

1* 1.0 .58 .30 .41 .60 .40

2* 1.0 .43 .57 .65 .51

3* 1.0 .39 .38 .41

4* 1.0 .60 .38

5* 1.0 .35

6* 1.0

(Нули перед десятичной точкой опущены).


Заполним половину матрицы, используя полученные данные.


Признаки 1 2 3 4 5 6

1 1 .58 .30 .41 .60 .40

2 1 .43 .57 .65 .51

3 1 .39 .38 .41

4 1 .60 .38

5 1 .35

6 1


Поскольку второй признак коррелирует с первым также как первый со вторым, а третий - с первым также как первый с третьим и т.д., то мы можем первую строку матрицы записать как первый ее столбец. Затем вторую строку - как второй столбец. В результате получим полную матрицу.


Признаки 1 2 3 4 5 6

1 1 .58 .30 .41 .60 .40

2 .58 1 .43 .57 .65 .51

3 .30 .43 1 .39 .38 .41

4 .41 .57 .39 1 .60 .38

5 .60 .65 .38 .60 1 .35

6 .40 .51 .41 .38 .35 1

Если матрица большая, то даже выделение значимых коэффициентов не создает достаточной наглядности. Тогда к нижней части матрицы можно добавить еще несколько строк и записать в соответствующих клетках число значимых коэффициентов в данном столбце: значимых на уровне 0.05, значимых на уровне 0.01, суммарное число значимых коэффициентов. Это лучше позволит увидеть иерархию признаков по числу значимых корреляционных связей.


4.2.4. Факторный анализ.

Данные факторного анализа, как и корреляционного помогают обнаружить взаимосвязи между переменными, но не могут дать достаточных оснований для выводов о причинно-следственных зависимостях, об иерархии причинных связей. Выделение факторов более высокого порядка и другие усложнения и модификации сути метода не меняют. Неслучайно в различных факторных структурах личностных свойств устойчиво присутствуют именно стержневые психические качества, например, такие как тревожность, активность (энергия), нейротизм.

Какой-бы понятийный аппарат психолог не использовал, в нем непременно заложен принцип причинности, он пронизывает любую концепцию. В этом существенное расхождение понятийного и факторного описания психических явлений. Никакая формализованная процедура не может заменить ум исследователя, его концептуальные представления и логику. В факторном анализе предполагается, что наблюдаемые переменные являются линейной комбинацией некоторых латентных (гипотетических или ненаблюдаемых) факторов. Фактурная модель основывается на том, что все наблюдаемые переменные являются функциями скрытых факторов. Т.е. не предполагается включение в состав переменных таких, которые являются причинными для других. Но не обязательно, чтобы все переменные были на одном уровне причинности. При достаточном опыте и наличии дополнительной информации о структуре исследуемого явления результаты факторною анализа можно достаточно корректно интерпретировать. Факторный анализ является сложной процедурой. Как правило хорошее факторное решение (достаточно простое и содержательно интерпретируемое) удается получить по меньшей мере после нескольких циклов его проведения - от отбора признаков до попытки интерпретации после вращения факторов. Для того, чтобы прийти к нему, надо соблюдать немало требований, назовем основные.

1) Переменные должны быть измерены по крайней мере на уровне шкалы интервалов (по классификации Стивенса). Многие переменные, такие, как меры отношений и мнений в совокупности, различные переменные при обработке результатов тестирования, не имеют точно определенной метрической основы. Тем не менее предполагается, что порядковым переменным можно давать числовые значения, не нарушая их внутренних свойств.

2) Не следует включать дихотомические переменные. Но если цель исследования состоит в нахождении кластерной структуры, использование факторного анализа к данным, содержащим дихотомические переменные, оправдано.

3) Отбирая переменные для факторного анализа следует учесть, что на один фактор должно приходиться по крайней мере три переменные.

4) Для обоснованного окончательного решения необходимо, чтобы число испытуемых было в три или более раз больше, чем число переменных, в пространстве которых определяется окончательное факторное решение. Поскольку количество испытуемых увеличить труднее по ходу обработки, значит следует отобрать столько переменных, чтобы их число не превышало одной трети от числа испытуемых. Для разведочного компонентного или факторного анализа это требование соблюдать не обязательно, но надо исходить из того, что чем сильнее оно нарушено, тем менее точны результаты.

5) Не имеет смысла включать в факторный анализ переменные, которые имеют очень слабые связи с остальными переменными. С большой вероятностью они будут иметь малую общность и не войдут ни в один фактор. Если перед вами не стоит задача сформировать шкалу вопросника на основе факторного анализа или какая-либо аналогичная, то не следует также включать все переменные, имеющие друг с другом очень тесные связи. Скорее всего они образуют один фактор. Чем больше таких переменных вы включаете в факторный анализ, тем больше вероятность того, что они образуют первый фактор или один из первых.

6) Важнейшим моментом поиска хорошего факторного решения является определение числа факторов перед их вращением. В окончательном решении лучше всего основываться на содержательных предположениях о структуре изучаемого явления. На пути к нему можно использовать критерий Кеттела. Легче принять решение, если будет построен полигон, в котором отображены доли суммарной дисперсии факторов в порядке их убывания.
Обычно на графическом изображении видно, что доля дисперсии у первых факторов при переходе от предыдущего к последующему быстро снижается, но затем линия имеет перелом и у остальных факторов доли суммарной дисперсии отличаются мало. Согласно данному критерию следует остановится на том факторе, как на последнем, за которым линия становится более пологой.

При отборе переменных и сокращении их количества для следующего цикла факторного анализа быстрее можно отобрать переменные, если селектироватъ их по факторным общностям, а не просматривая их нагрузки по всем факторам.

При интерпретации факторов можно начать работу с того, что выделить наибольшие факторные нагрузки в данном факторе. Для выделения можно использовать приемы аналогичные выделению значимых коэффициентов корреляции (см.§ 4.2.3.). Если вы затрудняетесь подобрать название фактору - для этой процедуры нет

формализованных приемов, то используйте, как предварительный вариант, имя переменной, которая вошла в фактор с наибольшей нагрузкой.


4.3. Использование прикладных статистических программ.

Использование статистических программ в компьютерной обработке на несколько порядков ускоряет обработку материала и предоставляет в распоряжение исследователя такие методы анализа, которые в ручной обработке не могут быть реализованы. Однако, в полной мере эти преимущества могут использованы, если психолог имеет необходимый уровень подготовки в этой области. Обычно, чем мощнее компьютерная программа (чем более широкие у нее возможности), тем больше времени она требует дня освоения. Таким образом, затрачивать время на ее изучение при редких обращениях к мощному статистическому аппарату не совсем эффективно. Добавлю, что очень часто использование таких программ для решения несложных задач также требует определенной суммы умений. Для того, чтобы избежать лишних сложностей и временных затрат, целесообразно, во-первых, стремиться выбрать программу с возможно более дружественным интерфейсом. Т.е., выбрать программы в которых есть достаточно развитая функция подсказок, в том числе для неподготовленного пользователя, предусмотрен режим меню - при нем пользователь на каждом шаге делает выбор для дальнейшей работы из предложенных альтернатив и избавлен от необходимости самостоятельно формулировать задачу для работы компьютера, соблюдая весь набор требований, который во многих случаях некороток. Во-вторых, следует пытаться найти программы наиболее приспособленные к обработке психологических данных. Хотя специализированные программы часто уступают по мощности программам универсального назначения, по ряду процедур и функций они не менее эффективны. Работа с ними идет быстрее, особенно у неподготовленных пользователей.

В вычислительном центре факультета психологии Санкт-Петербургского университета с 1988 года успешно используется Диалоговая Система Многомерного Анализа экспериментальных данных (ДИСМА). Эта программа разработана творческой группой - психологом, кандидатом психологических наук А.Д. Наследовым, программистом Н.А. Ивановым, математиком А.Т. Дидейкниым. Программа создана для математическою обеспечения научных исследований и практической работы в психологии, педагогике, социологии. Программа может использоваться на машинах различного класса. Она имеет достаточно развитый режим работы с меню, за прошедшие годы прошла разнообразную апробацию и показала себя в качестве весьма эффективного инструмента психологического исследования. В Приложении 4 содержится перечень процедур н функций, которые она реализует. Знакомство с этим перечнем позволяет составить представление о типичном наборе возможностей современных статистических программ, используемых в гуманитарных науках и может быть полезно при подготовке к сеансу работы с компьютером.

Добавить документ в свой блог или на сайт


Похожие:



Если Вам понравился наш сайт, Вы можеть разместить кнопку на своём сайте или блоге:
refdt.ru


©refdt.ru 2000-2013
условием копирования является указание активной ссылки
обратиться к администрации
refdt.ru