Подготовка
данных для обработки включает: шифровку, кодирование и
перенос кода на перфокарты ручной или машинной обработки или на магнитную ленту
— в зависимости от техники обработки. Шифром обычно называют условную
символическую запись первичной информации в бланке протокола (в анкете,
шифровальном листе
при анализе документов). Шифровку можно производить в разных символах:
численных обозначениях (например, пунктов шкалы), в буквенных аббревациях
("КЗ" — критические замечания, "ВП" — вопросы и просьбы —
при кодировании текстов писем), в различных символах ("+",
"—", "?": "согласие", "несогласие",
"неясно"). Кодом называют числовую запись тех же данных. Рассмотрим пример шифровки и кодирования ответов на
серию из 10 суждений об отношении к детям (с. 170, схема 11), используя для шифровки числовые обозначения. При шифровке напротив каждого суждения на полях анкетного листа отмечаем числовое значение соответствующего пункта шкалы. Для суждений 1, 3 и 10 это будут 4, 1 и 5
соответственно. Если суждения предлагаются
отдельными карточками, то в шифровальном листе (бланк протокола) в клеточке с номером этого суждения появятся те же
числа. При
вводе данных в компьютер для
обработки обычно используют десятиричный код. Каждый признак (в
нашем случае таких 10, где одно суждение
принимаем з\а отдельный признак) обозначают двух-трехразрядным
числом в зависимости от общей
численности признаков, нумеруя их по
очередности появления в полевых
документах (анкетах, протоколах). Если в нашем исследовании, где используется серия суждений о детях, менее 1000 признаков, используем трехразрядный код, и тогда названные
суждения могут кодироваться: 101/4,
103/1, 110/5. Это значит, что
при сплошной нумерации признаков, вводимых
в анализ, первое суждение в схеме II получает код 101,
а последнее — 110. Число за косой чертой — регистрация ответа по данному
признаку в пятичленной шкале, В некоторых схемах кодирования это число прямо
примыкает к общему коду (1014, 1031, 1105), а в других случаях фиксируется с
интервалом: 101—4, 103—1, 110—5. В таком
закодированном виде соответствующие данные будут выпечатываться в табуляграммах
или появляться на экране дисплея. Современные способы общения человека с компьютером
позволяют фиксировать на экране и в табуляграммах не только код признака, но и
его сокращенное, а при необходимости и полное наименование. Например,
"101. Дети способствуют сближению родителей" или "101. Сбл. с
род." и далее выпечатывается статистика распределений по шкале от 1 до 5
или производится построение суммарного индекса по итогам ответов каждого
респондента на данный тест. Индекс, будучи производным от первичных данных,
получит новый, собственный код, допустим, 632. Проанализировав распределение
данных на всю выборку, мы можем преобразовать его в упорядоченную номинальную
шкалу, как показано в табл. 17. Видно, что распределение скошено в сторону
позитивных значений, где фактический максимум индекса отношения к детям = 38
(3% выборочной совокупности), а фактический минимум = 23 (также 3%) вместо
теоретического максимума = 50 и минимума = 10. Медиана приходится на значение
33 (она делит упорядоченный ряд пополам). Расчленим всю совокупность так, чтобы
выделить достаточно наполненные крайние градации, причем в негативной зоне
разумно иметь больше градаций, так как она более чувствительна (вспомним, что
люди тоньше реагируют на негативные стимулы). Срединная зона, значения
индексов в которой близки к медиане, обычно более наполненна и единообразна. Предыдущая Следующая Маркетинговые исследования. Академические институты Социологические факультеты Исследовательские организации Статистический анализ данных Социологическое исследование Социологические журналы Интересная информация Социологи в сети Социологические общества Статьи и публикации Cоциологическая теория: тексты Помощь в обучении Ссылки на ресурсы по социологии Поиск в системах Рефераты по социологии Состояние постмодерна Неоинституционализм в экономике Главная |