
Лекция 5. способы представления данных.ppt
- Количество слайдов: 36
Способы представления и анализа информации в прикладном социологическом исследовании
План лекции и логика изложения þ Цель лекции: Познакомиться с основными подходами к получению, хранению и обработки информации в рамках прикладного исследования. þ План лекции: ý Структура и общие принципы разработки инструментария исследования. ü Типы вопросов, области их применения и особенности конструирования. ý Вопрос как измерительный инструмент. Измерительные шкалы. ü Типы измерительных шкал. Особенности различных видов шкал и области их применения. ý Методы обработки социальной информации и программные средства для анализа данных. ü Программные средства анализа данных – MS Excel, SPSS, Statistica, Vortex. ü Основные группы методов и подходы к обработке первичной социальной информации. 2
Программа прикладного исследования Программа прикладного социологического исследования Методологическая часть программы Цель и задачи исследования Процедурная часть программы Обоснование методов сбора информации Объект и предмет исследования Основные понятия исследования Разработанная система гипотез Проект выборки и ее обоснование Выбор методов анализа информации Инструментарий, план, бюджет проекта 3
Функции отдельных частей социологического исследования
Программа социологического исследования – документ, содержащий развернутое изложение ее теоретикометодологических предпосылок с обоснованием актуальности, целей, задач, объекта, предмета и гипотез предпринимаемого исследования, а также его методико-инструментального аппарата вместе с логически обоснованной последовательностью необходимых процедур и организационным планом-графиком и стоимостью всех видов работ. Основные функции программы социологического исследования: þ 1. Методологическая функция. þ 2. Методическая функция. þ 3. Гносеологическая функция. þ 4. Моделирующая функция. þ 5. Программирующая функция. þ 6. Нормативная функция. þ 7. Организационная функция. þ 8. Эвристическая функция. 5 Функции отдельных частей социологического исследования
Методологический раздел программы: þФормулировка актуальности. проблемы, обоснование ее Проблемная ситуация - состояние в развитии социального объекта характеризующееся неустойчивостью, несоответствием его функционирования потребностям дальнейшего развития. Проблема исследования — это различие между существующим, чаще всего нежелательным состоянием объекта или явления и желательным положением дел. 6 Функции отдельных частей социологического исследования
Методологический раздел программы: þОбоснование цели, задач, объекта и предмета исследования. Цель — модель ожидаемого конечного результата (решения проблемы), который может быть достигнут только с помощью проведения исследования. Задачи — конкретные требования, предъявляемые к анализу и решению сформулированной проблемы. Они служат средством реализации цели и носят инструментальный характер. Объект — носитель проблемной ситуации, конкретная область социальной реальности, сфера деятельности субъекта общественной жизни, включенная в процесс научного познания. Предмет исследования включает в себя те стороны и свойства объекта, которые в наиболее полном виде выражают исследуемую проблему и подлежат изучению. 7 Функции отдельных частей социологического исследования
Методологический раздел программы: þ Формулирование и интерпретация основных Обоснование эмпирических индикаторов. понятий. 1. Теоретическая интерпретация понятий имеет своей целью создание теоретической модели – обобщенное выражение проблемной ситуации в научном знании: þ дескриптивная интерпретация þ структурная интерпретация þ факторная интерпретация 2. Эмпирическая интерпретация – подбор общим понятиям частных определений, которые указывают на поступки людей, результаты их деятельности, мнения, знания, оценки, на конкретные события и предметы. 8 Функции отдельных частей социологического исследования
Методологический раздел программы: þФормулировка рабочих гипотез. Гипотеза — научное предположение, выдвигаемое для объяснения изучаемых явлений и процессов, которое надо подтвердить или опровергнуть. 9 Функции отдельных частей социологического исследования
Процедурный (методический) раздел программы: þОбоснование и проектирование совокупности единиц наблюдения. выборочной Выборочная совокупность задается самим объектом исследования Проект выборки — указание принципов выделения из объекта той совокупности людей (либо иных источников информации), которые впоследствии будут охвачены опросом. 10 Функции отдельных частей социологического исследования
Процедурный (методический) раздел программы: þВыбор процедур сбора и анализа эмпирической информации. þСодержательный анализ результатов исследования. þОформление результатов исследования в виде отчетов, публикаций, социальных технологий. 11 Функции отдельных частей социологического исследования
Инструментарий исследования þ Инструментарий - комплект полевых документов который используется для организации исследования. þ В количественных исследованиях (массовый опрос), комплект инструментария, как правило, включает в себя. ý Бланки интервью или анкеты исследования. ý Инструкции интервьюерам и организаторам полевого этапа. ý Карточки с вариантами ответов на вопросы, сложные для восприятия на слух (при использовании метода интервью). ý Квотный план и маршрутное задание. ý Удостоверение интервьюера. ý В качественном исследовании (метод фокус-группы) инструментарий исследования включает. ý Сценарий фокусированного интервью (гайд фокус-группы). ý Стимульный материал для использования на группе. ý Шаблон транскрипта или требования по его подготовке. 12
Типы вопросов инструментария þ «Закрытый вопрос» - вопрос с предлагаемыми вариантами ответов, из которых нужно выбрать один или несколько. þ Как правило, используются в количественных исследованиях (методы анкетирования и формализованного интервью). þ Различаются одноальтернативные (допускающие один ответ) и многоальтернативные закрытые вопросы. þ Тип вопроса влияет на способ хранения информации в массиве. Закрытые одноальтернативные вопросы Закрытый многоальтернативный вопрос 13
Типы вопросов инструментария þ «Открытый вопрос» - предполагает, что ответ формулирует сам респондент. þ Ответы на «открытые» вопросы позволяют прояснить неопределенную ситуацию. Чаще используются в качественных и разведывательных исследованиях. þ Трудоемкость обработки открытых вопросов значительно выше, чем закрытых. Открытый вопрос в качественном исследовании (фрагмент сценария фокус-группы) Открытый вопрос в количественном исследовании 14
Комбинированные вопросы þ Вопросы, в которых объединены признаки одноальтернативных и многоальтернативных, открытых и закрытых вопросов. þ Табличные вопросы с единым списком вариантов ответов. þ «Полузакрытые» вопросы с альтернативой «Другое» (и необходимостью записать, что именно указал респондент). þ Вопросы с сортировкой ответов и т. д. Группа одноальтернативных и многоальтернативных вопросов с единым набором ответов 15
Понятие о шкалах измерения þ Каждый вопрос, включенный в анкету, представляется в виде «переменных» (параметров, атрибутов). ý Как правило, одноальтернативный закрытый вопрос представляется в виде одной переменной. ý Закрытый многоальтернативный вопрос представляется в виде нескольких переменных. þ Каждый признак (каждая переменная) измеряется с помощью той или иной «шкалы» . ý Шкалой в теории измерений называется алгоритм, который позволяет реализовать отображение, ставящее в соответствие каждому эмпирическому объекту один из элементов множества шкальных значений. ý По сути, «измерение» есть «приписывание чисел вещам» , а «шкала» - это правила подобного «приписывания» . ý Тип использованной шкалы определяет возможности обработки полученных данных. 16
Типы шкал измерения þ Шкала наименований – только описывает объект, количественные показатели не используются. ý Объекты делятся на взаимоисключающие группы, что позволяет провести их группировку на отдельные категории. þ Шкала порядка (ранговая шкала) - позволяет провести ранжирование респондентов и их ответов. ý Позволяет упорядочить каждую пару объектов относительно друга на шкале. þ Интервальная шкала позволяет не только ранжировать объекты, но и определить количественные показатели отличий. ý Результаты, представленные в интервальной шкале, позволяют указывать «на сколько» один показатель больше другого. þ Шкала отношений это интервальная шкала с «нулевой точкой» . ý Значения, измеренные в шкале отношений, позволяют указать «во сколько раз» различаются показатели. 17
Характеристика шкал измерения þ Тип шкалы определяет совокупность операций, которые можно выполнять с данными, не нарушая целостности шкалы. «Простые» шкалы. Минимальное количество «разрешенных» методов обработки þ «Пол» - признак, представленный в номинальной шкале. þ «Доля женщин» - признак, представленный в шкале отношений «Хорошие» шкалы. Допускают применение разнообразных статистических методов обработки 18
Примеры шкал измерения þ В каких шкалах представлены приведенные ниже вопросы? Вопрос-фильтр Варианты «нерезультативных» ответов на вопрос Закрытые одноальтернативные вопросы, представленные в номинальной шкале Комбинированный многоальтернативный вопрос, представленный в номинальной шкале 19
Примеры шкал измерения þ В каких шкалах представлены приведенные ниже вопросы? Шкала отношений Порядковая шкала Номинальная шкала Шкала отношений Интервальная шкала 20
Способы хранения информации þ Данные, полученные в ходе прикладных исследований, в электронном виде хранятся в виде «массивов» или реляционных баз данных. þ «Массив» предполагает более простую структуру хранения данных в виде «плоского файла» . ý «Строки» массива (cases, наблюдения) – отдельные респонденты или иные единицы наблюдения. ý «Столбцы» массива – «переменные» (variables, вопросы интервью, зафиксированные в ходе исследования значения атрибутов). ý Для многоальтернативных вопросов отводится несколько столбцов. Многоальтернативные вопросы хранятся либо в виде «кодов» , либо в виде «дихотомий» (нулей и единичек). þ Способы хранения информации практически идентичны в различных системах обработки. 21
Представление данных в массиве Уникальный код (номер анкеты) Пол респондента Одна анкета (респондент) Код интервьюера Одноальтернативные закрытые вопросы (v 3, v 4, v 5) Один вопрос (переменная) Возраст респондента Многоальтернативный закрытый вопрос (v 6), кодирование «категориями» 22
Системы обработки информации þ При обработке результатов прикладных социологических исследований используются как специализированные средства, так и программы общего назначения. þ Наиболее широко и успешно применяются следующие программные системы. ý MS Excel – достаточно удобен для обработки вследствие своей универсальности, гибкости и распространенности. ý SPSS (Statistical Processor for Social Sciences) – является стандартом де-факто при обмене массивами данных. þ Несколько реже применяются программы, имеющие ряд преимуществ по сравнению с MS Excel и SPSS. ý Statistica – чрезвычайно мощный и гибкий инструмент, позволяющий решать те же задачи, что и SPSS. ý Vortex – программа, ориентированная на удовлетворение потребностей конечного пользователя (а не исследователя). 23
Массив данных в MS Excel Формулы для расчета числа автомобилей Вопрос о «происхождении» автомобилей Блок вопросов методики РИПН 24
Сводные таблицы в MS Excel Обработка сводных таблиц формулами, представление результатов в удобной форме Сводные таблицы MS Excel (автоматизированная обработка массива) 25
Достоинства и недостатки MS Excel þ Основные достоинства. ý Высокая гибкость, возможность реализовать практически любой метод (если знать, как это делать). ý Чрезвычайно удобный аппарат сводных таблиц и формул, позволяющий решать 80% задач, встречающихся в практике исследований. ý Простота обмена данными с другими пользователями и программами. þ Основные недостатки. ý Ограничение на число переменных на листе (не более 256 столбцов). Проблема решена в MS Office 2007. ý Имеются определенные (вполне решаемые) сложности с обработкой многоальтернативных вопросов. ý Сложность с реализацией ряда многомерных методов (факторный, кластерный анализ, дискриминантрый анализ и т. д. ) 26
Массив данных в SPSS Просмотр значений переменных Вкладка «Данные» Вкладка «Переменные» þ Файл с данными в SPSS состоит из двух вкладок. þ Вкладка «Данные» обеспечивает доступ к массиву (таблице) данных и используется при вводе и корректировке массива. 27
Массив данных в SPSS Просмотр «меток» переменных Вкладка «Данные» þ В режиме просмотра «меток» (labels) появляется возможность увидеть не коды ответов, а значения (текст вариантов ответов из бланка интервью). 28
Массив данных в SPSS Тип шкалы, используемой при измерении Тип переменной Вкладка «Переменные» Задание меток для вариантов ответа на вопрос þ Вкладка «Переменные» (Variable View) используется для задания структуры массива. þ Структура определяется вопросами интервью или системой признаков, описывающих объекты наблюдения. 29
Сводные таблицы в SPSS Сводная таблица с результатами расчета Структура проведенных расчетов þ Все результаты обработки выводятся в отдельное окно, в котором ведется «протокол работы» (Output). þ Протокол работы может быть сохранен в виде отдельного файла. 30
Достоинства и недостатки SPSS þ Основные достоинства. ý Является стандартом де-факто для большинства социологических организаций. Формат файлов *. sav, как правило, понятен большинству программ обработки данных. ý SPSS – Statistical Processor for Social Sciences (Статистический процессор для социальных наук). «Для социальных наук» = «для чайников» . Выполнение ряда операций «одной кнопкой» . ý Наличие командного языка (синтаксиса), позволяющего программировать обработку. þ Основные недостатки. ý Высокая стоимость лицензии, ограничения по сроку действия лицензии. ý Некоторая «громоздкость» и неинтуитивность интерфейса. ý Некоторые сложности с переносом результатов в MS Office, ограниченные возможности оформления графиков и диаграмм. 31
Массив данных в Statistica þ Массив в Statistica имеет ту же структуру, что и в SPSS / Excel. þ Так же, как и в SPSS, имеется возможность определять свойства переменных и назначать метки. 32
Массив данных в Statistica þ Так же, как и в SPSS, ведется «протокол работы» , который может быть сохранен в отдельном файле. þ В «протоколе» сохраняются все результаты расчетов, а также графики и диаграммы 33
Достоинства и недостатки Statistica þ Основные достоинства. ý Более удобный и понятный интерфейс, чем у SPSS. ý Чрезвычайно высокая гибкость и разнообразие методов обработки данных. Логика работы ориентирована не на «чайника» , а на специалиста. ý Чрезвычайно широкие возможности визуализации и графического отображения данных. ý Простота переноса результатов анализа в документы MS Office. þ Основные недостатки. ý Высокая стоимость лицензии и, вследствие этого, малая распространенность. ý Неполная совместимость по данным между различными версиями программы. ý Постепенное «приближение» (от версии к версии) интерфейса и логики работы к SPSS. 34
Контрольные вопросы þ Какие вопросы (типы вопросов) используются в социологическом инструментарии? В каких случаях применяется каждый из типов вопросов? þ Каким образом различные типы вопросов представляются в массиве данных? þ Что такое «измерительная шкала» ? Почему учет типа измерительной шкалы важен при составлении инструментария исследования? þ Какие признаки измеряются в номинальной шкале? В чем достоинства и недостатки этой шкалы? þ В чем отличие ранговой шкалы от номинальной? Какие признаки могут измеряться в ранговой шкале? þ В чем отличие интервальной шкалы и шкалы отношений от ранговой и номинальной? Какие признаки могут измеряться в интервальной шкале и шкале отношений? þ Какие программные средства применяются при анализе социологических данных? В чем достоинства и недостатки различных средств обработки информации? 35
Литература по теме занятия þ Боровиков В. П. , Боровиков И. П. Statistica ( Статистический анализ и обработка данных в среде Windows. М. : Информ. -издат. дом «Филин» , 1997. þ Бююль Ахим, Цёфель Петр. SPSS: Искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей: Пер. с нем. / Ахим Бююль, Петр Цёфель — Спб. : «Диа. Софт. ЮП» , 2005 — 608 стр. þ Дулина Н. В. , Токарев В. В. Элементы прикладной социологии. Часть I: Учебное пособие / Волг. ГТУ - Волгоград, 1996. – 142 с. þ Дулина, Н. В. Основы прикладной социологии: учеб. пособие / Н. В. Дулина, И. А. Небыков, В. В. Токарев / Волг. ГТУ. – Волгоград, 2006. – 155 с. þ Енюков И. С. Методы, алгоритмы, программы многомерного статистического анализа. - М. : Финансы и статистика, 1986. þ Крыштановский А. О. Анализ социологических данных с помошью пакета SPSS. Москва: Изд. дом ГУ-ВШЭ. 2006. – 281 c. þ Рабочая книга социолога / отв. ред. Г. В. Осипов. – М. : Ком. Книга, 2006. – 480 с. þ Толстова Ю. Н. Измерение в социологии: Курс лекций. — М. : ИНФРА-М, 1998. 224 с. þ Ядов, В. А. Стратегия социологического исследования. Описание, объяснение, понимание социальной реальности / В. А. Ядов – М. : «Добросвет» , Книжный дом «Университет» , 1998. – 596 с. 36
Лекция 5. способы представления данных.ppt