2-ОСНОВЫ МЕДИЦИНСКОЙ СТАТИСТИКИ.ppt
- Количество слайдов: 159
ОСНОВЫ МЕДИЦИНСКОЙ СТАТИСТИКИ
n n Статистика — общественная наука, изучающая количественную сторону массовых общественных явлений в неразрывной связи с их качественными особенностями. Статистика устанавливает соответствие между идеальным миром и представлением о реальном мире.
n n n Математическая статистика – раздел математики, посвященный методам систематизации, обработки и исследования статистических данных для научных и практических выводов. Прикладная статистика – научная дисциплина, разрабатывающая и систематизирующая понятия, приемы, математические методы и модели, предназначенные для организации, сбора, стандартной записи, систематизации и обработки (в том числе с помощью ЭВМ) статистических данных с целью их удобного представления, интеграции и получения научных и практических выводов. Социально-демографическая статистика – изучает население, а также социальные (неэкономические) явления и процессы, которые характеризуют условия жизнедеятельности людей, их взаимоотношения в процессе труда и в непроизводственной деятельности.
n n n Статистика, изучающая вопросы, связанные с медициной и здравоохранением, называется медицинской. В ней различают следующие разделы: Статистика здоровья населения Статистика системы здравоохранения Статистика медико-социальных исследований (медико-биологических исследований)
n n Статистическая совокупность — группа относительно однородных элементов (единиц наблюдения) в конкретных условиях времени и пространства. В зависимости от охвата единиц наблюдения (в связи с целью исследования) статистическая совокупность может быть генеральной и выборочной.
n n n Единица наблюдения — это первичный элемент статистической совокупности, имеющий признаки сходства и различия. Признаки различия подлежат изучению и поэтому называются учетными признаками. Учетные признаки по характеру бывают количественными и качественными (атрибутивными), по роли в совокупности — факторными, результативными.
n Признаки, или переменные (variables), могут принимать различные конкретные значения (values).
Различают следующие виды признаков: n n Качественный (атрибутивный) – признак, отдельные значения которого выражаются в виде понятий, наименований. Количественный – признак, определенные значения которого имеют количественные выражения.
n n Отдельные значения признака называются вариантами этого признака. Вариация – это многообразие, изменяемость величины признака у отдельных единиц совокупности наблюдения.
Количественные масса тела, рост, возраст, лабораторные данные и т. п. Виды признаков, или переменных Порядковые: - Расплывчатые (результаты лечения хорошие, удовлетворительные, неудовлетворительные и т. п. ) - Порядковые ранговые (порядковый номер родов и т. п. ) Дискретные (целочисленные значения), количество – 1, 2, 3 и т. д. Качественные (атрибутивные) – желтушность, парез, боль и т. п. Номинальные (классификационные) пол, должность, профессия, место жительства и т. п. Непрерывные (принимают вещественное значение) – вес, стоимость продукции
n n Качественные или номинальные (categorical/nominal) – не поддающиеся непосредственному измерению, например, характеристики пациента: диагноз, пол, профессия, семейное положение. Качественные данные, которые могут быть отнесены только к двум противоположным категориям да – нет, принимающие одно из двух значений (выжил – умер; курит – не курит)) называются дихотомическими.
n n Порядковые или ранжируемые (ordinal) – эти признаки можно расположить в естественном порядке (ранжировать), но при этом отсутствует количественная мера расстояния между величинами. Примером являются оценка тяжести состояния пациента, стадия болезни, самооценка состояния здоровья. При этом допускается, что тяжелое течение заболевания «хуже» , чем среднетяжелое, а очень тяжелое – «еще хуже» , однако нельзя сказать во сколько или на сколько хуже. Можно сказать, что порядковые данные занимают промежуточное положение между количественными и качественными типами. Их можно упорядочить как количественные данные, но над ними нельзя производить арифметические действия, как над качественными данными.
n Количественные или интервальные (interval) – признаки, количественная мера которых четко определена; наиболее удобный для статистического анализа тип.
Количественные признаки могут быть: n n непрерывными (continuous), принимающими любое значение на непрерывной шкале, например масса тела, температура, биохимические показатели крови; дискретными (discrete), принимающие лишь определенные значения из диапозона измерения, обычно целые, например, число рецидивов, число детей в семье, число заболеваний у одного больного, число выкуриваемых сигарет.
Организация социологического исследования n n n Цель определяет предметную область исследования, от которой зависит вся дальнейшая логика его проведения. Для раскрытия поставленной цели необходимо определить задачи исследования 3 -6). Следующей составляющей подготовительного этапа является формулировка гипотез, которые определяют направление исследования
n n n В процессе организационного этапа исследования устанавливается объект исследования и единица наблюдения. Под объектом наблюдения понимают статистическую совокупность, состоящую из отдельных предметов или явлений - единиц наблюдений, взятых в определённых границах времени и пространства. Единица наблюдения - первичный элемент статистической совокупности, являющейся носителем признаков, подлежащих регистрации, изучению в ходе исследования.
n n n Признак – это характерное свойство изучаемого явления, отличающегося от других явлений. В зависимости от отношения между признаками различают факторный (причина) и результативный (следствие) признаки. Статистический показатель – это количественная оценка свойства изучаемого явления.
n Основное требование, предъявляемое к формированию выборки – случайность отбора единиц наблюдения из генеральной совокупности, при котором каждой единице наблюдения обеспечивается равная вероятность попадания в выборку (рандомизированный отбор).
Виды выборок
В зависимости от способа отбора единиц наблюдения (от способа организации совокупности): n n случайная: отбор единиц наблюдения производится непосредственно из генеральной совокупности. Случайность отбора достигается путем применения жеребьевки или использования таблицы случайных чисел. Различают бесповторную выборку и повторную (после регистрации единицы вновь возвращаются в генеральную совокупность) механическая: генеральная совокупность разбивается на равные части, из которых затем в заранее обусловленном порядке отбирают единицы наблюдения под определенным номером (например, каждую пятую), так, чтобы обеспечить необходимое число наблюдений.
n n типологическая (типическая): генеральная совокупность разбивается на качественно однородные по изучаемому признаку группы, а затем из этих групп производят случайный отбор необходимого числа единиц наблюдения; объем выборки в каждой типической группе устанавливается пропорционально ее удельному весу в генеральной совокупности (пропорциональный отбор), а иногда и с учетом вариации в ней изучаемого признака (оптимальный отбор) Пример: Ø Мужчин должно быть 40%, женщин – 60%. Ø Лиц трудоспособного возраста (женщины от 18 до 55 лет, мужчины от 18 до 60 лет) должно быть не менее 45%.
n n серийная (гнездовая): отбору подлежат не отдельные единицы наблюдения, а целые их группы (серии или гнезда), в составе которых единицы наблюдения связаны определенным образом: территориально (районы, селения и др. ) или организационно (студенческие группы, больницы, предприятия и др. ) и которые отбираются из генеральной совокупности по принципу случайного или механического отбора. Внутри серии производится сплошной отбор единиц наблюдения. комбинированная
По этапам отбора: n n одноступенчатая многоступенчатая
В зависимости от числа программ отбора: n n однопрограммная (однорядная) многопрограммная (многорядная)
Статистическое наблюдение n n Статистическое наблюдение — это начальная стадия экономико-статистического наблюдения. Она представляет собой научно организационную работу по собиранию массовых первичных данных о явлениях и процессах общественной жизни. Любое статистическое наблюдение осуществляется с помощью оценки и регистрации признаков единиц совокупности в соответствующих учетных документах. Таким образом, полученные данные представляют собой факты, которые так или иначе характеризуют явления общественной жизни.
Статистическое наблюдение должно отвечать следующим требованиям: 1. 2. 3. 4. Наблюдаемые явления должны иметь научную и практическую ценность, выражать определенные социально-экономические типы явлений. Непосредственный сбор массовых данных должен обеспечить полноту фактов, относящихся к рассматриваемому вопросу, так как явления находятся в постоянном изменении, развитии. В том случае, если отсутствуют полные данные, анализ и выводы могут быть ошибочными. Для обеспечения достоверности статистических данных необходима тщательная всесторонняя проверка (контроль) качества собираемых фактов. Для того, чтобы создать наилучшие условия для получения объективных материалов, необходима научная организация статистического наблюдения.
Программа сбора информации n n n Программа сбора информации представляет собой перечень признаков, подлежащих изучению в ходе исследования. Программа оформляется в виде регистрационного документа (анкета, бланк, карта и т. п. ), включающего вопросы и признаки, которые исследователь хочет изучить в ходе эксперимента и в дальнейшем заполняется на каждую единицу наблюдения. Для этой цели можно использовать официальные учетные документы или разработать специальный для данного исследования регистрационный документ.
n n n Регистрационный документ должен отвечать определенным требованиям. В него должны быть включены обязательные вопросы (номер единицы наблюдения, дата заполнения, название учреждения, паспортная часть, подпись лица, заполнившего документ). Формулировка вопросов должна быть однозначной, т. е. предполагать унифицированность заполнения документа для любого лица. Документ должен быть удобен для чтения и заполнения, а также для шифровки и обработки данных. Для этой цели используются альтернативные ответы или подсказ ответов.
n Статистическое наблюдение осуществляется в двух формах: путём предоставления отчётности и проведения специально организованных статистических наблюдений.
n n Отчётностью называют такую организованную форму статистического наблюдения, при которой сведения поступают в виде обязательных отчётов в определённые сроки и по утверждённым формам. При этом источником сведений, как правило, являются первичные учётные записи в документах (амбулаторная карта, листок нетрудоспособности, история болезни и т. п. ).
n Специально организованное статистическое наблюдение представляет собой сбор сведений посредством переписей, единовременных учётов и обследований. Примером специально организованного статистического наблюдения могут быть: перепись населения, всякого рода социологические обследования.
Виды статистического наблюдения различаются n n по времени регистрации данных и по степени охвата единиц исследуемой совокупности
n n По характеру регистрации данных во времени различают наблюдение непрерывное, или текущее, и прерывное (периодическое). Последнее, в свою очередь подразделяется на наблюдение периодическое и наблюдение единовременное.
n n n Текущим (непрерывным) является такое наблюдение, которое ведётся систематически. При этом регистрация фактов производится по мере их свершения, например, регистрация актов гражданского состояния, учёт произведённой продукции, отпуска материалов со склада, выручки магазинов. При текущем наблюдении нельзя допускать значительного разрыва между моментом возникновения факта и моментом его регистрации.
n n Прерывным (периодическим) является такое наблюдение, которое повторяется через определённые промежутки времени. Например, ежегодные переписи населения. Единовременное (разовое) наблюдение проводится по мере надобности, время от времени, без соблюдения строгой периодичности или вообще проводится единожды. Примером могут служить социальноэкономические выборочные обследования, проводимые Научно-исследовательским институтом по изучению спроса на товары народного потребления и конъюнктуры торговли.
n n n По степени охвата единиц изучаемой совокупности различают сплошные и несплошные статистические наблюдения. Сплошным называют такое наблюдение, при котором обследованию подвергаются все без исключения единицы изучаемой совокупности. Примером сплошного наблюдения может служить Всесоюзная перепись населения. Путем сплошного наблюдения осуществляется получение отчетности от предприятий и учреждений. Несплошным называют такое наблюдение, при котором обследованию подвергаются не все единицы изучаемой совокупности, а только заранее установленная их часть, например, изучение торговых оборотов и цен на городских рынках. Основным видом несплошного наблюдения является выборочное.
Основные правила построения анкеты n n n Искомую информацию нельзя получить другим путем Формулировки вопросов понятны респонденту Все вопросы вызывают положительную реакцию опрашиваемого
Методика составления анкеты медико-социального исследования n n Открытый, или свободный, вопрос не предусматривает какихлибо подсказок возможных вариантов ответов. Закрытыми вопросами называются такие, которые в своей формулировке содержат варианты возможных ответов.
n n Альтернативным вопросом называется такой закрытый вопрос, ответ на который должен быть дан однозначно: "Во всех случаях заболевания Вы обращаетесь к врачу? да, нет". Вопросом-набором называется такой вопрос, при ответе на который респондент может выбрать одну или несколько подсказок, которые не исключают, а дополняют друга
n Промежуточная форма вопроса — полузакрытая, когда после перечня вариантов ответов оставляется свободное место для записи, позволяющее опрашиваемому высказать и другую точку зрения
n n n Ошибки статистического наблюдения. Всякое статистическое наблюдение ставит задачу получения таких данных, которые точнее бы отражали действительность. Отклонения, или разности между исчисленными показателями и действительными (истинными) величинами исследуемых явлений нашли отражение в показателях, называемых ошибками, или погрешностями.
n В зависимости от характера и степени влияния на конечные результаты наблюдения, а также исходя из источников и причин возникновения неточностей, допускаемых в процессе статистического наблюдения, обычно выделяют ошибки регистрации и ошибки репрезентативности.
n n Ошибки регистрации возникают вследствие неправильного установления фактов в процессе наблюдения или неправильной их записи. Они подразделяются на: случайные и систематические и могут быть как при сплошном, так и несплошном наблюдении.
n n Случайные ошибки — ошибки регистрации, которые могут быть допущены как опрашиваемыми в их ответах, так и регистраторами при заполнении бланков. Систематические ошибки могут быть преднамеренными, так и непреднамеренными. Преднамеренные ошибки получаются в результате того, что опрашиваемый, зная действительное положение дела, сознательно сообщает неправильные данные. Непреднамеренные ошибки вызываются различными случайными причинами (небрежностью или невнимательностью регистратора, неисправностью измерительных приборов и т. д. ).
n n Ошибки репрезентативности возникают в результате того, что состав отобранной для обследования части единиц совокупности недостаточно полно отображает состав всей изучаемой совокупности, хотя регистрация сведений по каждой отобранной для обследования единице была проведена точно. Ошибки репрезентативности могут быть случайными и систематическими
n n Случайные ошибки возникают из -за того, что совокупность отобранных единиц наблюдения неполно воспроизводит всю совокупность в целом. Систематические ошибки возникают вследствие нарушения принципов случайного отбора единиц изучаемой совокупности.
n n Для выявления и устранения допущенных при регистрации ошибок может применяться счётный и логический контроль собранного материала. Счётный контроль заключается в проверке точности арифметических расчётов, применявшихся при составлении отчётности или заполнении формуляров обследования. Логический контроль заключается в проверке ответов на вопросы программы наблюдения путём их логического осмысления или путём сравнения полученных данных с другими источниками по этому же вопросу. Указанные приемы проверки статистических данных путем счетного и логического контроля могут быть использованы при проверке как материалов специальных статистических наблюдений, так и отчетности.
Статистическая отчетность n Статистическая отчетность — это официальный документ, в котором содержатся сведения о работе подотчетного объекта, занесенные на специальную форму.
n n Первичный учет представляет собой регистрацию различных фактов (событий, процессов и т. д. ), производимых по мере их свершения и, как правило, на первичном учетном документе. Примером может служить свидетельство о рождении ребенка. В функции первичного учета входят операции наблюдения, т. е. регистрация данных и подсчет итогов. Каждое предприятие или учреждение представляет установленные формы статистической отчетности, характеризующие различные стороны их деятельности. Все формы статистической отчетности утверждают органы государственной статистики.
n n n По своему содержанию формы отчетности бывают типовыми (общими) и специализированными. Общая отчетность — это отчетность, содержащая одни и те же данные для определенной отрасли народного хозяйства и для предприятий (учреждений) всего народного хозяйства. В специализированной отчетности содержатся специфические показатели отдельных отраслей промышленности, медицины, здравоохранения.
n n n По периоду времени, за который предоставляется отчетность, по его длительности различают отчетность текущую и годовую Если сведения представляются за год, то такую отчетность называют годовой. Отчетность за все другие периоды в пределах менее года, соответственно квартальная, месячная, недельная и т. п. называется текущей.
Группировка статистических данных n n В результате первого этапа статистического исследования — статистического наблюдения — получают сведения о каждой единице совокупности. Задача второго этапа статистического исследования состоит в том, чтобы упорядочить и обобщить первичный материал, свести его в группы и на этой основе дать обобщающую характеристику совокупности. Этот этап в статистике называется сводкой.
n n Различают: простую сводку (подсчет только общих итогов) и статистическую группировку, которая сводится к расчленению совокупности на группы по существенному для единиц совокупности признаку. Группировка позволяет получить такие результаты, по которым можно выявить состав совокупности, характерные черты и свойства типичных явлений, обнаружить закономерности и взаимосвязи.
n n n Результаты сводки могут быть представлены в виде статистических рядов распределения. Статистическим рядом распределения называют упорядоченное распределение единиц совокупности на группы по изучаемому признаку. В зависимости от признака ряды могут быть вариационными (количественными) и атрибутивными (качественными). Количественные признаки — это признаки, имеющие количественное выражение у отдельных единиц совокупности, например, заработная плата работников, стоимость продукции различных предприятий, возраст людей и т. д. Атрибутивные признаки — это признаки, не имеющие количественной меры. Например, пол (мужской, женский), отрасль народного хозяйства, вид продукции, профессия и т. д.
n n n Вариационные ряды могут быть дискретными или интервальными. Дискретный ряд распределения — это ряд, в котором варианты выражены целым числом. Примером может служить распределение работников по тарифным разрядам: Тарифный разряд Число работников, чел. 1 -й 10 2 -й 20 3 -й 40 4 -й 60 5 -й 50 6 -й 20 Итого 200
n n Интервальный ряд распределения — это ряд, в котором значения признака заданы в виде интервала. Например, распределение рабочих по разрядам можно представить в виде интервального ряда. Интервалы группировки могут равные и неравные Тарифный разряд Число работников, чел. 1 -2 -й 30 3 -4 -й 100 5 -6 -й 70 Итого 200
n n Статистические ряды распределения позволяют систематизировать и обобщать статистический материал. Однако они не дают всесторонней характеристики выделенных групп. Чтобы решить ряд конкретных задач, выявить особенности в развитии явления, обнаружить тенденции, установить зависимости, необходимо произвести группировку статистических данных.
n n n Группировка - это процесс образования групп единиц совокупности однородных в каком-либо отношении, а также имеющих одинаковые или близкие значения группировочного признака. Для этой цели выбирается группировочный признак и разрабатывается система показателей, которыми будут характеризоваться выделенные группы. Определение и обоснование показателей целиком зависят от цели исследования и поставленной задачи.
n В зависимости от цели и задач исследования различают следующие виды группировок: типологические, структурные, аналитические.
n n К типологическим группировкам относят все группировки, которые характеризуют качественные особенности и различия между типами явлений. Типологические группировки широко применяются в экономических, социальных и других исследованиях.
Распределение промышленной продукции, произведенной в различных формах хозяйствования за отчетный период Группы предприятий по Объемпромышленной В % к итогу формам продукции, млрд. хозяйствования руб. Государственные 405, 0 89, 20 Арендные 19, 0 4, 19 Кооперативные 30, 0 6, 61 Всего 454, 0 100, 0
n n n Структурная группировка - это группировка, выявляющая состав (строение, структуру) однородной в качественном отношении совокупности по какому-либо признаку. Примером могут служить группировки предприятий по проценту выполнения плана, по числу рабочих и т. д. Состав населения может быть сгруппирован по полу, по возрасту, по уровню образования, по роду занятий и т. д.
n n Значение такого рода группировок заключается в том, что с их помощью могут быть выделены и изучены группы предприятий передовых, средних, отстающих; выявлены неиспользованные резервы производства, например, в области улучшения использования основных фондов, повышение производительности труда, улучшение качества продукции и т. д. Группировка населения по возрасту, например, необходима для проведения различных расчетов, связанных с медицинским, культурным, бытовым обслуживанием населения, для вычисления специальных демографических показателей и т. д.
Пример структурной группировки Группы заводов по среднегодовой стоимости ОПФ, млн. руб. Численность рабочих человек в % к итогу 1, 0 -2, 2 820 13, 86 2, 2 -3, 4 3150 53, 25 3, 4 -4, 6 1945 32, 89 Итого 5915 100, 0
n n Аналитическая группировка - это группировка, которая применяется для исследования взаимосвязи между явлениями. Используя аналитические группировки, определяют факторные и результативные признаки изучаемых явлений. Факторные - это признаки, оказывающие влияние на другие, связанные с ними признаки. Результативные – это признаки, которые изменяются под влиянием факторных. Пример аналитической группировки
Пример аналитической группировки Группы магазинов по товарооборота, тыс. руб. объему Торговая площадь 1700 -2000 18, 5 2000 -3000 22, 5 3000 -4200 59, 0 Всего 100, 0
n n n Комбинированные группировки Образование групп по двум и более признакам, взятым в определенном сочетании, называется комбинированной группировкой. При этом группировочные признаки принято располагать, начиная с атрибутивного, в определенной последовательности, исходя из логики взаимосвязи показателей.
n n n Применение комбинированных группировок обусловлено многообразием экономических явлений, а также необходимостью их всестороннего изучения. Но увеличение числа группировочных признаков ограничивается уменьшением наглядности, что снижает эффективность использования статистической информации. Примером комбинированной группировки может служить разделение образованных групп по формам хозяйствования на подгруппы по уровню рентабельности (доходности) или по другим признакам (производительность труда, фондоотдача и т. д. ).
Техника проведения группировки. n n n Необходимо выделить группировочный признак или основание группировки. Необходимо определить число интервалов группировки и их границы. Группировочный признак при анализе выбирается из условия выполнения цели группировки.
n n n Так, если есть статистические данные о промышленных предприятиях отрасли, то можно в качестве группировочного признака выбрать такие величины: число рабочих на предприятии; число всех работающих; мощность энергоустановок; объем выпуска продукции; стоимость ОПФ и т. д.
Вторичная группировка. n n Перегруппировка ранее сгруппированных статистических данных называется вторичной группировкой. К этому методу прибегают в тех случаях, когда в результате первоначальной группировки нечетко проявился характер распределения изучаемой совокупности. В этом случае производят укрупнение или уменьшение интервалов. Также вторичная группировка используется для приведения к сопоставимому виду группировок с различными интервалами с целью их сравнения.
Программа обработки результатов n Программа обработки результатов предполагает составление макетов статистических таблиц, включающих в себя те сочетания признаков, которые исследователь хочет проверить и изучить в ходе эксперимента.
Статистические таблицы n n n Статистические таблицы - это наиболее рациональная форма представления результатов статистической сводки и группировки. Значение статистических таблиц состоит в том, что они позволяют охватить материалы статистической сводки в целом. Статистическая таблица, по существу, является системой мыслей об исследуемом объекте, излагаемых цифрами на основе определенного порядка в расположении систематизированной информации.
n n n По внешнему виду статистическая таблица представляет собой ряд пересекающихся горизонтальных и вертикальных линий, образующих по горизонтали строки, а по вертикали - графы (столбцы, колонки), которые в совокупности составляют как бы скелет таблицы. Таблица, состоящая из строк и граф, которые еще не заполнены цифрами, называется макетом таблицы. Каждая статистическая таблица имеет подлежащее и сказуемое.
n n n Подлежащее таблицы - это объект нашего изучения (название района, города, предприятия). Сказуемое - это система показателей, которыми характеризуется объект изучения, т. е. подлежащее таблицы. Обычно подлежащее располагается слева, в виде наименования горизонтальных строк, а сказуемое - справа, в виде наименования вертикальных граф. В таблице могут быть подведены итоги по графам и строкам. Обязательная часть таблицы - заголовок, показывающий, о чем идет речь в таблице, к какому месту и времени она относится.
Макет таблицы Название таблицы
n Статистические таблицы делятся на простые (анализ одного признака), групповые (сочетание двух признаков), комбинационные (сочетание трех и более признаков).
Методика составления макетов таблиц
n Простыми таблицами называются такие, в подлежащем которых нет группировок, а дается лишь перечень единиц совокупности (перечневые таблицы), административных районов (территориальные таблицы) или периодов времени (хронологические таблицы).
Продажа некоторых продуктов питания продовольственными магазинами города Товарные группы Продано, тыс. руб. 1991 1992 Мясо и птица 12, 8 13, 9 Колбасные изделия 14, 0 13, 9 Рыба 2, 0 2, 4 Молоко и молочные продукты 8, 83 8, 78
n n n Хронологическую таблицу можно составлять за любые по величине отрезки времени или на моменты, отстоящие друг от друга по времени на различную длину. Таблицы, в подлежащем которых приводится перечень территорий (районов, областей и т. п. ), называются перечневыми территориальными. Довольно часто применяются и территориально-хронологические таблицы, в которых сказуемое также содержит показатели по годам, кварталам и т. д. , а подлежащее - показатели по районам, областям.
Процент женщин в общей численности рабочих и служащих Район Год 1990 Омский Полтавский Кармиловский ИТОГО 1991 1992 1993
n Групповые статистические таблицы дают более информативный материал для анализа изучаемых явлений, благодаря образованным в их подлежащем группам по существенному признаку или выявлению связи между рядом показателей.
Группировка промышленных предприятий по численности работающих в году (в % к итогу). Группы предприятий Число Валовая Среднесписочная по среднегодовой предприятий продукция численность численности рабочих работающих, чел до 500 46, 4 7, 5 9, 2 500 — 1000 23, 5 13, 6 13, 3 1000 — 3000 21, 2 31, 5 29, 5 3000 — 5000 4, 3 13, 4 13, 2 5000 — 10000 2, 8 13, 6 13, 7 10000 и выше 1, 8 20, 4 21, 1
n n Комбинационными таблицами называются такие, в которых подлежащее содержит группировку единиц совокупности по двум или более признакам, взятым в сочетании. Комбинационная таблица устанавливает взаимное действие на результативные признаки существующую связь между факторами группировки.
Группировку заводов по стоимости основных производственных фондов (ОПФ) и фактическому выпуску продукции.
Основные правила составления таблиц: n n n четко формулировать наименование, которое должно точно отражать цель составления таблицы; ясно и кратко формулировать название строк и граф таблицы; соблюдать последовательность расположения показателей сказуемого; указывать единицы измерения; если они одинаковые, то ед. измерения выносятся в заголовок и указываются в скобках; нумеровать графы; иметь итоговые показатели;
n n n если в таблице производится сопоставление с каким-либо годом, то в заголовке, в скобках, отражается год сопоставления; территориальные, административные образования перечисляются по алфавиту; данные за многие годы располагаются в хронологическом порядке; если в таблице абсолютные и относительные показатели за ряд лет, то сначала приводятся абсолютные, затем относительные показатели за один год, затем так же за следующий год; если значение признака в какой-либо клетке неизвестно, ставится знак Х, или. . . , или н. с. (нет сведений); нулевые значения признака - знак “—”.
Статистические графики n n n Важное значение при изучении любой деятельности имеет графическое изображение статистической информации. Правильно построенный график делает статистическую информацию более выразительной, запоминающейся и удобно воспринимаемой. Графический метод находит широкое применение для иллюстрации сложившегося положения дел на рынке товаров и услуг, конъюнктуры спроса и предложения, рекламы товаров.
n n Применение графиков в статистике насчитывает более чем двухсотлетнюю историю. Основоположником графического метода в статистике коммерческой деятельности считают английского экономиста У. Плейфейра (1731 — 1798). В своих работах он впервые применил способы графического изображения статистических данных (линейные, столбиковые, секторные и другие диаграммы).
n n Статистические графики - это одно из самых наглядных средств представления информации. Статистический график представляет собой чертеж, на котором при помощи условных геометрических фигур изображаются статистические данные. В результате этого достигается наглядная характеристика изучаемой статистической совокупности.
В статистическом графике различают следующие основные элементы: n n поле графика; графический образ; пространственные и масштабные ориентиры; экспликация графика.
n n n Полем графика является место, на котором он выполняется. Это листы бумаги, географические карты, план местности и т. п. Поле графика характеризуется его форматом (размерами и пропорциями сторон). Размер поля графика зависит от его назначения. Графический образ — это символические знаки, с помощью которых изображаются статистические данные (линии, точки, прямоугольники, квадраты, круги и т. д. ). В качестве графического образа выступают и объемные фигуры. Иногда в графиках используются негеометрические фигуры в виде силуэтов или рисунков предметов. Пространственные ориентиры определяют размещение графических образов на поле графика. Они задаются координатной сеткой или контурными линиями и делят поле графика на части, соответствующие значениям изучаемых показателей.
n n n Масштабные ориентиры статистического графика придают графическим образам количественную значимость, которая передается с помощью системы масштабных шкал. Масштаб графика — это мера перевода численной величины в графическую (например, 1 см соответствует 100 тыс. руб. ). При этом чем длиннее отрезок линии, принятой за числовую единицу, тем крупнее масштаб. Масштабной шкалой является линия, отдельные точки которой читаются как определенные числа. Шкала, по которой отсчитываются уровни изучаемых показателей, как правило, начинается с 0. Последнее число, наносимое на шкалу, несколько превышает максимальный уровень, отсчет которого проводится по этой шкале. При построении графика допускается разрыв масштабной шкалы. Этот прием используется для изображения статистических данных, имеющих значения лишь в определенных значениях.
n n Экспликация графика — это пояснение его содержания, включает в себя заголовок графика, объяснения масштабных шкал, пояснения отдельных элементов графического образа. Заголовок графика в краткой и четкой форме поясняет основное содержание изображаемых данных. Помимо заголовка, на графике дается текст, делающий возможным чтение графика. Цифровые обозначения шкалы дополняются указанием единиц измерения.
Классификация статистических графиков. n n При всем своем многообразии статистические графики классифицируются по ряду признаков: способу построения, форме применяемых графических образов, характеру решаемых задач. По способу построения статистические графики подразделяются на диаграммы, картограммы и картодиаграммы.
n Диаграмма представляет чертеж, на котором статистическая информация изображается посредством геометрических фигур или символических знаков.
n Диаграмма сравнения — показывает соотношение признака статистической совокупности.
Столбиковая диаграмма сравнения. n n n Каждое значение изучаемого показателя изображается в виде вертикального столбика. Количество столбиков определяется числом изучаемых показаний (данных). Расстояние между столбиками должно быть одинаковым. У основания столбиков делается название изучаемого показателя.
Ленточная (полосовая) диаграмма сравнения. n В этих диаграммах основания столбиков располагаются вертикально. Должна быть одинаковая ширина полос.
Столбиковая диаграмма сравнения. n n При построении столбиковых диаграмм используется, как и в линейных графиках, прямоугольная система координат. По оси абсцисс размещается основание столбиков. Их ширина может быть произвольной, но обязательно одинаковой для каждого столбика.
Основные требования построения диаграмм сравнения: n n соответствие столбиков по высоте, а полос - по длине, отображаемым цифрам; недопустимость разрывов масштабной шкалы и начала ее не от нулевой отметки.
n Структурная диаграмма - позволяет сопоставить статистические совокупности по составу.
Структурно-столбиковая диаграмма.
Структурно-секторная диаграмма n Секторная диаграмма строится таким образом, чтобы каждый сектор занимал площадь круга пропорционально удельному весу отображаемых частей целого. Затем необходимо найти значения центральных углов (1%=3, 6 градуса).
n При изучении статистической информации о коммерческой деятельности на рынке товаров и услуг применяются так называемые радиальные диаграммы. Строятся они на базе полярных координат. Началом отсчета в них служит центр окружности, а носителем масштабных шкал являются радиусы круга. Обычно в основе радиальных диаграмм лежат повторяющиеся годовые циклы с помесячными или поквартальными данными. Так, при изучении годового цикла с помесячными данными окружность делят радиусами на 12 равных частей. Каждому радиусу дается название месяца года, а их расположение подобно циферблату часов. На каждом радиусе, в соответствии с установленным масштабом, наносятся точки, соответствующие изучаемым за каждый месяц данным. Полученные таким образом точки соединяются между собой линиями. В результате получается спиралеобразная линия, характеризующая внутригодовые циклы коммерческой деятельности.
Соотношение мужской и женской повозрастной смертности, 1990 -1997 гг.
Знак Варзара. - (Варзар В. Е. 1851 -1940). n n n Известный русский статистик В. Е. Варзар предложил использовать прямоугольные фигуры для графического изображения трех показателей, один из которых является произведением двух других. В каждом таком прямоугольнике основание пропорционально одному из показателей — сомножителей, а высота его соответствует второму показателю — сомножителю. Площадь прямоугольника равна величине третьего показателя, являющегося произведением двух первых. Располагая рядом несколько прямоугольников, относящихся к разным показателям, можно сравнивать не только размеры показателя — произведения, но и значения показателей — сомножителей.
n n n Валовой сбор с/х культуры равен произведению урожайности и посевной площади. На этом графике можно сравнить между собой: урожайность (по длине основания); посевные площади (по длине боковой стороны); валовой сбор (по площади прямоугольника). n n n Валовой сбор, урожайность и посевные площади в 1977 г. а - зерновых культур, б - подсолнечника.
n Диаграмма динамики - показывает изменение явления во времени. Диаграмма изменений может быть изображена с помощью уже рассмотренных типов диаграмм.
n Диаграмма связи - показывает функциональную зависимость одного признака от другого (обычный график на координатной сетке - y = f(x)).
n n Статистическая карта - вид графика, который иллюстрирует содержание статистических таблиц, где подлежащим является административное или географическое деление совокупности. На лист изображения наносится контурная географическая карта, отражающая деление совокупности на группы.
n Статистическая карта называется картограммой, вся информация на ней отображается в виде штриховки, линий, точек, окраски, отражающих изменение какоголибо показателя.
Смертность на 1000 человек в различных регионах
n На картодиаграмме, на фоне карты, присутствуют элементы диаграммных фигур. Преимущество картодиаграммы перед диаграммой состоит в том, что она не только дает представление о величине изучаемого показателя на различных территориях, но и изображает пространственное размещение изучаемого показателя.
n n В зависимости от формы применяемых графических образов статистические графики могут быть точечными, линейными, плоскостными и фигурными. В точечных графиках в качестве графических образов применяется совокупность точек. В линейных графиках графическими образами являются линии. Для плоскостных графиков графическими образами являются геометрические фигуры: прямоугольники, квадраты, окружности.
Гистограммы n n При обработке и отображении экспериментальных данных, в которых изучаемый признак может принимать любое значение из некоторого интервала, используют следующие способы представления данных: гистограммы; полигон частот; полигон накопленных частот (кумулята).
n n Гистограмма состоит из примыкающих друг к другу прямоугольников, изображенных на координатной сетке. Существует несколько случаев построения гистограмм.
Равные интервалы группировки данных. Группы рабочих по стажу лет Число рабочих Накопительные частоты 1— 3 4 4 3— 5 12 16 5— 7 15 31 7— 9 10 41 9 — 11 9 50 ИТОГО 50
Открытые крайние интервалы группировки. Группы рабочих по Число рабочих Накопительные стажу лет частоты до 3 4 4 3— 5 12 16 5— 7 15 31 7— 9 10 41 9 и более 9 50 ИТОГО 50
Неравные интервалы группировки. n n n Предположим, что вместо двух интервалов (3 -5 и 5 -7) стал один. Интервал стал шире в два раза, а высота стала не 27 а 13, 5, с тем, чтобы площадь прямоугольника не менялась. Высоту прямоугольника можно определить по формуле - n/h, n - частоты попадания (27), а h - количество интервалов (2).
Группы рабочих по Число рабочих стажу лет Накопительные частоты 1— 3 3— 7 7— 9 9 — 11 ИТОГО 4 31 41 50 4 27 10 9 50
Полигон накопительных частот.
n n Полигон частот - ломаная линия, соединяющая точки, соответствующие срединным значениям интервалов группировки и частотам интервалов. Полигон частот получается из гистограммы, если соединить середины вершин прямоугольников ломаной линией.
Требования предъявляемые к графикам n При графическом изображении количественных показателей коммерческой деятельности (объём, состав и динамика товарооборота, состояние товарного предложения, товарных запасов, издержек обращения, прибыли и т. д. ) в качестве графического образа предпочтительнее использовать линейные, столбиковые или круговые диаграммы, имеющие наибольшую по сравнению с объёмными или плоскостными фигурами наглядность и доходчивость.
n n n В общем расположении на поле графика графических образов последние в целях правильного чтения и понимания изучаемого показателя размещаются слева направо. При этом масштабные ориентиры графика по горизонтальной шкале (ось абсцисс), как правило, размещаются от его нижней части. Для вертикальной шкалы (ось ординат) масштабные ориентиры обычно размещаются в левой части графика.
n n n В график по возможности следует включать исходные данные к их построению. Если это нецелесообразно, то исходные данные должны в табличной форме сопровождать график. Это обусловливает доверие к графическому изображению показателей коммерческой деятельности, повышает познавательное значение статистических графиков. Все буквенные и цифровые значения должны располагаться на графике так, чтобы их легко можно было отсчитать от начала масштабной шкалы. Ряды цифровых данных, отображающие изменения показателей коммерческой деятельности во времени, размещаются в строгой хронологической последовательности и обязательно по оси абсцисс.
n Общим требованием графического метода изображения статистических показателей является то, что факторные признаки размещаются на горизонтальной шкале графика и их изменения читаются слева направо, а результативные признаки — по вертикальной шкале и читаются снизу вверх. Это повышает аналитическое значение статистических графиков. При этом важно, чтобы заголовок графика был бы кратким, но достаточно чётко пояснял основное его содержание.
Программа анализа n Программа анализа подразумевает разработку рабочей гипотезы исследования, т. е. основной идеи эксперимента.
n n n Важнейшее место на этапе организации исследования принадлежит выбору метода формирования статистической совокупности. В зависимости от степени охвата объекта исследования принято различать сплошное и выборочное статистическое исследование. Сплошным называется такое наблюдение, при котором изучаются все единицы наблюдения объекта исследования, т. е. так называемая генеральная совокупность.
Выборочное наблюдение n n Выборочное наблюдение – вид несплошного наблюдения, при котором отбор подлежащих обследованию единиц наблюдения из генеральной совокупности осуществляется случайно, отобранная часть (выборка) подвергается обследованию, после чего результаты распространяются на всю исходную совокупность. Сформированная таким образом совокупность называется выборочной или выборкой.
Положительные стороны выборочного метода: n n n может быть единственно доступным способом сбора данных, если единицы наблюдения во время исследования подвергаются порче или уничтожению; экономичность; сжатые сроки исследования, что ускоряет получение результата; большая точность получения результата за счет уменьшения случайных ошибок при сборе материала; возможность задать надежность и точность исследования.
Отрицательные стороны выборочного метода: n n неизбежна ошибка в исследовании, связанная с тем, что не все единицы наблюдения подвергаются отбору; может быть нежелательным, если по официальным предписаниям необходимо регистрировать каждую единицу наблюдения; для редких событий малые выборки могут не накопить достаточного числа случаев; при социологических исследованиях может вызвать чувство дискриминации у населения.
n n Для того, чтобы можно было распространить результаты, полученные на части единиц наблюдения, на всю совокупность (объект наблюдения), выборка должна быть репрезентативной. Репрезентативность - это представительность выборочной совокупности по отношению ко всей (генеральной) совокупности, при этом репрезентативность должна быть количественной и качественной. Под количественной репрезентативностью понимают достаточное число единиц наблюдения в выборке для проявления закона больших чисел. Под качественной репрезентативностью понимают соответствие признаков у единиц наблюдения генеральной и выборочной совокупностей.
n Репрезентативность выборки зависит от её численности и от способов формирования выборочной совокупности, т. е. способов отбора единиц наблюдения (способов рандомизации).
n n n Любое значение параметра, вычисленное на основе ограниченного числа наблюдений, непременно содержит элемент случайности. Такое приближенное, случайное значение называется оценкой параметра. Оценка параметра должна быть доброкачественной, что определяется тремя факторами, которые дают наименьшие ошибки расхождения показателей выборочной и генеральной совокупностей: состоятельность оценки, т. е. при увеличении числа наблюдений оценка параметра приближается к его значению в генеральной совокупности; несмещенность оценки, т. е. при оценке отсутствуют систематические ошибки в сторону завышения или занижения параметра генеральной совокупности; эффективность оценки, т. е. оценка должна обладать минимальной вариабельностью. Как правило проводят точечную и интервальную оценку параметра.
Точечная оценка параметра 1. Точечная оценка параметра выражается в ошибке репрезентативности, которая показывает на сколько отличаются обобщающие коэффициенты (показатели), полученные при выборочном исследовании, от тех коэффициентов, которые могли бы быть получены при сплошном исследовании. Вычисление ошибки репрезентативности (m): Для количественных признаков: 2. Для номинальных и порядковых признаков: n n n n Условные обозначения: σ - стандартное отклонение (sample variance) n - число наблюдений в выборке (sample size) р - частота появления признака в совокупности (significance level) q - показатель, альтернативный
n n Главное обобщение опыта исследования любых массовых явлений – закон больших чисел (Бернулли): При достаточно большом числе наблюдений случайные отклонения взаимно погашаются и проявляется устойчивость некоторых параметров, которая выражается в основной тенденции (закономерности). При этом частота случайного события будет сколь угодно мало отличаться от вероятности появления события в отдельном опыте.
n n Отдельное единичное явление содержит в себе элемент случайного. Случайность исчезает в тем большей мере, чем больше соединено единичных явлений. Вероятность – количественная мера объективной возможности появления события при реализации определенного комплекса условий. Вероятность события обозначается как «р» и выражается в долях единицы или процентах.
n n n Случайное событие – событие, которое при реализации определенного комплекса условий может произойти или непроизойти. Вероятность наступления события – находится в пределах 0 < р < 1 , или 0 < р < 100% Вероятность отсутствия события q=1–p
n n n Главное требование, предъявляемой к отбору - это его случайность (рандомизированный отбор). При этом каждой единице наблюдения обеспечивается одинаковая вероятность попадания в выборку благодаря случайности отбора. Случайность отбора достигается путем выбора и применения адекватного метода рандомизации, что является очень важным моментом в исследовании, от которого будет зависеть полноценность получаемых данных и, в конечном итоге, успех всего исследования.
В зависимости от времени регистрации различают следующие виды исследований: n n Единовременные (в виде пролонгированного исследования или моментного среза Текущее Ретроспективное Проспективное
В зависимости от целей исследования выделяют: n n Дескриптивное (для описания и прогнозирования тенденций) Оптимизационное (для решения проблемы и принятия управленческих решений)
В зависимости от методического подхода к исследованию со стороны исполнителя различают: n n Пассивные исследования (без активного вмешательства исследователя в изучаемую совокупность или окружающую ее среду) Активные исследования Поисковые эксперименты (создание специальных условий для совокупности или устранение действия факторов внешней среды) Управляемые эксперименты (внесение коррекции в методику исследования в зависимости от получаемых результатов)
Основные виды ошибок научного исследования:
Ошибки регистрации n n Случайные (взаимно погашаются и не влияют на результат исследования) Систематические (плохая юстировка прибора, неоднозначность инструкции, недостаточная унификация методов и т. д. – могут существенно исказить результат исследования)
Методические n n n Недостаточность числа наблюдений Нарушение случайности отбора Неправильная группировка данных Использование средних величин в неоднородных группах и другие.
Логические n n n Сравнение данных без учета их качественной характеристики Смешение причины и следствия Недоучет взаимосвязи явлений
n n Для правильного выбора пути статистического анализа необходимо знать вид распределения изучаемого признака. Под видом распределения случайной величины понимают соответствие, устанавливаемое между всеми возможными числовыми значениями случайной величины и вероятностями их появления в совокупности.
n n Вид (закон) распределения может быть представлен аналитической зависимостью: в виде формулы; в виде графического изображения в виде таблицы
Виды распределений: n n n Нормальное (гауссово, симметричное, колообразное) распределение (normal, Gaussian distribution)– описывает совместное воздействие на изучаемое явление небольшого числа случайно сочетающихся факторов (по сравнению с общей суммой факторов), число которых неограничено велико. Встречается в природе наиболее часто, за что и получило название «нормального» . Характеризует распределение непрерывных случайных величин.
Нормальное распределение n n х - значения случайной величины; р - вероятность появления данного значения в совокупности.
n n Биномиальное распределение (распределение Бернулли) (binomial distribution, Bernoulli distribution) – описывает распределение частоты события, обладающего постоянной вероятностью появления при многократных испытаниях. При большом числе испытаний стремится к нормальному.
Биномиальное распределение n n х - значения случайной величины; р - вероятность появления данного значения в совокупности.
n Крайним вариантом биномиального распределения является альтернативное распределение, при котором вся совокупность распределяется на две части (две альтернативы). Биномиальное распределение характеризует распределение дискретных случайных величин.


