Content Analysis.ppt
- Количество слайдов: 32
ТЕХНОЛОГІЇ АНАЛІЗУ ТЕКСТОВОЇ ІНФОРМАЦІЇ. КОНТЕНТ-АНАЛІЗ. СУТЬ КОНТЕНТ-АНАЛІЗУ.
План лекції: 1. 2. 3. 4. Суть контент-аналізу. Сфери застосування контент-аналізу. Кількісний та якісний контент-аналіз. Програмні продукти для контент-аналізу.
Контент-аналіз – це …метод якісно-кількісного аналізу змісту документів з метою виявлення чи виміру різних фактів і тенденцій, відображених у цих документах. …дослідницька техніка для об'єктивного, систематичного і кількісного опису явного змісту комунікації. На даний момент контент-аналіз широко застосовується в аналітичних дослідженнях в сфері бізнесу, політичної аналітики і практики, а також в силових структурах.
Контент-аналіз… …також можна назвати «текстовим кодуванням» , оскільки він передбачає отримання кількісної інформації про вміст документа на основі її кодування; …. націлений на вироблення кількісного опису смислового й символічного змісту документа, на фіксацію його об'єктивних ознак і підрахунок цих ознак.
«Стенфордський план» Одним з найбільш відомих прикладів застосування методики контент-аналізу в сфері міжнародних досліджень вважається «Стенфордський план» щодо міжнародної кризи (на прикладі подій 1914 року). На підставі порівняльного аналізу документів, якими обмінювалися в період кризи ворогуючі сторони, членами Стенфордської групи була представлена логічна модель внутрішньодержавньої інформаційної поведінки під час кризи.
Контент-аналіз концентрується на реєстрації очевидних значень і не передбачає пошуку прихованих значень і підтекстів… …однак навіть спостереження за "явними" повторюваними фрагментами змісту дають змогу віднайти їхню приховану структуру в межах усього інфор маційного потоку. Контент-аналіз успішно використовувався у роки Другої світової війни (спостереження за пресою і радіо ворожої сторони, вивчення нацистської пропаганди тощо).
Контент-аналіз… … не скасовує необхідності звичайного (тобто змістовного) аналізу документів. Контент-аналіз доповнює звичайни аналіз, а їхнє поєднання поглиблює розуміння сенсу будь-якого тексту. … дозволяє виявити в документі те, що вислизає від поверхневого погляду при його традиційному вивченні, але що має важливий соціальний сенс.
Контент-аналіз найбільш ефективний, коли: v v v необхідно забезпечити високу точність показників; необхідно дослідити обширний несистематизований матеріал (наприклад, підшивку газети або записи телепередач); потрібна сумарна оцінка документальної інформації.
Напрямки застосування контент-аналізу: v v v виявлення того, що існувало до тексту і що тим чи іншим чином отримало в ньому відображення (текст як індикатор певних сторін об'єкту, що вивчається - навколишньої дійсності, автора або адресата); визначення того, що існує тільки в тексті як такому (різні характеристики форми - мова, структура, жанр повідомлення, ритм і тон мови); виявлення того, що буде існувати після тексту, тобто після його сприйняття адресатом (оцінка різних ефектів впливу).
Навіщо потрібен контент-аналіз? v v v v Для аналізу великих масивів інформації, таких як: повідомлення ЗМІ, виступи політичних лідерів, програми партій, правові акти, рекламні і пропагандистські матеріали, історичні джерела, літературні твори.
Де застосовується контент-аналіз? v v v Оле Холсті наступним чином розподіляє дослідження в сфері контентаналізу по наукам: соціологія + антропологія - 27, 7 %; теорія комунікації — 25, 9 %; політична наука — 21, 5 %. Також слід відзначити використання контент-аналізу в таких науках, як v управління персоналом; v психологія; v літературознавство; v історія філософії; v зв’язки з громадскістю.
Задачі, які можна вирішити за допомогою контент-аналізу: v v v Частотний аналіз тексту, побудова смислових груп Смисловий аналіз тексту, знаходження синонімічних виразів Створення користувальницьких тематичних і граматичних словників v Пошук зв'язків у тексті для заданих слів v Створення та ведення баз текстових даних v Побудова карт текстів та порівняння їх між собою
Задачі, які можна вирішити за допомогою контент-аналізу: v v Обчислення стандартних коефіцієнтів (число слів, речень, середня довжина речення і т. п. ) Обчислення інтегральних характеристик тексту (лексичне розмаїття, структурна і граматична складність) Порівняння текстів між собою різними методами і обчислення інтегральних індексів подібності текстів за результатами порівняння Знаходження функціональних залежностей між характеристиками тексту і перевірка цих залежностей на інших текстах
Основні складові контент-аналітичного дослідження Назва Властивості основних складових контент-аналітичного дослідження Спостереження опрацювання масової сукупності текстів, використовуючи при цьому типові соціологічні процедури суцільного/вибіркового спостереження, з дотриманням вимог репрезентативності. Структурування припущення структурування, сегментації, розчленування текстів чи виділення із них змістовних інваріантів (повторення в усіх/ряді текстів) в досліджуваній масовій сукупності. Формалізація забезпечення однотипності сегментації і виділення інваріантів, застосування високого ступеня формалізації, суворих операційних правил і формальних алгоритмів в аналітичних процедурах. Реферування формалізований поділ цілісних текстів чи виділення окремих елементів їх для наступного збору із застосуванням аналітикосинтетичної процедури. Аналіз використання методів теорії ймовірності та математичної статистики для опрацювання текстів.
аналіз змісту документа / кількісний контент-аналіз; v аналіз структури документа / якісний контент-аналіз. v ТИПИ КОНТЕНТ-АНАЛІЗУ:
Типи методів контент-аналізу Назва Кількісний (змістовний) Якісний (структурний) Визначення дослідження слів, тем та дослідження, в якому досліджують повідомлень, який не зміст контенту, а його форму та зосереджується на змісті контенту. структуру. Приклад в якості першого кроку дослідник має створити словник, в якому кожне спостереження отримає визначення та буде віднесено до відповідної категорії. Особливість перед проведенням аналізу обраних лінґвістичних одиниць, передбачують їх зміст (створення словника) та визначають кожний можливий результат спостереження у відповідності із очікуванням дослідника визначення періоду часу або обсягу друкованого простору, який приділено темі в тому чи іншому джерелі, або скільки слів або стовпців приділено кожній темі відповідної категорії. розраховують питомі ваги P кожної теми і категорії ( P=R/T, де R – кількість одиниць даної категорії, T – загальна кількість одиниць) та проводиться порівняльний аналіз відповідних тем для подальшого прогнозування подій, процесів.
Кількісний/змістовний контент-аналіз Цей тип контент-аналізу визначає частоту появи в тексті певних характеристик (змінних). Грунтується на дослідженні слів, тем і повідомлень, зосереджуючи увагу дослідника на змісті повідомлення. На практиці це означає, що в якості першого кроку при проведенні контент-аналізу цього типу дослідник повинен створити свого роду словник, в якому кожне спостереження отримає визначення і буде віднесено до відповідного класу.
Етапи кількісного контент-аналізу Назва етапу Характеристика етапу виділення одиниці аналізу перетворення лінгвістичної одиниці у форму, прийнятну для опрацювання; підрахунок частоти одиниць аналізу застосування різноманітного математичного апарату для виявлення взаємозв'язків між лінгвістичними одиницями; інтерпретація отриманих результатів отримання змістовних, семантично наповнених результатів з використанням математичних методів без залучення штучного інтелекту, об'ємних семантичних формалізаторів, експертів.
Якісний/структурний контент-аналіз Цей тип контент-аналізу дозволяє зробити висновки на основі присутності або відсутності певної характеристики змісту. Орієнтований на обчислення поєднання кількісних і якісних показників, найбільш ефективний для виявлення явних або прихованих цілей суб’єкта.
Етапи якісного контент-аналізу Назва етапу Характеристика етапу розбиття тексту на блоки зведення множини контенту до скінченної кількості інтегрованих змістовних одиниць (категорія, послідовність, тема) для кодування і опрацювання; реконструкція суб'єктивних реконструкція системи значень, думок, складових контентного поглядів і доказів кожного джерела потоку тексту; формування висновків виведення узагальнень шляхом порівняння індивідуальних системних значень.
v Text. Analyst v Vaal Mini v Text. STAT v Wordstat ПРОГРАМНІ ПРОДУКТИ ДЛЯ КОНТЕНТ-АНАЛІЗУ:
Text. Analyst розроблений в якості інструменту для аналізу змісту текстів, смислового пошуку інформації, формування електронних архівів. Text. Analyst проводить семантичний аналіз тексту. Дана програма виділяє із вибраного тексту основні поняття, присвоює їм відповідний ранг за ступенем важливості, встановлює між ними зв’язки та будує дерево термінів за допомогою якого можна проводити навігацію по тексту. Однією із особливостей даної програми є створення реферату – короткого узагальнення усього тексту, в який включено найважливіші поняття.
Text. Analyst Робота у Text. Analyst є достатньо спрощеною за рахунок зручного інтерфейсу, який складається із трьох взаємопов’язаних вікон. Перше відповідає за важливі елементи тексту, друге – вікно посилань на речення у тексті та реферування, третє вікно тексту, що аналізується. У першому вікні розташовані п’ять закладок. Дві з них найчастіше використовуються для перегляду результатів, а саме друга та третя. Їхні назви відповідно «Семантична мережа» та «Тематична структура» . У закладці «Семантична мережа» у вигляді дерева представлені основні поняття та терміни. «Тематична структура» представляє зв’язок головних тем тексту із підтемами. Поняття в корені дерева – це головні теми, а пов’язані з ними елементи у списках наступних рівнів - списки підтем, у яких розгортаються головні теми.
Результати семантичного аналізу вступного тексту Стратегії Національної Безпеки США 2003 р. (автор Дж. Буш-молодший)
Результати семантичного аналізу вступного тексту Стратегії Національної Безпеки США 2010 р. (автор Барак Обама)
Vaal Mini – це програма для комплексного аналізу емоційного та фоносемантичного впливу текстів та слів на людину. Для оцінки впливу у даній програмі використовують шкали. Vaal Mini надає надзвичайно вагомий спектр можливостей: дозволяє оцінювати фонетичний вплив структури тексту і слів на підсвідомість людини, проводити факторний аналіз даних та візуалізувати їх, здійснювати повноцінний контентаналіз по великій кількості вбудованих категорій, проводити емоційно-лексичний аналіз слів
Результати фоносемантичного аналізу статей про кандидатів (жовтень – січень 2010)
Text. STAT це проста програма для аналізу текстів. Вона зчитує текстові файли у різних кодуваннях і HTML файли безпосередньо з інтернету, і виводить на екран частоту появи слів і конкорданси цих файлів. [Конкорданс – узгодження слів у певному контексті]. Text. STAT включає в себе веб-павука, який зчитує стільки сторінок, скільки ви захочете з вами обраного сайту і переносить їх в програму. Новинка «читач новин» так само знаходить самостійно інформацію і поміщає їх у вікно програми Text. STAT.
Конкорданс слова «Samsa» у творі «Перевтілення» Франца Кафки
Wordstat Високорозвинене програмне забезпечення для контент-аналізу і обробки текстів. Word. Stat може бути використаний будь-ким, хто хоче швидко отримати витяг чи аналіз великої кількості документів. Word. Stat використовується для: v контент-аналізу відкритих відповідей, інтерв'ю або розшифрування фокусгруп v бізнес-аналітики і конкурентного аналізу веб-сайтів v вилучення інформації і знань із звітів про інциденти, скарги клієнтів v контент-аналіз новин або наукової літератури v автоматичне маркування та класифікація документів v v виявлення випадків шахрайства, встановлення авторства, патентного аналізу ієрархічної класифікації, систематизації та перевірки достовірності іфнормації
1. 2. 3. Контент-аналіз – це кількісно-якісний аналіз текстової інформації та текстових масивів з метою подальшої змістовної інтерпретації отриманих кількісно-якісних закономірностей. Контент-аналіз застосовують при дослідженні джерел, інваріантних за структурою/змістом, але які існують як не систематизований, безладно організований текстовий матеріал. Метод контент-аналізу полягає у формуванні з різноманіття текстового матеріалу абстрактної моделі змісту тексту. Висновки


