Т.6 Квантитативная лингвистика.ppt
- Количество слайдов: 18
Лекция 6. Квантитативная лингвистика
Содержание 1)Проблематика квантитативной прикладной точек зрения лингвистики с теоретической и 2)Структурно вероятностная модель языка как теоретическое основание приложений квантитативной лингвистики. Вероятностные характеристики речи. Основные области приложения структурно вероятностной модели языка. 3)Частотные словари лексем, словоформ, морфем, фонем, звуков, букв. Принципы создания, методы использования в прикладных целях. 4)Приложение вероятностной модели языка к авторизации и атрибуции текста. 5)Контент анализ как вид квантитативного анализа текста. Задачи и области использования контент анализа. 6)Квантитативные методы в политической лингвистике. Проблемы создания и функционирования автоматизированных систем контент анализа. 7)Квантитативные Художественный методы в текст в анализе аспекте художественного текста. теории коммуникации.
Проблематика квантитативной лингвистики Квантитативная лингвистика — междисциплинарное направление в прикладных ис следованиях, в котором в качестве основного инструмента изучения языка и речи используются количественные или статистические методы анализа. Противопоставляется комбинаторной лингвистике, использующей неколичественный математический аппарат (теорию множеств, мат. логику, теорию алгоритмов и т. д. ).
Проблематика квантитативной лингвистики Цель Кв. Л сформулировать законы, по которым функционирует язык и, в конечном счете, построить общую теорию языка в виде совокупности взаимосвязанных законов функционирования языков Выявляет частотность грамматических форм, отдельных лексем и синтаксических конструкций; позволяет построить структурно вероятностную модель языка. => квантитативная лингвистика уточняет данные теории языка (грамматики, лексикологии, синтаксиса), является приложением статистики в лингвистике.
Квантитативная лингвистика в теории языка: языковые законы Языковой закон — класс гипотез, выведенных из теоретических допущений, математически сформулированных, взаимосвязанных с другими законами в этой области и в достаточном объёме, и успешно проверенных на эмпирических данных, то есть таких, которые нельзя было опровергнуть несмотря на многочисленные попытки. ЯЗ не соблюдаются в каждом отдельном случае, а определяют вероятность событий.
Квантитативная лингвистика в теории языка: языковые законы Распределение длин (или, в более общем виде, многокомпонентности): Исследование частот различных языковых единиц с точки зрения их длин в текстах и словарях регулярно приводит к выявлению целого ряда распределений, в зависимости от изучаемой единицы. На данный момент были изучены следующие единицы: морфы, ритмические единицы, слоги, слова, предложения.
Квантитативная лингвистика в теории языка: языковые законы Закон Мартина — чем более общее значение описано, тем меньше дефиниций. Применим к лексическим цепочкам, образующимся при поиске дефиниций. Отношения в возникающей иерархии так же подчиняются этому закону. Закон Менцерата-Альтмана — чем длиннее некоторый конструкт (целое), тем короче должны быть его составляющие (части). Чем длиннее слово (в слогах/морфах), тем короче составляющие его слоги/морфы.
Квантитативная лингвистика в теории языка: языковые законы Законы частотно-рангового распределения: Закон Ципфа: частота слова обратно пропорциональна его порядковому номеру в списках частотности распределения между рангом и частотой слова и частотой ассоциаций.
Квантитативная лингвистика в теории языка: языковые законы Закон изменения Пиотровского): языка (Закон Процессы роста в языке (например, рост словаря), распространение иностранных и заимствованных слов, изменения в флективной системе и т. д. соответствуют моделям роста в других научных дисциплинах. Частный случай т. н. логистической модели; затрагивает и процессы усвоения языка. Закон текстового блока:
Области приложения структурно вероятностной модели языка Лингвистический мониторинг функционирования языка особенности функционирования языка в определённом типе дискурса; языковые ошибки; появление новых слов; заимствования и т. д. Компьютерное моделирование языка и речи Дешифровка кодированного текста Авторизация/атрибуция текста
Лингвистический мониторинг Частотные словари русского языка: Э. А. Штейнфельд (1963), Л. Н. Засориной (1977), Л. Леннгренна (1993) от 400 до 1 млн слов. Частотный словарь современного русского языка С. А. Шаров, О. Н. Ляшевская — на базе НКРЯ: Частотный словарь служит источником информации о том, какие слова более употребительны в языке , а какие менее частотны. ЧС содержит списки слов, при которых указывается, с какой частотой они
Дешифровка исследование сообщений или текстов для обнару же нияинформации, закодированной или представленной способом, не известным исследователю. Открываемый в процессе дешифровки способ представления информации, содержащейся в тексте, называется ключом. Дескриптивная лингвистика; З. Харрис: «дистрибутивная гипотеза» о возможности распознания любого лингвистического явле ния путём изучения
Авторизация текста A. Множественная неопределенность. Имеется множество текстов или их фрагментов. Необходимо установить, скольким авторам принадлежат тексты, и атрибутировать каждый текст конкретному автору. Б. Сравнение по образцу. Имеется пример текста (текстов) некоторого автора X. Необходимо установить, является ли он и автором некоторого другого текста (текстов). B. Конкуренция образцов. Имеются образцы текстов авторов X, Y, Z. . Необходимо установить, кто из них является автором текстов Т 1, Т 2, . . . , Тn
Контент анализ Метод количественных исследований; Сущность контент анализа: по внешним — ко личественным — характеристикам текста на уровне слов и словосочетаний сделать правдоподобные предположения о его плане содержания и, как следствие, сделать выводы об особенностях мышления и сознания автора текста — его намерениях, установках, желаниях, ценностных ориентациях и т. д. Цель КА выявить закономерности формальной (количественной) репрезентации единиц, характеризующих текст (или группу текстов), и позволяющие сделать выводы о содержательной стороне текста.
Области использования контент анализа Методика контент анализа в настоящее время используется в самых различных гуманитарных науках. Контент анализ с 1950 х гг. активно применяется во всех отраслях знания, где исследования связаны с анализом текстовых источников: теория массовой коммуникации, социология, политология,
Контент анализ в политологии В политологии контент анализ обычно используется для изучения когнитивных установок автора текста — его отношения к тем или иным событиям, понятиям, ценностным категориям и т. д. Категории «свой чужой» , определение национальной идеи. Эксперимент Х. Де Ландшер — метафоры в голландском политическом дискурсе за период с 1831 по 1981 гг. Цель исследования заключалась в установлении возможных корреляций между частотой использования в политическом дискурсе политических метафор и пе риодами политико экономических кризисов. Эксперимент показал, что возрастание количества метафор в политическом дискурсе — признак кризисности политической и экономической ситуации
Контент анализ литературного текста Для литературного текста может быть поставлена задача изу чения особенностей изображения представленных в нем персонажей. Если количество привлекаемых текстов и авторов достаточно велико, то сделанные выводы могут быть распространены на большую социаль но значимую группу людей и даже на общественное сознание в целом. Концепт «СВОЙ — ЧУЖОЙ» : эксклюзивность/инклюзивность, говорящий/собеседник.
Список литературы 1. Баранов А. Н. Введение в прикладную лингвистику. – М. , 2001. 2. Лингвистический энциклопедический словарь / гл. ред. В. Н. Ярцева. М. Советская энциклопедия, 1990. Эл. ресурс: http: //tapemark. narod. ru/les/index. html 3. Шаров С. А. , Ляшевская О. Н. Частотный словарь современного русского языка. Введение. эл. ресурс: http: //dict. ruslang. ru/freq. pdf 4. Частотный словарь русского языка / под ред. Л. Н. Засориной — эл. ресурс: http: //project. phil. spbu. ru/lib/data/slovari/zasorina/zasorin a. html 5. https: //ru. wikipedia. org/wiki/Квантитативная_лингвистика
Т.6 Квантитативная лингвистика.ppt