
AntConc - Ян Хайянь.ppt
- Количество слайдов: 9
Обработка текста в программе Ant. Conc Выполнила: Ян Хайянь
ПЛАН 1. Выбор текстов 2. Построение частотных словарей (общего и по каждому тексту) 3. Формирование списка ключевых слов 4. Определение конкордансов для ключевых слов 5. Построение списка словосоченаний к ключевым словам 6. Выбор кластеров 7. Оценка полученных результатов
Выбор текстов Были выбраны следующие тексты: 1. Красных В. В. "Основы психолингвистики и теории коммуникации". Курс лекций — М. , ИТДГК «Гнозис» , 2001, — 270 с. 2. Леонтьев А. А. "Основы психолингвистики", уч. М. , 1997, — 287 с. 3. Гудков Д. " Прецедентные феномены в текстах политического дискурса ". // в сб. : Язык средств массовой информации. — Москва, 2008. 4. Павлова Л. П. "Межкультурная коммуникация как основа обучения иностранному языку". Труды II-й Международной конференции "Перспективы скоординированного социально-экономического развития России и Украины в общеевропейском контексте. 14 -15 ноября 2013 года, Москва. 5. Глухов В. П. "Основы психолингвистики: учеб. пособие для студентов педвузов". — М. : ACT: Астрель, 2005, — 351 с. (Тексты из оригинальных форматов конвертировались в текстовый формат UTF-8).
Построение частотных словарей Пример построения общего частотного словаря:
Список основных ключевых слов 1. текст 2. язык 3. коммуникация 4. психолингвистика 5. модель 6. человек 7. понимание 8. понятие 9. информация 10. восприятие 11. грамматика
collocates Пример построения словосочетаний для ключевого слова «коммуникация» :
concordance Пример построения метрики для слова «психологическом» :
clusters Пример построения кластеров для слова «коммуникация» длиной 3:
Выводы 1. Программа Ant. Conc позволяет эффективно обрабатывать тексты и выделять ключевые слова, словосочетания, кластеры слов и т. д. 2. Из недостатков Ant. Conc следует указать неудобный ( «интуитивно» не очень понятный интерфейс) и отсутствие возможностей обработки файлов различный форматов: doc, Unicode (кроме UTF-8), rtf и др.
AntConc - Ян Хайянь.ppt