Диплом.pptx
- Количество слайдов: 20
Программа вычисления индекса абстрактности русских корневых слов и конкретно-абстрактный анализ текста Выполнил: Бухонов П. С. Руководитель: преп. Огаркова Н. В. Консультант: д. фил. н. , проф. Кретов А. А.
Конкретность и абстрактность корневых слов Примеры абстрактных глаголов: n желать, хотеть, мочь, быть, любить, уметь. Примеры конкретных глаголов: n крутить, дуть, тянуть, ломать, катить. 2
Конкретно-абстрактный анализ слов n «Индекс абстрактности» – это числовая характеристика абстрактности корневого слова (корня слова). 3
Конкретно-абстрактный анализ текста n n Никогда ранее не осуществлялся из-за: отсутствия специального «инструмента» ; большого количества времени требуемого для его осуществления. 4
Постановка задачи Программа должна предоставлять возможность n загружать данные из разрозненных словарей и сохранять их в базу данных; n находить корень по схеме; n вычислять индекс абстрактности корневых слов; n формировать уровни абстрактности; n совершать выборку по уровням абстрактности. n анализировать текст на основе полученных индексов абстрактности. 5
Составляющие задачи 6
Информация для анализа Необходимая информация предоставляется в виде трех разрозненных словарей: n БРУМС (Большой Русский Морфемный Словарь); n Частотный словарь; n Толковый словарь. 7
Индекс абстрактности Где: n N – количество слов с корнем R. n Qi(R)– частота использования k–ого слова; n Mi(R) – количество значений k–ого слова. 8
Конкретно-абстрактный анализ текста Где: n K – количество слов в тексте. n In(R)– индекс абстрактности N–ого слова; 9
Проблемы конкретноабстрактного анализа текста n n n Необходимы леммы; Лемма может быть не найдена в Национальном Корпусе Русского Языка; Лемм может быть найдено несколько. 10
Средства реализации и требования к программному обеспечению n n Проект реализован в среде Delphi 7. Требования к программному обеспечению: ОС Windows 2000, XP, Vista, 7; драйверы для работы с БД Firebird; MS Access; MS Excel. 11
Требования к аппаратному обеспечению Минимальные требования к аппаратному обеспечению: n процессор Pentium II; n 64 Мб оперативной памяти; n 200 Мб дискового пространства; n подключение к интернет. 12
Главное окно программы 13
Выборка и сортировка 14
Анализ текста 15
Окно выбора леммы 16
Структура базы данных 17
Схема взаимосвязи модулей 18
Результаты работы n n n Была реализована программа которая позволяет: загрузить данные из разрозненных словарей и сохранить их в базу данных; найти корни по схеме; вычислить индексы абстрактности; формировать уровни абстрактности; осуществить выборку по уровням абстрактности. осуществить анализ текста на основе полученных индексов абстрактности. 19
Результаты работы Основные результаты работы были доложены на Х международной конференции «Проблемы компьютерной лингвистики» . По материалам исследования была подготовлена статья, публикация которой планируется в сборнике работ данной конференции. 20
Диплом.pptx