Примеры.работы.с.WordTabulator.ppt
- Количество слайдов: 14
Примеры работы с Word. Tabulator
EX-1. Особенности расчета частоты при пересечении множеств
Дано: тексты из папок …texts Dialog-2010_1 -50_txt и …texts Dialog-2010_51 -93_txt Задача: сравнить результаты пересечения [1 -50] ∩ [51 -93] и [51 -93] ∩ [1 -51].
Ход решения. 1. 1. Создаем и наполняем папки сравниваемых подмножеств Папка 1 -50 содержит ссылки на файлы из …texts Dialog-2010_1 -50_txt Папка 51 -93 содержит ссылки на файлы из …texts Dialog-2010_51 -93_txt
1. 2. Определяем настройки для создания упорядоченного по убыванию частоты ЧС общих словоформ [1 -50] ∩ [51 -93].
1. 3. Сохранив настройки, запускаем программу и получаем ЧС общих словоформ [1 -50] ∩ [51 -93]. --------2. 1. Меняем местами папки 1 -50 и 51 -93 (перетаскиваем мышкой в главном окне Word. Tabulator). 2. 2. Меняем имя результата и запускаем программу и получаем ЧС общих словоформ [51 -93] ∩ [1 -51]. [1 -50] ∩ [51 -93] Сравнение результатов покажет, что входы словарей идентичны, а частоты – не совпадают (см. первые 10 входов обоих словарей). [51 -93 ∩ [1 -50] ] Причина: при операции пересечения частота дается по множеству входных текстов. 1. 5935 в 1. 5594 в 2. 4742 и 2. 3911 и 3. 1934 с 3. 1699 с 4. 1682 на 4. 1560 на 5. 1388 не 5. 1368 the 6. 1324 а ! 6. 1310 не 7. 1186 для 7. 1205 а 8. 1141 что 8. 1002 для 9. 914 как 9. 916 что 10. 792 по 10. 801 of … …
EX-2. Примеры поисковых шаблонов
А. Шаблон для ЧС предлогов с, в, для, от, при. !Тип элемента: слово. Пример результата: # част. Элемент 1. 5594 в 2. 1699 с 3. 1002 для 4. 480 при 5. 404 от 9179
Б. Шаблон для ЧС двухкомпонентных «словосочетаний» со словоформой на –ные. !Тип элемента: словосочетание из 2 -х элементов. Пример результата (фрагмент): # част. элемент 1. 1 абсолютные величины 2. 1 автономные метафоры 3. 1 административные штампы … 1624. 1 l-граммные спектры 1625. 1 php корпусные 1626. 1 y дополнительные 2001
В. Шаблон для поиска правого и левого окружения слова корпус. !Тип элемента: словосочетание из 3 -х элементов. Комментарий. Маска * корпус* * избыточна, так как по ней будет построен ЧС и для правого/левого окружения слова корпусный. Приведенная выше маска определяет только словоформы слова корпус. Альтернативная маска: прописать в столбик все уникальные по форме словоформы слова корпус. Пример результата (фрагмент): # част. Элемент 1. 3 национальный корпус русского 2. 2 звуковой корпус русского 3. 1 аннотированный корпус чешского …
EX-3. ЧС для словоформ на латинице
Дано: тексты из папки …texts Dialog-2010_1 -50_txt Задача: получить ЧС словоформ на латинице.
Решение-1. Загружаем тексты и определяем кодировку ASCII (кириллица игнорируется). Запускаем программу.
Решение-2. Загружаем тексты и определяем маску вида «звездочка + знак гласного + звездочка» . Запускаем программу.
Примеры.работы.с.WordTabulator.ppt