Тема4.лексикография.ppt
- Количество слайдов: 33
Прикладные аспекты лексикографии и терминоведения Тема 4
Содержание Традиционная лексикография. Параметры типологизации словарей. Типы лексикографической информации, строение словаря и словарной статьи. Современные тенденции развития лексикографии. Конструирование словарей. Компьютерная лексикография. Словарные процессоры. СУБД и специализированные системы управления словарными базами данных. Автоматизированное построение словарей по тексту. Термин, терминология, терминосистемы и терминоэлементы. Терминологические тезаурусы. Важнейшие направления деятельности в терминоведении и терминографии. Мониторинг терминосистем и их стандартизация. Автоматизированный отбор терминов: определение информативности лексических и словосочетательных единиц.
Предмет лексикографии Лексикография наука, занимающаяся составлением словарей. традиционная (теория и практика составления словарей) машинная, компьютерная (создание автоматических словарей, лингвистических баз данных и программ поддержки лексикографических работ). Словарь определенным образом организованное собрание слов, обычно с приписанными им комментариями, в которых в стандартной для данного словаря форме (или формате) описываются особенности их структуры и/или функционирования. Объекты словарного описания: морфемы, слова, словосочетания различных типов — фразеологизмы (коллокации, поговорки, пословицы, идиомы, крылатые слова), цитаты и т. п. Объектом комментария может быть: семантическая (смысловая) структура слова, формальная структура слова.
История словарного дела Допечатные Первые словари — «глоссарии» составлялись на основе «глосс» списков трудных слов и появились еще в древности. Самые ранние глоссы известны с глубочайшей древности (шумерские глоссы — ~2500 лет до н. э. , китайские — ~2000 лет до н. э. ). «Эпинальский кодекс» VII в. н. э. Автор неизвестен, составлен как справочник для чтения латинских текстов. «Catholicon» ( «Католикон» ), или «Summa» был создан в Генуе в 1286 г. Автор доминиканский монах Иоанн Бальбус. (В 1460 г. Фуст и Шёффер опубликовали это уникальное издание в типографии Иоганна Гутенберга в Майнце). Самый ранний из сохранившихся русских глоссариев содержит 174 слова и относится к 1282 г. Описания итальянского вольгаре (народная латынь) — словарные списки Леонардо да Винчи
История словарного дела Печатные Середина XV в. возникновение книгопечатания > возникновение упорядоченной по алфавиту совокупности словарных ста тей Словарь Дж. Верини (1532 г. ) для обучения чтению и письму на итальянском. «Словарь к Декамерону» Л. Минерби, Венеция, 1535 г. «Лексис, сиречь речения вкратце собранны и из словенского [ц слав. ] языка на просты русский диялект истолкованы» Лаврентия Зизания (Тустановского), Вильно (Вильнюс), 1596 г.
История словарного дела Печатные Расцвет лексикографии и лингвистики в целом — XIX в. «Оксфордский английский словарь» (перв. изд. в 10 т. в 1884— 1928 гг. ). Переиздан в 1933 г. , 290 тыс. словарн. статей, Ной Уэбстер (Noah Webster), «Американскрий словарь английского языка» ( «An American Dictionary of the English Language» ), впервые опубликован в 1828 г. «Словарь французского языка» Эмиля Литре (Е. Littre. «Dictionnaire de la langue franchise» ), перв. изд. в 1863— 1872 гг. , второе — в 1956— 1958 гг. «Словарь современного французского языка» под ред. Жана Дюбуа и др. ( «Dictionnaire du franchise contemporaine» / Ed. par J. Dubois et al. 1967) Якоб и Вильгельм Гримм начали проект «Немецкого словаря» (Deutsches Worterbuch) (1854 1960 гг. ) «Большой немецкий словарь» под ред. Герхарда Вариха ( «Das
История словарного дела Основные словари современного русского языка: Толковый словарь русского языка Д. Н. Ушакова (19281940 гг. ) Словарь русского языка С. И. Ожегова (перв. изд. - 1949, с участием Н. Ю. Шведовой — в 1992 г. ) МАС — Словарь русского языка под ред. А. Евгеньевой (перв. изд. - 1957 -1960, переизд. - 1981 -1984 гг. ) БАС — Большой академ. словарь Новый объяснительный словарь синонимов / Ю. Д. Апресян и др.
Параметры типологизации словарей Базовое противопоставление в словарном деле — это разделение словарных изданий на: Энциклопедические словари. Объект описания— область понятий, фактов и реалий. Лингвистические или филологические словари. Объект описания— слова, их значения, особенности употребления, структурные свойства, сочетаемость, соотношение с лексическими системами других языков (для двуязычных словарей). Это противопоставление носит и формальный, и содержательный характер. Объединяют черты энциклопедических и лингвистических: Лингвострановедческие словари. Терминологические словари.
Параметры типологизации словарей По функциям и цели создания толковые словари разделяются на : Дескриптивные предназначены для полного описания лексики определенной сферы и фиксации всех имеющихся там употреблений. Нормативные рекомендуют, предписывают стандарт употребления слова, задают литературную норму. Этимологические – описывают историю происхождения слов. По характеру словника: Общие Частные. По способу организации: Алфавитные. Алфавитно гнездовые. Тезаурусные.
Параметры типологизации словарей По единицам описания: Синонимов Антонимов Омонимов Паронимов Ономастиконы
Параметры типологизации словарей Язык толковые словари, грамматические словари, обратные словари, ассоциативные словари, этимологические словари, исторические словари, ономастиконы Речь словари метафор и эпитетов, словари сочетаемости, словари трудностей, авторские словари Синхрония толковые словари, грамматические словари, обрат ные словари, словари метафор и эпитетов, словари сочетаемости и трудностей Диахрония исторические словари, диахронические словари, ав торские словари (часто), словари собственных имен (с этимологиями) Парадигматика толковые словари, грамматические словари, обратные словари, этимологические словари, исторические словари Синтагматика словари метафор и эпитетов, словари сочетаемости и трудностей Семантика толковые словари, исторические словари Прагматика лингвострановедческие словари, ассоциативные словари
Строение словаря. Вводная статья — информация о структуре словарной статьи. Словарная статья — элементарная единица словаря; каждый отдельно взятый объект описания словаря и сопоставленные ему словарные характеристики. Словник — все единицы, которые формируют область описания словаря и являются входами словарных статей. Указатели. Индексы. Список источников.
Строение словарной статьи. лексический вход словарной статьи/ вокабула /лемма зона грамматической информации зона стилистических помет зона значения: номер значения; дополнительные грамматические и стилистические пометы; зона толкования; зона примера/иллюстрации; зона оттенков значения. зона фразеологизмов зона этимологии.
Строение словарной статьи. 1. ВРЕМЕННАЯ ОСЬ 1. 1. ПРОШЛОЕ; ДАВНО → старость →старое (и)спокон веков/веку/века во время оно давным давно при царе Горохе (. . . ) РЕЧЕВЫЕ ФОРМУЛЫ было и/да быльем поросло много воды утекло [с тех пор]; сколько воды утекло 1. 2. НАСТОЯЩЕЕ →новое [стоять] на дворе (…) 1. 3. БУДУЩЕЕ светлое будущее/завтра со временем не за горами завтрашний день со дня на день на днях (. . . ) 2. ПАРАМЕТРЫ ВРЕМЕНИ 2. 1. БЫСТРОТА, СКОРОСТЬ 2. 1. 1. быстро, скоро, сразу, спешно → быстрое движение. . . → быстрота, легкость получения знания брать быка за рога по быстрому с быстротой молнии с первого взгляда; с полувзгляда вот (. . . )
Проблемы современной лексикографии Противоречия, затрудняющие эффективную традиционную лексикографическую практику: 1. Большой объем словаря, детализированное описание материала усложняет использование его в повседневной практике. 2. Детальное описание лексических значений требует значительных временных затрат, что влечет за собой изменение языковой и культурной ситуации, к которой относятся данные значения. 3. Интересные с точки зрения лексикографической теории словари, как правило, не обладают большим объемом. В результате, универсальные бумажные словари не отражают достижений теоретической лексикографии.
Предмет компьютерной лексикографии Основные направления компьютерной лексикографии: 1. автоматическое получение из текста с помощью компьютерных средств различных словарей (частотных, терминологических, конкордансов и т. д. ); 2. создание словарей, являющихся машинными версиями традиционных словарей; 3. создание словарей, специфичных только для сферы компьютерных технологий.
Традиционная технология Формирование словника словаря Корректура Перепечатка рукописи Поиск примеров и формирование картотеки Перепечатка рукописи Набор, вёрстка словаря Написание словарных статей Авторская доработка Корректура Создание рукописи словаря Перепечатка рукописи Редактирование словарных статей Печать словаря Словарь
каталожная карточка картотека иллюстративного материала проект словарной статьи формирование текста словаря
Возможности компьютерной лексикографии 1. Более широкие возможности представления лексикографической информации на основе различного рода новых технологий (например, технология гипертекста). 2. Использование для доступа к содержанию различных лингвистических технологий, таких как морфологический и синтаксический анализ, полнотекстовый поиск, распознавание и синтез звука и т. п. Это позволит значительно ускорить процесс получения информации пользователем. 3. Использование для уточнения и пополнения лексикографической информации коммуникационных технологий и других ресурсов, связанных единой коммуникационной сетью. Например, использование в работе языковых корпусов. 4. Использование для создания словарей на базе текстов компьютерных программ квантитативной обработки. В частности, для создания словников, частотных словарей возможно использование программы, используемых для проведения контент анализа.
Компьютерная технология Формирование корпуса текстов Создание словника Автоматическое формирование корпуса примеров Печать словаря Словарь Написание словарных статей Ввод словарных статей в базу данных Порождение текста словаря и форматирование оригинал макета Редактура словарных статей в БД Корректура текстов в БД
Автоматические словари Словарь в специальном машинном формате, предназначенный для использования пользователем компьютера или компьютерной программой обработки текста. Различаются: автоматические словари для конечного пользователя человека; автоматические словари для программ обработки текста
Стандарт автоматических переводных словарей 1) 2) 3) o o лексический вход (морфема, словосочетание в канонической форме); лексико грамматический класс (принадлежность к части речи; для словосочетаний часть речи определяется в зависимости от синтаксической функции); 2 а) лексико грамматический класс русского переводного эквивалента; морфолого грамматическая информация (включает не только информацию о словоизменении, но и о стандартных сокращениях заглавной единицы); 3 а) сокращения русского переводного эквивалента; тематическая рубрика и стилевая характеристика; индекс надежности перевода, отражающий степень общепринятости русского эквивалента (А эквивалент зафиксирован в каком либо из существующих стандартов; Б — эквивалент имеется в известных переводных словарях; В эквивалент зафиксирован в тетрадях новых терминов ВЦП; Г — переводной эквивалент представлен в переводах или предложен автором словарной статьи);
стандарт автоматических переводных словарей 6) 7) 8) 9) 10) 11) 12) 13) русские переводные эквиваленты (с порядковыми номерами); если перевода нет, то ставится специальный маркер и обязательно заполняется зона толкования; пояснительные пометы, уточняющие значение заглавной единицы; толкование заглавной единицы; примеры употребления; фразеологические сочетания с заглавной единицей; информация об авторе или редакторе словар ной статьи; источник переводного эквивалента; дата составления или редактирования словарной статьи.
Терминоведение и терминография Термин слово (словосочетание) метаязыка науки и приложений научных дисциплин, а также слово, обозначающее специфические реалии областей конкретной практической деятельности человека. В рамках одной теории термины образуют терминосистему. Свойства термина Однозначность (в рамках одной дисциплины). Экспрессивная и стилистическая нейтральность.
Терминоведение и терминография Терминоведение – направление в лингвистике, изучающее терминосистемы и функционирование терминов. Терминография – направление лексикографии, изучающее принципы построения терминологических словарей. Терминологический стандарт особый стандарт по организации терминосистем.
Современные компьютерные технологии позволяют разрабатывать терминологические банки данных (ТБД) по различным областям знания и сферам практической деятельности. По типу ТБД разделяются на: переводческие информационно-нормативные ТБД ВНИИКИ — Научно исследовательский институт комплексной информации по стандартизации и качеству. ТБД фирмы «Сименс» , включающий около двух с половиной миллионов терминологических записей на восьми языках мира.
Терминография По назначению и форме представления словарной информации: словари, предназначенные для человека, переводные толковые машинные словари, ориентированные на использование в компьютерных программах. информационно поисковые тезаурусы, частотные словари, рубрикаторы, классификаторы и пр.
фрагмент из ГОСТа «Коррозия металлов» Термин Определение Общие термины 1. Коррозия металлов. . . Разрушение металлов вследствие химического или электрохимического взаимодействия их с коррозионной средой. . . 12. Коррозионная Способность металла сопротивляться стойкость коррозионному воздействию среды
фрагмент тезауруса по системам безопасности БЕЗОПАСНОСТЬ Защитные конструкции Бронированные двери Бронекабины Конструкции с пуленепробиваемыми стеклами Одежда для служб безопасности Знаки различия Форменная обувь Форменная одежда Эмблемы ( ) ТРАНСПОРТ Автомобили Дополнительное оборудование автомобильная аудиотехника автомобильная сигнализация…
Источники лингвистической терминологии
Таксон тезаурусного описания Термины семиотики Ausdruck • план выражения, означающее, форма • signifying, significant, signifier Ausdrucksebene • план выражения, означающее, форма • signifying, significant, signifier Bezeichnende • означающее, план выражения • signifying, significant, signifier Bezeichnete • означаемое, план содержания • signified Designator • десигнатор • designator Inhaltsebene • план содержания, означаемое • signified Pragmatik • прагматика • pragmatics
литература Баранов А. Н. Введение в прикладную лингвистику. – М. , 2001. Марчук Ю. Н. Компьютерная лингвистика. – М. , 2007. Интернет ресурсы: Лингвистика в России, ресурсы для исследователей: Квантитативная лингвистика http: //uisrussia. msu. ru/linguist/_A 2_4_quantit_ling. jsp Языкознание. Компьютерная лексикография http: //yazykoznanie. ru/content/view/90/282/ Селегей В. Электронные словари и компьютерная лексикография http: //www. lingvoda. ru/transforum/articles/selegey_a 1. asp Филиппович Ю. , Чернышева М. Историческая компьютерная лексикография - terra incognita в компьютерном мире http: //www. computerra. ru/offline/1999/323/3379/


