Синтаксис - ромгерм - 1-2013.ppt
- Количество слайдов: 65
Синтаксис: предмет, разделы, объекты и задачи
греч. σύνταξις — построение, порядок, составление синтаксис Уровень языка Раздел науки о языке
Разделы⇦объекты Синтаксис слова Синтаксис предложения Синтаксис текста
ЗАДАЧИ СИНТАКСИСА • Объяснение устройства и СОБСТВЕННО НАУЧНЫЕ ПРИКЛАДНЫЕ функционирования мышления и коммуникации • Предсказующая классификация языковых единиц и единств • … • …
Задачи⇒угол зрения на объекты Обучение • русскому языку как родному и как неродному • русских учащихся иностранному языку Компьютерная обработка языка • разработка систем машинного перевода • разработка поисковых и информационных систем Перевод • деловой, технический, научный • художественный Редактирование и создание текстов на русском языке
Объекты + задачи Слово Предложение Текст Обучение Компьютер Перевод, редактирование, создание текстов
Обучение русскому языку Синтаксические проблемы
Ворона под землёй Новые слова: ворона, крыша, кататься, приносить На станции метро «Преображенская площадь» живет ворона. Её зовут Каркуша. Все, кто работает на станции, хорошо её знают. Ворона живёт здесь уже шесть лет. Она не хочет на улицу. Ворона очень любит кататься на поездах (на крыше, конечно) и не любит собак и кошек. Каждое утро, в пять часов тридцать минут, ворона встречает пассажиров. Подругипенсионерки приносят завтрак – колбасу, сыр, мясо. Хлеб ворона не ест.
Обучение Слово Текст На станции метро «Преображенская площадь» живет ворона. Ворона живёт здесь уже шесть лет. Её зовут Каркуша. На станции метро Предложение Хлеб ворона не ест. Все, кто работает на станции, хорошо её знают. Живет, зовут, работает, знает, встречают, любит, приносят, не ест очень любит кататься на поездах (на крыше, конечно)
Синтаксические проблемы машинного анализа текста
От анализа к синтезу Анализ текста на одном языке Синтез текста на другом языке Анализ текста Синтез его реферата на том же языке Анализ устного/письменного текста Синтез письменного/устного текста
Linguistic research based on real-life data has become more and more prominent during the last years. As a consequence, the need for corpora that are (i) large and (ii) richly annotated has grown as well. First, corpora that consist of real-life data such as newspaper texts or recorded dialogues must be large enough to offer enough instances of the phenomena under study. Second, many linguistic phenomena involve factors of different linguistic domains; for instance, word order in German is supposed to depend, among other things, on grammatical functions (syntax), thematic roles (semantic), information structure, and intonation (phonetics). Investigations of such phenomena require corpora that are annotated with detailed information at various linguistic levels
Prompt Лингвистическое исследование, основанное на реальных данных стало более видным в течение прошлых лет. Как следствие, потребность в корпусах, которые являются (i) большими и (ii) богато аннотируемый, росла также. Сначала, корпуса, которые состоят из реальных данных, типа газетных текстов или зарегистрированных диалогов, должны быть достаточно большими, чтобы предложить достаточно многие случаи явлений при исследовании. Во-вторых, много лингвистических явлений вовлекают факторы различных лингвистических областей; например, порядок слов на немецком языке должен зависеть, между прочим, на грамматических функциях (синтаксис), тематические роли (семантическая), информационная структура, и интонация (фонетика). Исследования таких явлений требуют корпусов, которые аннотируются с подробной информацией на различных лингвистических уровнях
Лингвистическое исследование, основанное на данных реальной жизни, стало еще и еще выдающийся в течение прошлых лет. Как последствие, потребность в массивах, которые (i) большие и (второй) богато аннотировано, росла также. Для начала, массивы, которые состоят из данных реальной жизни как например газетные тексты или записанные диалоги, должны быть большой достаточно, чтобы предложить достаточно образцов явлений под изучением. Во-вторых, много лингвистических явлений вовлекают факторы различных лингвистических областей; например, в немецком языке предполагают, что заказ слова зависит, среди других вещей, на грамматических функциях (синтаксис), тематических ролях (семантический), информационной структуре, и интонации (фонетика). Исследования таких явлений требуют массивы, которые аннотированы с детальной информацией на различных лингвистических уровнях.
Синтаксическая компрессия выбор более краткой и более простой синтаксической конструкции по сравнению с некоторой заданной в оригинале. К синтаксической компрессии можно отнести следующие приемы: (1) разбивка сложного предложения с несколькими придаточными на два или большее число предложений более простой структуры; (2) замена придаточного предложения причастным или предложным оборотом; (3) замена причастного оборота, весьма частого для ораторских выступлений, предложным оборотом (или существительным в косвенном падеже — для русского языка); (4) замена словосочетания одним словом, а также полного наименования государства или организации сокращением или аббревиатурой. Толковый переводоведческий словарь. М. : Флинта: Наука. Л. Л. Нелюбин. 2003.
Они шли в Изумрудный город по дороге, которая была вымощена желтым кирпичом Они шли в Изумрудный город по дороге, вымощенной желтым кирпичом Они шли в Изумрудный город по дороге из желтого кирпича. Стали отбирать у них книги, которые они привезли из родительских домов Стали отбирать у них книги, привезенные из родительских домов Стали отбирать у них книги из родительских домов.
Информационная компрессия - это сжатие плана означающего при сохранении плана означаемого (Н. С. Валгина, «Теория текста» ). Сжатие данного означающего Создание нового означающего
Структурное подразделение МГУ, ведущее подготовку специалистов по специальности «История искусств» , обязано обеспечивать гарантию качества подготовки, в том числе путем: - разработки стратегии обеспечения качества подготовки выпускников с привлечением представителей работодателей…
ДОЛОЙ!!! Лишние слова со значением наличия или появления: иметься, имеющий место, существующий, наблюдающийся, появляющийся и пр. Имеющиеся данные позволяют сделать вывод… Это коренным образом отличается от ситуации, имевшей место в Японии и Корее. В компании имеется 5 учебных центров, в которых может обучаться 1 700 человек → В 5 учебных центрах компании может обучаться 1 700 человек. Преимущества, которые возникают применении… → преимущества применении…
ДОЛОЙ!!! в зависимости от цели, с которой делается расчет, и способа, которым он производится . . . в зависимости от цели и способа расчета время, затрачиваемое на составление отчетности время на составление отчетности; требования, предъявляемые к работнику требования к работнику
ДОЛОЙ!!! успешное осуществление координации работа по внедрению деятельность по осуществлению мероприятий по реорганизации
Снятие неоднозначности – важнейшая задача машинного синтаксического анализа http: //habrahabr. ru/post/152799/ - «Он видел их семью своими глазами»
Он стрелял из окна Он стрелял из ружья Многие студенты и преподаватели пришли на собрание борьба с кем/чем? Эти типы стали есть в цехе. Человек человеку волк, а зомби. Косил косой. Василий ждёт Михаила. Он всегда опаздывает. Маша читала и писала письма. борьба против кого/чего?
«стали» , «стекло» - сущ. или глагол? «раме» - дательный или предложный? «стол» - именительный или винительный? «море» - МОР или МОРЕ? «надо» - предлог или модальное слово? «для» - предлог ДЛЯ или глагол ДЛИТЬ? «при» - предлог ПРИ или глагол ПЕРЕТЬ? «нежить» - …
Маша знает, что она красивая. Она знает, что Маша красивая.
Посмотреть дома! http: //slashzone. ru/parser/ - он-лайн синтаксический анализатор Система Abbyy Compreno
Перевод и редактирование
Перечень услуг над компьютерными играми может быть разной локализацией: - бумажная локализация; - частичная локализация; - поверхностная локализация; - полная локализация. Помимо самого программного продукта корректируются шрифты, если это какие-то арифметические выражения и формулы, то проверяется их корректность в работе с другими программами.
Существенным атрибутом любой игры является озвучивание, титры и главные герои. Не редко диалоги героев компьютерной игры носят не совсем тактичную для определенных регионов лексику, содержащую элементы расовой дискриминации или унижающие достоинство какой-нибудь страны. В этих случаях работники бюро переводов помимо непосредственного перевода осуществляют исправление текста согласно намеченному региону. Чтобы данный программный продукт было легче реализовать.
Юзабилити (удобство) - это совокупность дизайнерских и технических решений по обеспечению простоты, экономии времени, минимизации ошибок и иных действий направленных на комфортную работу пользователей с информацией. Видимость/находимость - это характеристика информационной архитектуры системы определяющей возможность нахождения пользователем интересующей информации.
Само приложение представляет собой иерархическую систему, на нижнем уровне которого находится CRM-сервер, устанавливаемый на Windows Server 2008. Благодаря средствам совместной работы, пользователям предоставляется возможность совместно работать с документами, задачами и событиями и упрощая общий доступ к контактной и иной информации. Система позволяет формировать из данных, необходимые печатные формы, как стандартных отчетных форм для Министерств и ведомств, также и печать различных статистических отчётов.
Использование ролей позволит сотрудникам университета предоставлять доступ только к тем данным, с которыми они могут работать в рамках учебного процесса. Языки, подобные С (включая С++), императивны по природе – в том смысле, что упор делается на состояние системы и изменениях, которые она претерпевает со временем. Конечно, если у вас есть объект, удерживающий файл открытым, и закрывает его в деструкторе, вам не нужно беспокоиться о том, закрыт файл или нет…
3 синтаксические задачи при редактировании Убрать ошибки Снять неоднозначность Сократить
Синтаксическая неоднозначность Заир - это та страна, где корпорации вытесняют небольшие частные компании. Он выстрелил в служанку графини, которая стояла на балконе. Американцы, которые любят свой флаг, вывешивают его на лужайке перед домом.
Синтаксическая неоднозначность Во время грозы старушка спрятала голову подушку, и не вынимала ЕЕ из-под НЕЕ, пока ОНА не кончилась.
Бастебл испытывал значительное напряжение, и хотя вмешательство его сводного брата ослабило его, он все еще находился под его влиянием.
При выпуске продукции допускаются мелкие дефекты. Окно не открывалось. Каждую ночь за складами ловили вора.
Обсуждение жилищных классов и коллективного потребления в 1960 -х и 1970 -х гг. натолкнуло социологов на мысль о том, что все большее значение приобретает расслоение людей в сфере потребления, а не в сфере производства. Если известна альтернативная стоимость использования пространства магазина, условие полноты продуктового ряда, скидка за представление бренда и поддержание розничных цен могут быть достаточными инструментами для достижения оптимальной прибыли производителя со значительной монопольной властью.
Синтаксические операции при переводе
It was erroneous to attribute increased malaria to mosquitoes having developed resistance to insecticides. Было ошибкой связывать рост заболеваемости малярией с тем, что москиты стали устойчивыми к инсектицидам.
Erroneous ошибка increased рост malaria заболеваемость малярией mosquitoes having developed resistance москиты стали устойчивыми прилагательное причастие существительное причастный оборот, в нем глагольно-именная перифраза с фазисным глаголом (дословно: развили устойчивость) существительное + существительное придаточное предложение, в нем составное сказуемое с фазисным глаголом и прилагательным
We must avoid common problems with data mining or data dredging that result in overfitting and failure of the predictive model to validate new subjects. Мы должны избегать широко распространенных проблем с минированием или драгированием данных, которые приводят к избыточной апроксимации (фитированию) и неспособности прогностической модели оценивать новые объекты. Необходимо избегать общих проблем, связанных с такими методами как извлечение или вычерпывание данных, которые приводят к чрезмерному соответствию и невозможности предсказательной модели подтверждать новые находки.
Налоговым органом были предъявлены претензии по неправомерному применению компанией вычета по налогу на добавленную стоимость по расходам на аренду. Ø The tax authority claimed that the company had wrongfully deducted its rent costs for VAT purposes.
ПРИ налогообложение taxation of real при покупке estate недвижимости acquisition/purchas e
Перечень кодов видов продовольственных товаров, облагаемых налогом на добавленную стоимость по ставке 10% при реализации на территории РФ List of codes for food products the sale of which is subject to VAT at a rate of 10% in Russia // … the sale of which attracts a VAT rate of 10% //. . . the sale of which attracts VAT at a rate of 10% // … the sale of which is VATable at a rate of 10%
Однажды играли в карты у конногвардейца Нарумова. Долгая зимняя ночь прошла незаметно; сели ужинать в пятом часу утра. Те, которые остались в выигрыше, ели с большим аппетитом; прочие, в рассеянности, сидели перед пустыми своими приборами. Но шампанское явилось, разговор оживился, и все приняли в нем участие.
There was a card party at the house of Narumov, an officer of the horse guards. The long winter night passed imperceptibly, it was close to five in the morning when the company sat down to supper. Those who had won were eating with good appetite; the others sat lost in thought before their empty plates. But champagne was brought in, and the conversation grew lively, with everyone joining in [Debreczeny 1983].
They were playing cards at the home of Narumov, of the Horse Guards. The long winter night went by without their perceiving it; it was going on five in the morning when they sat down to supper. Those who had come out ahead of the game ate with great appetite; the others sat in abstraction before their empty plates. But when champagne appeared, the conversation grew more lively, and everyone took part in it [Bronstein 1961].
Card playing was going on in the quarters of Narumov, an officer in the Horse guards. The long winter night passed imperceptibly; it was five in the morning when they sat down to supper. Those who had won, plied their forks eagerly, the rest sat in front of their empty places with an air of abstraction. But champagne was set on the table, the talk became lively and all took part in it [Moscow 1974].
Однажды играли в карты у конногвардейца Нарумова. Долгая зимняя ночь прошла незаметно; сели ужинать в пятом часу утра. Те, которые остались в выигрыше, ели с большим аппетитом; прочие, в рассеянности, сидели перед пустыми своими приборами. Но шампанское явилось, разговор оживился, и все приняли в нем участие. There was a card party at the house of Narumov, an officer of the horse guards. The long winter night passed imperceptibly, it was close to five in the morning when the company sat down to supper. Those who had won were eating with good appetite; the others sat lost in thought before their empty plates. But champagne was brought in, and the conversation grew lively, with everyone joining in [Debreczeny 1983].
Однажды играли в карты у конногвардейца Нарумова. Долгая зимняя ночь прошла незаметно; сели ужинать в пятом часу утра. Те, которые остались в выигрыше, ели с большим аппетитом; прочие, в рассеянности, сидели перед пустыми своими приборами. Но шампанское явилось, разговор оживился, и все приняли в нем участие. They were playing cards at the home of Narumov, of the Horse Guards. The long winter night went by without their perceiving it; it was going on five in the morning when they sat down to supper. Those who had come out ahead of the game ate with great appetite; the others sat in abstraction before their empty plates. But when champagne appeared, the conversation grew more lively, and everyone took part in it [Bronstein 1961].
Однажды играли в карты у конногвардейца Нарумова. Долгая зимняя ночь прошла незаметно; сели ужинать в пятом часу утра. Те, которые остались в выигрыше, ели с большим аппетитом; прочие, в рассеянности, сидели перед пустыми своими приборами. Но шампанское явилось, разговор оживился, и все приняли в нем участие. There was a card party in the rooms of Narumov, an officer of the Horse Guards. The long winter night had passed unnoticed and it was after four in the morning when the company sat down to supper. Those who had won enjoyed their food; the others sat absent-mindedly in front of the empty plates. But when the champagne appeared conversation became more lively and general [Edmonds 1962].
On jouait chez Naroumof, lieutenant aux gardes à cheval. Une longue nuit d’hiver s’était écoulée sans que personne s’en aperçût, et il était cinq heures du matin quand on servit le souper. Les gagnants se mirent à table avec grand appétit ; pour les autres, ils regardaient leurs assiettes vides. Peu à peu néanmoins, le vin de Champagne aidant, la conversation s’anima et devint générale. • (пер. Мериме) Card playing was going on in the quarters of Narumov, an officer in the Horse guards. The long winter night passed imperceptibly; it was five in the morning when they sat down to supper. Those who had won, plied their forks eagerly, the rest sat in front of their empty places with an air of abstraction. But champagne was set on the table, the talk became lively and all took part in it [Moscow 1974].
Создание текстов
Правила приёма в МГУ Лица, имеющие особые права при поступлении в высшие учебные заведения, установленные законодательством Российской Федерации, при подаче личного заявления о приеме дополнительно предоставляют оригиналы или ксерокопии соответствующих документов; в случае предоставления ксерокопий указанных документов предъявляются их оригиналы.
Неправильное использование неопределенно-личной конструкции приводит к конфликту ценностей. Обязанность сотрудника — знать «Основные правила делового поведения» , следовать им и сообщать о потенциальных нарушениях. В компании Х немедленно изучат заявление и не потерпят угроз или актов мести в адрес заявителя за сообщение данной информации.
Предметом изучения в курсе синтаксиса являются…
Принципы линеаризации смыслов в языке Принципы выбора и сочетания языковых единиц для построения связной речи Принципы использования коммуникативных единиц и единств в речевых ситуациях
Порядок слов; Синтаксические связи; Распределение информации по предложениям ⇒монопредикативные и полипредикативные конструкции; Синтаксическое функционирование падежных форм; Синтаксическое функционирование глаголов; Местоимения; Предлоги; Полнознаменательные и неполнознаменательные слова; Модели русских предложений, особенно специфичные…
Особенности русского синтаксиса Бесподлежащны е предложения Наполнение группы сказуемого признаками подлежащего Отсутствие формальных показателей определенности в сфере существительного (артикль) и актуальности в сфере глагола (континуальные формы)
Семинар 2
Поменяю свою жену! - Что сегодня приготовила твоя жена на обед? - Она сказала, что у нее было много работы, поэтому она не успела ничего приготовить. Купила пельмени в супермаркете. Я и сам могу купить пельмени – зачем мне жена? ! - Черт возьми! Она такая красивая и умная женщина – работает, убирает дом, ходит в театр и на концерты, может говорить о литературе, международных новостях. А моя жена всегда на кухне, всегда готовит – она стала толстая и глупая. - Слушай, но у тебя дома всегда есть вкусный обед, завтрак и ужин. Если хочешь, я готов поменять свою жену на твою жену, согласен?
Синтаксис - ромгерм - 1-2013.ppt