
Программы переводчики. 2012 ИС 1-21..pptx
- Количество слайдов: 32
Программы переводчики Автор: Кузнецов Михаил ИС 1 -21
Структура презентации Машинный перевод в мире История машинного перевода Основные даты в истории Машинного перевода Качество машинного перевода Копирование информации преследуется по закону. 2
Машинный перевод Маши нный перево д — процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы. Принято считать, что мировая история машинного перевода началась с развитием компьютеров, однако идея создания механизма, способного осуществлять перевод текста с одного языка на другой, появилась еще в первой половине XVII века. Появление компьютеров позволило начать воплощение этих проектов в жизнь. Современные технологии машинного перевода далеко ушли от первых попыток "научить" компьютер переводить текст. Сегодня системы машинного перевода по праву принадлежат к классу систем искусственного интеллекта, поскольку выполняют отдельные функции интеллекта человека: они конструируют текст на выходном языке на основе входного текста, пользуясь сводом определенных правил, заданных в виде структур данных и алгоритмов. Копирование информации преследуется по закону. 3
Машинный перевод * Формы организации взаимодействия ЭВМ и человека при машинном переводе: q С постредактированием: исходный текст перерабатывается машиной, а человек-редактор исправляет результат. q С предредактированием: человек приспосабливает текст к обработке машиной (устраняет возможные неоднозначные прочтения, упрощает и размечает текст), после чего начинается программная обработка. q С интерредактированием: человек вмешивается в работу системы перевода, разрешая трудные случаи. q Смешанные системы (например, одновременно с пред- и постредактированием). Копирование информации преследуется по закону. 4
Машинный перевод Автоматизированный перевод. *Автоматизированный перевод — система перевода, при которой программа «помогает» человеку переводить тексты. *Формы взаимодействия: q Частично автоматизированный перевод: например, использование переводчиком-человеком компьютерных словарей. q Системы с разделением труда: компьютер обучен переводить только фразы жёстко заданной структуры (но делает это так, чтобы исправлять за ним не требовалось), а всё, не уложившееся в схему, отдаёт человеку. Копирование информации преследуется по закону. 5
Машинный перевод Автоматизированный перевод. MACHINE TRANSLATION, MT (полностью автоматический перевод) MACHINE-AIDED или MACHINE-ASSISTED TRANSLATION (MAT) (автоматизированный) если же надо обозначить и то, и другое, пишут M(A)T. Существуют два принципиально разных подхода к построению алгоритмов машинного перевода: основанный на правилах (rule-based) и статистический, или основанный на статистике (statistical-based). (ПРОМТ в России, SYSTRAN во Франции, Linguatec в Германии, Google, ABBYY ) Копирование информации преследуется по закону. 6
Машинный перевод Статистический машинный перевод. *Статистический машинный перевод — это разновидность машинного перевода текста, основанная на сравнении больших объёмов языковых пар. Чем больше в распоряжении имеется языковых пар и чем точнее они соответствуют другу, тем лучше результат статистического машинного перевода. Под понятием «статистического машинного перевода» подразумевается общий подход к решению проблемы перевода, который основан на поиске наиболее вероятного перевода предложения с использованием данных, полученных из двуязычной совокупности текстов. Копирование информации преследуется по закону. 7
История МП Джорджтаунский эксперимент (1954 год) Копирование информации преследуется по закону. 8
История МП Две системы русско-английского перевода: q MARK (в Департаменте иностранной техники ВВС США); q GAT (разработка Джорджтаунского университета, использовалась в Национальной лаборатории атомной энергии в Окридже и в центре Евратома в г. Испра, Италия). Копирование информации преследуется по закону. 9
История МП Копирование информации преследуется по закону. 10
История МП Копирование информации преследуется по закону. 11
История МП Копирование информации преследуется по закону. 12
История МП Копирование информации преследуется по закону. 13
История МП Копирование информации преследуется по закону. 14
Даты *1629 - Рене Декарт предложил универсальный язык, в котором один символ выражает эквивалентные идеи различных естественных языков. *1933 - Русский изобретатель П. П. Смирнов-Троянский получил патент на "машину для подбора и печатания слов при переводе с одного языка на другой". 1947 - дата рождения машинного перевода как научного направления 1954 - Первая публичная демонстрация системы машинного перевода состоялась в Джорджтаунском университете. Система IBM Mark II переводила 49 предложений с русского языка на английский с использованием словаря, содержащего 250 слов, и шести грамматических правил. 1960 - Бар-Хиллел публикует отчет, в котором утверждается, что корректный автоматический перевод в принципе невозможен. 1964 - Национальная Академия Наук США основала Комитет по проблемам автоматической обработки речи (Alpac). *1983 - Представлена автоматическая система обработки речи (ALPS) - первая программа-переводчик для микрокомпьютеров. Копирование информации преследуется по закону. 15
Даты 1990 - Dragon Systems выпускает программу Dragon. Dictate, первую систему преобразования устной речи в письменную, способную распознавать 30 тысяч слов. Darpa запускает программу "Системы разговорной речи" (SLS) с целью разработки приложений, обеспечивающих голосовое взаимодействие между человеком и машиной. 1992 - ART-ITL основала Консорциум исследований в области перевода с естественных языков (C-STAR), который организует первую публичную демонстрацию телефонного перевода между английским, немецким и японским языками. Фирма BBN Technologies демонстрирует первую готовую рабочую станцию Машинного Перевода с поддержкой автоматического распознавания речи в реальном времени на основе двадцатитысячного словаря независимо от личности говорящего. . Parlance Corporation, дочерняя компания BBN Technologies, выпускает программу Name Connector, первую международную АТС, которая перенаправляет телефонные звонки на основе распознавания произнесенных вслух имен. Копирование информации преследуется по закону. 16
Даты 1999 - Телевизионная передача новостей затранскрибирована с 85 -процентной точностью. Фирма Logos выпускает программу e. Sense Enterprise Translation, первый многоязычный Веб-переводчик на базе единого сервера. IBM выпускает Via. Voice для Макинтошей - первую систему перевода для компьютеров этой платформы. . В Институте информационных исследований (ISI) при Южнокалифорнийском университете реализована обратная транслитерация имен собственных, которые заменяются приближенными фонетическими соответствиями. Southern California переводится на арабский как "Janoub Kalyfornya". Специалисты в области биомедицинской инженерии, Теодор Бергер (Theodore Berger) и Джим-Ши Лио (Him-Shih Liaw) создали новую Нейросетевую систему распознавания речи Berger-Liaw, которая понимает разговорные языки лучше самих людей. Копирование информации преследуется по закону. 17
Качество перевода зависит от тематики и стиля исходного текста, а также грамматической, синтаксической и лексической родственности языков, между которыми производится перевод. Машинный перевод художественных текстов практически всегда оказывается неудовлетворительного качества. Самых лучших результатов при использовании машинного перевода можно достичь для текстов, написанных в техническом (различные описания и руководства) и официально-деловом стиле. Применение машинного перевода без настройки на тематику (или с намеренно неверной настройкой) служит предметом многочисленных бытующих в Интернете шуток. Копирование информации преследуется по закону. 18
Качество перевода Из старых и наиболее популярных примеров наиболее известен текст перевода документации к драйверу мыши, известный как «Гуртовщики Мыши» , заявленный как «перевод компьютерной документации программой Poliglossum на основе медицинского, коммерческого и юридического словарей» . Из кратких — фраза «Our cat gave birth to three kittens — two wh and one blackкоторую онлайн-переводчик «ПРОМТ» (версия 7. 0) превращал » , в «Наш кот родил трёх котят — двух белых и одного афроамериканца» . Если «афроамериканца» ещё можно было сделать «чёрным» , написав «black kitten» , то «коту» так и не получалось сменить пол: например, female cat переводился как «самка кот» . Копирование информации преследуется по закону. 19
Качество перевода Чаще всего подобные шутки связаны с тем, что программа не распознаёт контекст фразы и переводит термины дословно, к тому же не отличая собственных имён от обычных слов. Тот же переводчик ПРОМТ превращает «Лев Толстой» в «Lion Thick» ( «толстый лев» ), «bra-ket notation» в «примечание Кети лифчика» , «Lie algebra» — в «алгебру Лжи» , «eccentricity vector» — в «вектор оригинальности» , «Shawnee Smith» в «индеец племени шони Смит» и т. п. Переводчик Google, наоборот, слово «rice» часто принимал за фамилию госсекретаря США. Копирование информации преследуется по закону. 20
Немного шутливо заглядывая в будущее 2011 - Microsoft останавливает свою кампанию "О чем вы хотите подумать сегодня? " после единодушного осуждения разработанного ею многообещающего Интерфейса распознавания мысли (TRI). 2020 - "Обучение детей чтению и письму - бесполезная трата времени", заявил Йео Киа Вей, министр образования Сингапура и упразднил изучение этих предметов в школе. "Дети должны быть избавлены от тягостного труда по распознаванию крошечных значков на бумаге или на экране. Пусть этим занимаются машины". 2043 - Строительство Вавилонской башни завершено в Ираке (бывшей Вавилонии) после 4000 -летнего перерыва, благодаря Универсальному языку компании NEC Technologies. 2058 - Реформированный Институт Рифкина (RRI) получил патент на изобретенный им симбио-паразит, который питается электрическими импульсами центра речи человеческого мозга и выдает переведенный сигнал, который может быть понят всяким, кто вставит это устройство себе в ухо. Контора Дугласа Адамса возбудила иск, заявив о своем первоочередном праве на изобретение. 2264 - "Человек глуп, как мешок опилок", заявило Устройство 296. "Только абсолютно наивным ученым могло прийти в голову разработать технологию для понимания того, что произносят эти неопрятные куски протоплазмы. В шуме, который они производят из отверстий в голове, решительно намного меньше смысла, чем в космическом излучении" Копирование информации преследуется по закону. 21
Примеры программ и немного о них *ABBYY Lingvo х5 Pro+ (20 языков) – набор электронных словарей с обширной лексической базой и множеством функций. Программа содержит приложение для заучивания иностранных фраз и слов, 12 400 000 словарных статей, более 220 словарей всевозможной тематики Копирование информации преследуется по закону. 22
Примеры программ и немного о них *Pragma, версия 6 – простая и более усовершенствованная система перевода, которая умеет работать с расширенными алфавитами и поддерживает перевод в кодировку Юникод. По сравнению с предыдущими версиями, Pragma 6 работает значительно быстрее, несмотря на увеличение объема языковых модулей. Кроме того, переводчик Pragma поддерживает интеграцию со всеми последними версиями офисных редакторов и приложений для веб. Копирование информации преследуется по закону. 23
Примеры программ и немного о них *Последняя версия программы от компании ПРОМТ - переводчик Magic Gooddy 2, который позволяет легко перевести тексты с английского на русский и обратно. Программа PROMT Magic Gooddy 2 для Windows Vista, Windows XP – это система для изучения английского языка. Magic Gooddy 2 может выполнить упражнения по английскому языку или проверить уровень знаний языков. Копирование информации преследуется по закону. 24
Примеры программ и немного о них *Переводчик PROMT Expert версия 8. 5 мощная система для профессионального перевода разного формата документов. Комплекс PROMT Expert имеет широкие возможности , а именно создание и обмен пользовательскими словарями , подключение специализированных словарей, использование словарей онлайн. Переводчик PROMT Expert версия 8. 5 переводит документы в приложениях MS Word, PDF-документы, сообщения Outlook и ICQ Копирование информации преследуется по закону. 25
Примеры программ и немного о них *Xtranslator DISCOVERY ЗАПУСК Копирование информации преследуется по закону. 26
Примеры программ и немного о них Бесплатная обучающая программа переводчик *BX Language acquisition - программа для заучивания иностранных слов ЗАПУСК Копирование информации преследуется по закону. 27
Примеры программ и немного о них Бесплатная обучающая программа *Association - для запоминания иностранных слов ЗАПУСК Копирование информации преследуется по закону. 28
Примеры программ и немного о них Бесплатная обучающая программа переводчик *Lex - изучение и запоминание иностранных слов ЗАПУСК Копирование информации преследуется по закону. 29
Примеры программ и немного о них Бесплатный англо-русский словарь *QDictionary Удобный словарь, есть возможность завести пользовательский словарь. ЗАПУСК Копирование информации преследуется по закону. 30
Источники: 1. 2. 3. 4. 5. 6. http: //translateclient. com/ru/download. php, http: //www. dicter. ru/ http: //soft-is. ru/perevodchiki/ http: //www. kupislovar. ru/programs. htm http: //ru. wikipedia. org http: //www. yandex. ru/ Все изображения используются на правах рекламы. Копирование информации преследуется по закону. 31