Знаймо

Додати знання

приховати рекламу

Цей текст може містити помилки.

Машинний переклад



План:


Введення

Не слід плутати з Автоматизований переклад.

Машинний переклад - процес перекладу текстів (письмових, а в ідеалі і усних) з одного природної мови на іншій за допомогою спеціальної комп'ютерної програми. Так само називається напрям наукових досліджень, пов'язаних з побудовою подібних систем.


1. Форми організації взаємодії ЕОМ і людини при машинному перекладі

  • З постредагуванні: вихідний текст переробляється машиною, а людина-редактор виправляє результат.
  • З предредактірованіем: людина пристосовує текст до обробки машиною (усуває можливі неоднозначні прочитання, спрощує і розмічає текст), після чого починається програмна обробка.
  • З інтерредактірованіем: людина втручається в роботу системи перекладу, дозволяючи важкі випадки.
  • Змішані системи (наприклад, одночасно з перед-і постредагуванні).

1.1. Автоматизований переклад

Замість "машинний" іноді вживається слово автоматичний, що не впливає на зміст. Проте термін автоматизований переклад має зовсім інше значення - при ньому програма просто допомагає людині перекладати тексти.

Автоматизований переклад передбачає такі форми взаємодії:

  • Частково автоматизований переклад: наприклад, використання перекладачем-людиною комп'ютерних словників.
  • Системи з розподілом праці: комп'ютер навчений перекладати тільки фрази жорстко заданої структури (але робить це так, щоб виправляти за ним не було потрібно), а все, не вкластися в схему, віддає людині.

В англомовній термінології також розрізняються терміни англ. machine translation, MT (Повністю автоматичний переклад) і англ. machine-aided або англ. machine-assisted translation (MAT) (Автоматизований); якщо ж треба позначити і те, і інше, пишуть M (A) T.

Існують два принципово різних підходи до побудови алгоритмів машинного перекладу: заснований на правилах (rule-based) і статистичний, або заснований на статистиці (statistical-based). Перший підхід є традиційним і використовується більшістю розробників систем машинного перекладу (ПРОМТ в Росії, SYSTRAN у Франції, Linguatec в Німеччині та ін) [1] До другого типу відносяться популярний сервіс Перекладач Google [2], а також новий сервіс від ABBYY [3 ]


2. Статистичний машинний переклад

Статистичний машинний переклад - це різновид машинного перекладу тексту, заснована на порівнянні великих обсягів мовних пар. Мовні пари - тексти, що містять пропозиції на одній мові і відповідні їм пропозиції на другому, можуть бути як варіантами написання двох пропозицій людиною - носієм двох мов, так і набором пропозицій та їх перекладів, виконаних людиною. Таким чином статистичний машинний переклад має властивість "самонавчання". Чим більше в розпорядженні є мовних пар і чим точніше вони відповідають один одному, тим краще результат статистичного машинного перекладу. Під поняттям "статистичного машинного перекладу" мається на увазі загальний підхід до вирішення проблеми перекладу, який заснований на пошуку найбільш ймовірного перекладу пропозиції з використанням даних, отриманих з двомовної сукупності текстів. В якості прикладу двомовної сукупності текстів можна назвати парламентські звіти, які являють собою протоколи дебатів у парламенті. Двомовні парламентські звіти видаються в Канаді, Гонконгу та інших країнах; офіційні документи Європейського економічного співтовариства видаються на 11 мовах; а Організація об'єднаних націй публікує документи на декількох мовах. Як виявилося, ці матеріали являють собою безцінні ресурси для статистичного машинного перекладу.


3. Історія машинного перекладу

Думка використовувати ЕОМ для перекладу була висловлена ​​в 1947 в США, відразу після появи перших ЕОМ. Перша публічна демонстрація машинного перекладу (так званий Джорджтаунський експеримент) відбулася в 1954. Незважаючи на примітивність тієї системи (словник в 250 слів, граматика з 6 правил, переклад декількох простих фраз), цей експеримент отримав широкий резонанс: почалися дослідження в Англії, Болгарії, НДР, Італії, Китаї, Франції, ФРН, Японії та інших країнах; в тому ж 1954 році і в СРСР.

До середини 1960-х в США для практичного використання були надані дві системи російсько-англійського перекладу:

  • MARK (у Департаменті закордонної техніки ВПС США);
  • GAT (розробка Джорджтаунського університету, використовувалась у Національній лабораторії атомної енергії в Окриджі і в центрі Євратому в м. Іспра, Італія).

Однак створена для оцінки подібних систем комісія ALPAC прийшла до висновку, що в силу низької якості машинно перекладених текстів ця діяльність в умовах США нерентабельна. Хоча комісія рекомендувала продовжувати та поглиблювати теоретичні розробки, в цілому її висновки призвели до зростання песимізму, зниженню фінансування, часто до повного припинення робіт з цієї тематики.

Тим не менш, у ряді країн дослідження тривали, чому сприяв постійний прогрес обчислювальної техніки. Особливо суттєвим чинником стала поява міні-і персональних комп'ютерів, а з ними все більш складних словникових, пошукових і т. п. систем, орієнтованих на роботу з природномовних даними. Росла і необхідність в перекладі як такому зважаючи на зростання міжнародних зв'язків. Все це призвело до нового підйому цієї галузі, наступившему приблизно з середини 1970-х. В 1980-і настав час широкого практичного використання перекладацьких систем, склався ринок комерційних розробок по цій темі.

Втім, мрії, з якими людство півстоліття тому взялося за завдання машинного перекладу, в значній мірі залишаються мріями: високоякісний переклад текстів широкої тематики і раніше недосяжний. Однак безсумнівним є прискорення роботи перекладача при використанні систем машинного перекладу: за оцінками кінця 1980-х, до п'яти разів.

В даний час існує безліч комерційних проектів машинного перекладу. Одним з піонерів в області машинного перекладу була компанія Systran. В Росії великий внесок у розвиток машинного перекладу внесла група під керівництвом проф. Р. Г. Піотровського ( Російський державний педагогічний університет імені А. І. Герцена, Санкт-Петербург).


4. Якість перекладу

Якість перекладу залежить від тематики та стилю вихідного тексту, а також граматичної, синтаксичної та лексичної спорідненості мов, між якими проводиться переклад. Машинний переклад художніх текстів практично завжди виявляється незадовільної якості. Тим не менше для технічних документів при наявності спеціалізованих машинних словників і деякому настроюванні системи на особливості того чи іншого типу текстів можливе отримання переказу прийнятної якості, який потребує лише невеликий редакторської коригуванню. Чим більше формалізований стиль вихідного документа, тим більшого якості перекладу можна очікувати. Найкращих результатів при використанні машинного перекладу можна досягти для текстів, написаних в технічному (різні описи та руководства) і офіційно-діловому стилі.

Застосування машинного перекладу без налаштування на тематику (або з навмисно невірної налаштуванням) служить предметом численних існують у Інтернеті жартів. Зі старих і найбільш популярних прикладів найбільш відомий текст перекладу документації до драйверу миші, відомий як "гуртівника Миші", заявлений як "переклад комп'ютерної документації програмою Poliglossum на основі медичного, комерційного і юридичного словників" [4]. З коротких - фраза " Our cat gave birth to three kittens - two whites and one black ", Яку онлайн-перекладач" ПРОМТ "(версія 7.0, 2007) перетворював на "Наш кіт породив трьох кошенят - двох білих і одного афроамериканця ". [5] Якщо "афроамериканця" ще можна було зробити "чорним", написавши " black kitten ", То" коту "так і не виходило змінити стать: наприклад, female cat перекладався як "самка кіт".

Найчастіше подібні жарти пов'язані з тим, що програма не розпізнає контекст фрази і перекладає терміни дослівно, до того ж не відрізняючи власних імен від звичайних слів. Той же перекладач ПРОМТ перетворює "Лев Толстой" в "Lion Thick" ("товстий лев"), " bra-ket notation "в" примітка Кеті ліфчика "," Lie algebra "- в" алгебру Брехні "," eccentricity vector "- в" вектор оригінальності "," Shawnee Smith "в" індіанець племені Шоні Сміт "і т. п. Перекладач Google, навпаки, слово " rice "Часто брав за прізвище держсекретаря США.


Примітки

  1. Машинний переклад: правила проти статистики - filolingvia.com/publ/25-1-0-898
  2. Перекладач Google - translate.google.ru /
  3. Новий підхід ABBYY до перекладу текстів - joomla-master.org/books/html-css-php-cms/perevesti-tekst-v-onlaiene-pomojet-kompaniya-abbyy.html
  4. Втім, це не так: Polyglossum ( sic) - це електронний словник [1] - www.polyglossum.com / pg / r / index.htm, програма того ж класу, що і Lingvo, відповідно, самостійно перекладати не здатна. У той час він існував у версіях для DOS і Windows 3.x і, поступаючись Lingvo і Context за якістю загального словника, мав рекордний обсяг спеціалізованих словників. До того ж окремі помилки перекладу видають підробку - після машинного перекладу текст редагувався вручну [2] - offline.computerra.ru/1999/325/2720 /: "Чудовий приклад тексту, отриманого нібито за допомогою медико-біологічного словника в результаті перекладу керівництва по роботі з драйверами миші, називається "гуртівника Миші" ... не вірю в чистоту експерименту: напевно там не обійшлося без поправок, внесених до тексту рукою людини. "
  5. Наш кіт породив трьох кошенят - двох білих і одного афроамериканця - ivannikitin.com/2007/06/15/наш-кот-родил-трех-котят-двух-белых-и-о /

Цей текст може містити помилки.

Схожі роботи | скачати

Схожі роботи:
Машинний нуль
Машинний код
Переклад
Еквірітміческій переклад
Юридичний переклад
Технічний переклад
Переклад з шепталом
Реферативний переклад
Послідовний переклад
© Усі права захищені
написати до нас