|
|
Расширенная система согласованных словарей и ее применение для смыслового кодирования и перевода многозначного исходного текста (продолжение)
Универсальное смысловое кодирование Универсальное смысловое кодирование (продолжение) Универсальное смысловое кодирование (приложения) Перевод кодированного исходного текста на целевые языки. Некоторые характерные примеры, поясняющие операции смыслового кодирования и перевода. Некоторые соображения общего характера. Перевод кодированного исходного текста на целевые языки. Процесс перевода выполняется в компьютере
читателя с помощью программы машинного перевода, в состав
которой входит основная программа перевода, содержащая
собственный традиционный двуязычный словарь, и специальная
подпрограмма, содержащая описанный выше с.д.с. - если в смысловом дополнении указано
дифференцированное (морфологическое) значение, то подпрограмма
выполняет перевод этого слова и других слов, связанных
с ним, с учётом этого значения, а именно: - если в смысловом дополнении к данному слову содержится дифференцированное (синтаксическое) значение, указывающее на то, что слово является обособленным определением к к.с. или обособленным обстоятельством к к.с., выражающему действие, то подпрограмма отыскивает это к.с. и затем выполняет перевод данного слова и других слов, связанных с ним в предложении, в синтаксической связи с к.с. ; в общем случае, подпрограмма трансформирует характер составных частей предложения таким образом, чтобы обеспечить в переведенном тексте прямую синтаксическую связь между данным словом и к.с. Полученный
перевод специальная подпрограмма передает основной программе,
включая грамматическую информацию, характеризующую употребление
перевода в целевом языке, а основная подпрограмма выполняет
грамматическое и синтаксическое согласование того или
иного полученного перевода с переводом текста в целом.
Некоторые характерные примеры, поясняющие операции смыслового кодирования и перевода. 1. Фразы, содержащие многозначные слова. а) Исх. текст: To clear up the cause of trouble. Из словарной статьи, приведенной в с.т.с. родного английского языка (см. приведенную ниже табл.), автор определил, что слово clear и соседние слова образуют словосочетание clear sth up и отметил в словарной статье одно из двух значений словосочетания в зависимости от смысла контекста; аналогично автор отметил одно из многих значений слова trouble. Служебная программа перенесла в исх. текст отмеченные автором значения, затем автор отметил границы словосочетания и выделил его жирным шрифтом. В результате получены следующие варианты кодированного текста и соответствующие варианты переводов, например, на русский язык (для краткости, варианты отделены друг от друга символом /):
б) Исх. текст: We’d better find out how the land lies before taking any action… В словарной статье land n автор отметил идиому see, etc. how the land lies, в которой могут употребляться разные глаголы; затем, автор указал границы и выделил жирным шрифтом слова, совпадающие с идиомой, включая глагол find out:
Из сравнения следует, что обычная программа МП не обнаружила словосочетание в данном тексте (из-за свободного словарного состава) и выполнила лишь пословный перевод.
в) Исх. текст (Deutsch): Also ich finde, da ist was dran. Из словарных статей, приведенных в с.т.с. родного немецкого языка, автор определил, что в предложении фигурирует словосочетание ich finde и словосочетание da ist etwas dran и отметил в словарной статье эти словосочетания их иллюстративные примеры; затем, автор указал границы словосочетаний. В результате получен следующий кодированный текст и его перевод на русский язык:
Как видим, обычная программа даёт пословный перевод.
2. Фразы, содержащие морфологически многозначные слова. Также для пояснения приведем характерные примеры исходного текста, которые касаются упомянутых дифференцированных (морфологических) значений слов. а) многозначность притяжательного местоимения-существительного mine (для краткости различные варианты исходной фразы отделены друг от друга символом //). Исх. текст: It is your pistol// your rifle //your gun? I was surprised by this question and I have answered: yes, it’s mine. Your photo is lovely than others – do you want to see mine? Из словарной статьи, приведенной в с.т.с. английского языка (см. табл.), автор определил, что местоимение mine (ours, yours) может в сочетании с контекстом выражать принадлежность человека мужского или женского пола или принадлежность неодушевленного объекта или принадлежность животного неопределенного пола или принадлежность того, что перечислено, но во множественном числе; выбор конкретной формы местоимения зависит от рода/числа контекстного существительного, заменяемого данным местоимением. В тех случаях, когда местоимение выражает принадлежность неодушевленного предмета или животного неопределенного пола, род в целевом языке может не совпадать с родом в исходном языке. В этих случаях всегда необходимо отмечать в исходном тексте контекстное существительное (c.w.), заменяемое данным местоимением. В приведенных ниже фразах автор отметил в с.т.с. то или иное значение местоимения mine и контекстное существительное, заменяемое данным местоимением. В результате получен следующий кодированный текст и его перевод на русский язык:
Как видим, в переводах, выполненных с учетом смысловых дополнений, формы местоимений соответствуют роду контекстных существительных, которые они заменяют; для сравнения - МП без учета смысловых дополнений:
Как видим, в переводах, выполненных без учета смысловых дополнений, формы местоимений не соответствуют роду контекстных существительных, которые они заменяют.
б) многозначность глагольных форм в англ. языке. Исх. текст: The bathyscaph was safely dipped on the ocean floor. The bathyscaph was safely dipped on the ocean floor during several hours. At last moment … The bathyscaph was safely dipped on the ocean floor during several hours. Из словарной статьи, приведенной в с.т.с. родного английского языка (см.табл.), автор определил, что во всех предложениях глагол dip употреблен в форме страдательного залога, причём в 1-м предложении говорится о состоянии, достигнутом в результате действий, а во 2-м и в 3-м предложениях говорится о действиях, т.к. в конце предложений указывается на интервал времени … during several hours. Далее, автор пришел к выводу о том, что в контексте второго предложения речь идет о действии несоверш. вида, а в контексте третьего предложения речь идет о действии соверш. вида. На основании выполненного анализа автор отметил в секции дифференцированных (морфологических) значений форму страдательного залога 2. passive form в разных вариантах. В результате получены следующие кодированные тексты:
Как видим, без учета смысловых дополнений не отражается фактический смысл контекста.
3. Фразы, обладающие синтаксической неоднозначностью. Наконец, приведем характерные примеры, которые касаются упомянутых дифференцированных (синтаксических) значений [12*]. Как было отмечено выше, использование синтаксических значений при смысловом кодировании позволяет исключить погрешности машинного перевода в трактовке таких исходных предложений, которые обладают синтаксической неоднозначностью или, точнее, синтаксической неполнотой. a) Исх. текст: Всё это была лишь идея, основанная на анализе исторических событий, опережающая время. Автор определил, что слово опережающая является частью обособленного удаленного определения к к.с. идея; на основании этого автор отметил в словарной статье опере|жать соответствующее синтаксическое значение (см. табл.), а также отметил к.с. идея.
В процессе машинного перевода специальная подпрограмма обнаружила, что слово опережающая входит в состав автономной части предложения – обособленного причастного оборота. На основании этого подпрограмма трансформировала характер составных частей предложения, а именно – преобразовала удалённый причастный оборот во второе самостоятельное предложение, которое дополнила к.с. идея (т.е. idea) и формальным именным составным сказуемым это была (т.е. it was). В результате получен следующий МП на английский язык, а также обратный перевод на русский язык:
Таким образом обеспечена прямая синтаксическая связь между словами идея и опережающая (idea and anticipatory); для сравнения - МП на английский язык (без учета смысловых дополнений):
Как видим, без учета дополнений, синтаксические связи в пословном переводе становятся неоднозначными, поскольку причастие anticipatory не имеет признаков рода и числа и может быть отнесено как к дополнению experiences, так и к слову idea.
Как было отмечено выше, в секциях дифференцированных (синтаксических) значений приняты следующие обозначения: к.с.* / c.w.* – определенное контекстное слово, которое автор должен отметить в исх. тексте. б) Исх. текст: The syntactic links characterize the some predicative (i.e. relating to a predicate) and non-predicative (i.e. including attributive, adverbial) syntactic relations. Автор определил: - слова predicative, non-predicative, attributive, adverbial являются обособленными определениями к слову relations(018), - слово relating является обособленным приложением к слову predicative(07), - слово including является обособленным приложением к слову non-predicative(013). На Фиг. 5 графически представлены достаточно сложные синтаксические связи в данной фразе.
На основании этого автор отметил в словарной статье слова predicative, non- predicative, а также в словарных статьях слов relate, include, attributive, adverbial синтаксические значения, а также отметил соответствующие контекстные слова. В результате получен следующий кодированный текст:
Таким образом, обеспечена прямая синтаксическая связь между всеми определениями/ приложениями и определяемыми словами. Для сравнения - МП на русский язык (без учета смысловых дополнений):
Как видим, в МП, выполненном без учета дополнений, нарушена связь между словами, а именно, обособленные определения/ приложения оторваны от слова отношения. Некоторые соображения общего характера. Служебная программа смыслового кодирования обладает некоторыми инициативными функциями, например, указывает автору на несовпадение употребления слова или словосочетания в исходном тексте и в отмеченном элементе словарной статьи, а также указывает автору на слова, пропущенные в процессе анализа исходного текста, но, возможно, обладающие той или иной неоднозначностью (см. Фиг. 3). Смысловое
кодирование не зависит от того, на какие целевые языки
потенциально будет осуществляться перевод: фрагмент словарной
статьи исполняет функцию кода - он дает точный путь от
отмеченного элемента к заглавному слову в толковом словаре,
и от заглавного слова к переводу этого элемента в любом
из согласованных двуязычных словарей. Создание
систем согласованных словарей требует усилий лингвистов,
но не связано с решением каких-либо трансцендентных задач. Кодированные исходные тексты (описания изобретений, научные статьи и т.п.), при их публикации в электронной форме могут содержать «невидимые», на первый взгляд, смысловые дополнения. Целесообразно тексты журнальных статей, описания изобретений, справочники, издаваемые в разных странах на родных языках, представлять также в виде файлов, содержащих универсальные смысловые дополнения; это касается также личных документов (автобиографий и т.п.), направляемых работодателям в различных странах. Очевидно, что все пользователи должны иметь программы машинного перевода, содержащие соответствующие согласованные двуязычные словари. В приложениях к данной статье представлены примеры универсального смыслового кодирования и перевода фраз, обладающих неоднозначностями различных типов, а именно: - фразы, содержащие семантически многозначные слова и словосочетания, включая также словосочетания с переменным лексическим составом и структурой; - фразы, содержащие морфологически многозначные глаголы, причастия, деепричастия, а также местоимения; - фразы, содержащие синтаксически неоднозначные обороты. Для сравнения в примерах также представлены и машинные переводы, полученные с помощью некоторых программ МП. Приведенные в указанных примерах фрагменты согласованных словарных статей составлены с использованием толковых словарей [5,6,7,11**,14] и двуязычных словарей [8,9,10,11,11***,13,15]; многозначные словосочетания и их толкования заимствованы в [4]; элементы, касающиеся дифференцированных (грамматических) значений местоимений и глаголов, составлены с использованием [11*,12]; элементы, касающиеся дифференцированных (синтаксических) значений, составлены на основании [12*]. Все фрагменты согласованных словарных статей имеют условный характер. далее: см. Приложения (примеры кодирования и перевода; фрагменты согласованных словарных статей)
Ссылки (References). специальные источники: 1. US Patent 5,285,386 Machine translation apparatus having means for translating
polysemous words using другие источники: 4. Кунин
А. В. (1967), Англо-русский фразеологический словарь,
Советская энциклопедия, М., 1233
– 1264 Published - July 2008 See also: "Experience of preliminary identification and translation of the text's fragments with use of the system of coordinated dictionaries" by Panich Iuli
E-mail this article to your colleague! Need more translation jobs? Click here! Translation agencies are welcome to register here - Free! Freelance translators are welcome to register here - Free! |
|
|
Legal Disclaimer Site Map |