[Kde-i18n-sr] О преводилачкој меморији и ПО зборнику

Уто Сеп 10 12:42:57 CEST 2009

Једна стандардна могућност преводилачких уређивача, без које (извежбани)
професионални преводиоци неће ни да почну да раде, јесте преводилачка
меморија (скр. ТМ¹). То је оно када уређивач скупља у унутрашњу базу све
доступне преводе, па кад преводилац скочи на непреведену поруку, добије са
стране предлоге за превод према сличности (изворног текста) са порукама у
ТМ-у. Такође, поруке са 100% сличности понекад могу бити аутоматски
преведене, тако да их преводилац уопште и не погледа. Циљ је убрзање како
превођења од нуле, тако и каснијих допуна.

Кад се ради са ПО датотекама, онда се уместо ТМ-а „на вези“ (као у горњем
пасусу) може користити и „пакетни“ ТМ. Прво, помоћу msgcat могу се све
доступне ПО датотеке стопити у једну, која се зове зборник (/compendium/).
Затим, при стапању ПО датотеке са шаблоном помоћу msgmerge тај се зборник
може задати као опција, тако да се и у њему траже исте и сличне поруке.
Разлика између ове две врсте ТМ-ова је онда та што пакетни аутоматски бира и
умеће (машински) најприближнији погодак, а навезни то препушта преводиоцу
(људски избор може бити бољи од машинског).

Лично нисам одушевљен описаном применом ТМ-ова, било једне било друге врсте,
тако да их до сада нисам ни користио.² Сметају ми две ствари: опасност по
квалитет и прекидање тока мисли (што води снижењу ефикасности).

Опасност по квалитет следи из 100% сличних, тј. тачних погодака из ТМ-а,
које преводилац често после не погледа. Ако је текст дужи (пуна реченица,
пасус), онда је тачан погодак у реду; међутим, оваквих тачних погодака је
врло мало. Много су чешћи тачни погоци подреченичних порука, до једне-две
речи, а такви се *морају* накнадно прегледати (/New/, /Default/, /Very
Small/, /View Properties/) на контекст.

Док иде од потпуно непреведене до непреведене, преводилац упада у стање
тока: разуми извор, разуми контекст, преведи. Ако упадне мутна порука
(пакетни ТМ) или предлози са стране (ТМ на вези), онда преводилац мора
додатно да анализира разлике у извору, што прекида претходни ток, и чини
превођење мање угодним. Наравно, циљ је да тај прекид буде надомештен
уштеђеним временом у односу на превођење поруке од нуле, али то значи
следеће: ако преводилац одлучи да просто обрише превод мутне поруке, или
утроши пуно времена прегледајући предлоге, циљ је промашен. Зато ТМ треба да
издаје само квалитетне предлоге, а анализа разлика треба да је што лакша
(замислимо пасус који се од предлога разликује само у једној, али кључној
речи).

Из претходног ценим да најбоља примена ТМ-а треба да изгледа овако:

* за сваку поруку треба да се изда тачно један добар погодак, ако га има,
  или ниједан;

* за сваки тачан погодак, не сме да дође до тога да преводилац не прегледа
  поруку ако је довољно кратка;

* за сваки приближан погодак, мора да се добије квалитетна разлика међу
  изворним текстовима.

Постојеће алатке према овоме стоје овако.

Типичан ПО уређивач, који издаје по више предлога из ТМ-а и не даје разлику
у извору, јесте *лош*; саветујем: заобићи употребу ТМ-а. Локализуј издаје по
више предлога, али за сваки да разлику; саветујем: гледати само први погодак
(који је најприближнији). Ни случајно не спроводити „груби превод“ (један
аутоматски пролаз који прави мутне поруке) било којим ПО уређивачем, како би
се избегли аутоматски тачни погоци на кратке поруке.

Употреба ПО зборника при стапању (msgmerge) по дефиницији издаје тачно један
(мућење поруке) или ниједан предлог. Али, тај један предлог је често исувише
удаљен од потребног (квари ток), а ту је и опасност од тачних погодака за
кратке поруке; саветујем: заобићи употребу ПО зборника при стапању.

Како их је онда најбоље употребити?

Прво, користити ПО уређивач који уме да издаје разлику између садашњег и
претходног изворног текста у мутним порукама (нпр. Локализуј; заправо не
знам који још тренутно ово уме³), или уређивач текста који уме да истиче
угњежђење разлике (К-писање одн. Кејт; имам спремну и закрпу за Гедит, али
се још није јавио нико коме би требала).

Друго, пре почетка рада на ПО датотеци (било општим било ПО уређивачем),
стопити је саму са собом уз употребу зборника, али са додатним ограничењима
на поготке: мућењем прекратких тачних погодака, и чишћењем дела мутних
порука које не прођу допунску процену приближности. Ово ради Пологијина
скрипта poselfmerge. На пример:

  $ poselfmerge foobar.po -C compendium.po -W 7 -A 0.8 --no-wrap

Ово ће помутити сваки тачан погодак испод 7 речи (у извору), а очистити
сваку мутну поруку чија је допунска приближност испод 0,8. У овом тренутку
се такође може нормализовати прелом (најбоље: без основног, али с финим
преломом). Ове опције могу се трајно задати у ~/.pologyrc:

  [poselfmerge]
  min-words-exact = 7
  min-adjsim-fuzzy = 0.8
  wrap = no
  fine-wrap = yes

(Другим речима, ако ПО уређивач и пружа могућност ТМ-а, *не* користити је;
осим ако, наравно, сама по себи не функционише еквивалентно овом.)

Треће, само ако се преводи општим уређивачем текста, провући овако
самостопљену ПО датотеку кроз сито diff-previous:

  $ posieve diff-previous foobar.po

Потом приступити, надам се, удобном превођењу :)

(О састављању и одржавању ПО зборника у наредној поруци, имам ту неких
недоумица. На брзину: додао сам скрипту .../sr/compendium/gencomp-kde-sr.sh,
коју само треба извршити без аргумената, и направиће фајл зборника
comp-kde-sr.po у истом директоријуму.)

----------

[1] /TM/ није тако непрозирна скраћеница, развој има тачно значење, и
стручна је реч — да је преведемо онда, ‘ПМ’?

[2] Без обзира на образложење које следи, професионалним преводиоцима ова
изјава може звучати бесловесно. Али треба имати у виду следеће: ако се не
ради са ПО датотекама (пуни циклус: извлачење, стапање, допуњавање), онда је
ТМ једина спона између две различите верзије датотеке за превод. Без ТМ-а,
преводилац би морао ручно да тражи раније преводе у претходној верзији
датотеке док преводи нову од нуле. Како професионални преводиоци мало или
уопште не раде са ПО датотекама, ТМ им је прека потреба, а не опциона
погодност.

[3] Дођавола, ред је да и остали ПО уређивачи почну да издају разлике на
мутним порукама. Имао сам прилике да се нагледам гадних грешака очигледно
насталим недовољно брижљивим одмућивањем дугих порука у недостатку разлика.
-------------- следећи дио --------------
A non-text attachment was scrubbed...
Name: није доступно
Type: application/pgp-signature
Size: 197 bytes
Desc: This is a digitally signed message part.
Url : http://mail.kde.org/pipermail/kde-i18n-sr/attachments/20090910/fa1bd7f6/attachment.sig