[Kde-i18n-sr] О провери правописа

Часлав Илић caslav.ilic на gmx.net
Нед Јук 6 15:34:26 CEST 2008


Провера правописа у српском, она проста која само проверава да ли се реч по
реч садржи у правописном речнику, није толико корисна колико у енглеском,
због променљивости наших речи. На пример, испуштено слово у падежном
наставку често ће дати опет исправну реч саму за себе. Додатно у рачунарским
преводима, ту је и питање силних страних именица (програми, скраћенице) и
висећих падежних наставака ако се одвајају цртицом.

Па ипак, што се КДЕ-а 4 тиче, сустекло се неколико праваца да учине проверу
правописа кориснијом него обично.

Најпре, наравно, ту је српски речник за Аспел који омогућава целу причу.
Може се скинути са http://srpski.org/aspell/, а приправио га је Горан Ракић
(не знам да ли да кажем — одржава >:) Код мене на Дебијану инсталира се без
проблема, по упутству, Аспел га потом констатује без зановетања.

Даље, Аспел свакако може проверити било какву текстуалну датотеку, али се
тиме пропушта посебна структура ПО датотеке; обрнуто, ту је и Геттекстова
msgfilter, која тачно над сваким преводом у ПО датотеци извршава прозвољну
спољашњу наредбу. Али може то и нешто боље кад се оба елемента посматрају
заједно. У оквиру Пологије (http://nedohodnik.dyndns.org/misc/pology-doc/),
Себастјен Ренар, француски координатор, пре неког времена написао је
правописарско „сито“, које структуирано провлачи ПО датотеку кроз Аспел,
претходно обрађујући превод да издвоји све знане неречи, уз неколико начина
за пријаву грешака. Пологија се налази у ризници КДЕ-а, и да би се користила
потребно ју је само повући и допунити путању:

  $ svn co svn://anonsvn.kde.org/home/kde/trunk/l10n-kde4/scripts/pology
  $ export PATH=$PWD/pology/scripts:$PATH

На крају, ентитетско уметање свих личних имена и скраћеница, какво имамо у
српском преводу у саборним ПО-овима („истицање синтаксе &xml-g;“, „Отвори
&dolphin-i;“), чини преводе врло чистим за проверу правописа, јер
правописарско сито аутоматски уклања ИксМЛ-овско обележавање и ентитете.
Тако, испробавајући ових дана, ако изоставим неколико специфичних ПО-ова
(нпр. онај са временским зонама, или онај са називима језика) практично све
речи које добијам као погрешне или недостају у Аспеловом речнику, или су
нове транскрипције и изведенице (ресетовати, драјвер, двокликнути...), или
су — заиста погрешне. Ове прве треба пријавити Горану (пунонадежно :), друге
дописивати у Пологијин унутрашњи допунски речник (правописарско сито га
аутоматски увлачи према језику), тако да временом све више бивају
пријављиване само треће, непобитно погрешне речи. Овако раде Французи, да
ви'ш само неподношљиву тишину док насумице ситим њиховове ПО-ове...

Елем, у пракси. Пошто су Аспелов речник и Пологија постављени, одређени ПО
се просити овако:

  $ posieve.py check-spell -slist -sskip:'[a-z]' sr/internal/messages/kdebase/dolphin.po
  извртач
  Контекстни
  контекстном
  наредбено
  одржавалац
  потфасциклама
  потфасцикле
  премештњу
  Прошириве
  Самопокретање
  списковно
  филтерску
  $

где је опција -slist за прост списак погрешних речи, -sskip:'[a-z]' да се
прескоче све латиничне речи (тако да не морамо да допуњавамо Пологијин
унутрашњи речник свакаквим глупостима, као што морају Французи). Видимо овде
само једну стварно погрешну реч, „премештњу“, коју исправимо; остале можемо
да додамо у унутрашњи речник Пологије.

Локација тог унутрашњег речника је pology/l10n/sr/spell/dict.aspell, а
формат обичан списак речи, једна по реду:

  personal_ws-1.1 sr 41 UTF-8
  двокликните
  допуњавај
  ...
  убрзивачке
  филтерску

Нове речи је довољно само додати од краја (онај број у заглављу нема везе),
мада ваља и умањити почетно слово оних речи које нису личне именице (нпр.
„Контекстни“ -> „контекстни“), да не би биле опет пријављиване тамо где
почињу малим словом. Себастјен је још приправио и скрипту да у месту сортира
речи и уклања евентуалне дупликате, тако да после додавања можемо извршити:

  $ organizeDict.py pology/l10n/sr/spell/dict.aspell

Што се тиче прослеђивања узводно, Горану за уграђивање у Аспелов речник,
делује ми да би најефикасније било да он сам с времена на време прави
разлику Пологијиног унутрашњег речника и преузима речи пригодне за општи
речник. На крају крајева, ако би и сам користио Пологију за проверу (узгред,
пошто се ослања на Ц АПИ Аспела, много је бржа него msgfilter), то би било и
сасвим логично :)
-------------- следећи дио --------------
A non-text attachment was scrubbed...
Name: није доступно
Type: application/pgp-signature
Size: 189 bytes
Desc: This is a digitally signed message part.
Url : http://mail.kde.org/pipermail/kde-i18n-sr/attachments/20080706/6c42bfff/attachment.pgp 


Више информација о листи слања Kde-i18n-sr