Python-Script zum Aufspüren häufiger Tippfehler

Felix Schweighofer felix.schweighofer at googlemail.com
Mon Dec 27 11:42:23 CET 2010


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

[Frederik Schwarzer – 26.12.2010 22:06]
> [Felix Schweighofer - Wednesday 22 December 2010 20:22:16] 
>> Hi,
>>
>> ich habe aufgrund meiner doch recht häufigen Tippfehler ein kleines
>> Python-Script geschrieben, das diese aufspüren soll.
>>
>> Momentan findet es folgende potentielle Fehler:
>> - Englische Anführungszeichen in der Übersetzung
>> - Fehlende Anführungszeichen (einfach und doppelt)
>> - Fehlende Klammern (rund und eckig)
>> - Den Fehler "z.B." (ohne Leerzeichen)
>>
>> Das Skript ist leicht erweiterbar, wenn man sich mit regulären
>> Ausdrücken einigermaßen auskennt.
>>
>> Vielleicht kann es auch von Euch jemand brauchen, daher anbei die
>> Dateien. Ich wäre dankbar für Feedback und weitere reguläre Ausdrücke
>> zur Fehlersuche ;-)

Einer ist mir selber noch eingefallen: Doppelte Leerzeichen, Tabs oder
Kombinationen von beidem.

>>
>> Grüße,
>> Felix
>>
>> PS: Ich übernehme selbstverständlich keine Garantie ;-)
>> "i18n_check.py" in einen beliebigen Ordner kopieren, "checks.py" und
>> "__init__.py" in einen Unterordner "i18n"
>> Programmaufruf über /Pfad/zu/checks.py [Datei.po]
> 
> Gerade mal kurz getestet. :)
> 
> Die Checks für Klammern und ASCII-Anführungszeichen (englische sind noch
> etwas anders :)) produzieren vielleicht zu viele false positives.

Die Klammer-Checks funktionieren nur bei geschachtelten Klammern nicht
so, wie sie sollten; das habe ich nicht bedacht. Die Fehler sollten sich
allerdings zahlenmäßig in Grenzen halten.

ASCII-Anführungszeichen (Danke für den Hinweis ;)) verursachen aber
tatsächlich unnötige Hinweise, da sie in XML-Tags verwendet werden (z.
B. <keycombo action=\"simul\">&Ctrl;[...]. Den Test nehme ich mal raus,
da er je nach Datei sehr viele false positives anzeigen kann.

> 
> Ist das Script einfach anzupassen, sodass es auf einen Ordner losgelassen
> werden kann?

Ich bastel da mal was ...

> 
> Alternativ: Können die Dateinamen vor den Ergebnissen angezeigt werden?

Das sollte auch kein Problem sein.

> 
> Aber vorab ist es vielleicht eine gute Idee, auf Burkhards Rückkehr zu
> warten und mit ihm die Arbeit abzustimmen. Es kann sein, dass er Skripte
> hat, die diese Arbeit bereits erledigen.
> 
> MfG
> 

Ich mache erstmal weiter, wollte sowieso mal Python lernen ;-)

Grüße,
Felix
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.11 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org/

iEYEARECAAYFAk0YbYcACgkQYnmexcjIJ0UExgCeNM8fXcCvsxJ9ByFl2OXm0xI3
MyEAoIITMTloNyzXb7UUtm+zd/leRUip
=yy99
-----END PGP SIGNATURE-----


More information about the kde-i18n-de mailing list