Python-Script zum Aufspüren häufiger Tippfehler

Felix Schweighofer felix.schweighofer at googlemail.com
Mon Dec 27 18:43:52 CET 2010


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

[Felix Schweighofer – 2010-12-27 11:42]
> [Frederik Schwarzer  26.12.2010 22:06]
>> [Felix Schweighofer - Wednesday 22 December 2010 20:22:16] 
>>> Hi,
>>>
>>> ich habe aufgrund meiner doch recht häufigen Tippfehler ein kleines
>>> Python-Script geschrieben, das diese aufspüren soll.
>>>
>>> Momentan findet es folgende potentielle Fehler:
>>> - Englische Anführungszeichen in der Übersetzung
>>> - Fehlende Anführungszeichen (einfach und doppelt)
>>> - Fehlende Klammern (rund und eckig)
>>> - Den Fehler "z.B." (ohne Leerzeichen)
>>>
>>> Das Skript ist leicht erweiterbar, wenn man sich mit regulären
>>> Ausdrücken einigermaßen auskennt.
>>>
>>> Vielleicht kann es auch von Euch jemand brauchen, daher anbei die
>>> Dateien. Ich wäre dankbar für Feedback und weitere reguläre Ausdrücke
>>> zur Fehlersuche ;-)
> 
> Einer ist mir selber noch eingefallen: Doppelte Leerzeichen, Tabs oder
> Kombinationen von beidem.
> 
>>>
>>> Grüße,
>>> Felix
>>>
>>> PS: Ich übernehme selbstverständlich keine Garantie ;-)
>>> "i18n_check.py" in einen beliebigen Ordner kopieren, "checks.py" und
>>> "__init__.py" in einen Unterordner "i18n"
>>> Programmaufruf über /Pfad/zu/checks.py [Datei.po]
> 
>> Gerade mal kurz getestet. :)
> 
>> Die Checks für Klammern und ASCII-Anführungszeichen (englische sind noch
>> etwas anders :)) produzieren vielleicht zu viele false positives.
> 
> Die Klammer-Checks funktionieren nur bei geschachtelten Klammern nicht
> so, wie sie sollten; das habe ich nicht bedacht. Die Fehler sollten sich
> allerdings zahlenmäßig in Grenzen halten.

So, fertig gebastelt (Jaja, hat gedauert) ;-)
Fehlende Klammern sollten jetzt auch bei Verschachtelung korrekt erkannt
werden, damit sollte sich hier das Problem mit false positives erledigt
haben :-)

> 
> ASCII-Anführungszeichen (Danke für den Hinweis ;)) verursachen aber
> tatsächlich unnötige Hinweise, da sie in XML-Tags verwendet werden (z.
> B. <keycombo action=\"simul\">&Ctrl;[...]. Den Test nehme ich mal raus,
> da er je nach Datei sehr viele false positives anzeigen kann.
> 
> 
>> Ist das Script einfach anzupassen, sodass es auf einen Ordner losgelassen
>> werden kann?
> 
> Ich bastel da mal was ...

Ordner direkt gehen nicht, aber das lässt sich ja leicht in der Shell
mit Wildcards lösen: i18n_check.py Ordner/*

> 
> 
>> Alternativ: Können die Dateinamen vor den Ergebnissen angezeigt werden?
> 
> Das sollte auch kein Problem sein.

Jetzt werden Dateinamen angezeigt, falls mehr als eine Datei als
Parameter angegeben wird.

> 
> 
>> Aber vorab ist es vielleicht eine gute Idee, auf Burkhards Rückkehr zu
>> warten und mit ihm die Arbeit abzustimmen. Es kann sein, dass er Skripte
>> hat, die diese Arbeit bereits erledigen.
> 
>> MfG
> 
> 
> Ich mache erstmal weiter, wollte sowieso mal Python lernen ;-)

Ich habe jetzt auch noch einen Fehler behoben, der verhindert hat, dass
Strings mit Pluralformen beachtet werden.

Für den Fall, dass es jemand ausprobieren will, anbei die Dateien
(Installation siehe oben).

MfG
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.11 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org/

iEYEARECAAYFAk0Y0FEACgkQYnmexcjIJ0VXWQCgnHY/1s30UT38HmNv8YXroABW
DR4AnA4TatdM1YA0VluJZ3EOWRqYF99i
=zvuO
-----END PGP SIGNATURE-----
-------------- next part --------------
A non-text attachment was scrubbed...
Name: i18n_check.py
Type: text/x-python
Size: 3410 bytes
Desc: not available
Url : http://mail.kde.org/pipermail/kde-i18n-de/attachments/20101227/af9f474e/attachment-0003.py 
-------------- next part --------------
A non-text attachment was scrubbed...
Name: checks.py
Type: text/x-python
Size: 2446 bytes
Desc: not available
Url : http://mail.kde.org/pipermail/kde-i18n-de/attachments/20101227/af9f474e/attachment-0004.py 
-------------- next part --------------
A non-text attachment was scrubbed...
Name: __init__.py
Type: text/x-python
Size: 0 bytes
Desc: not available
Url : http://mail.kde.org/pipermail/kde-i18n-de/attachments/20101227/af9f474e/attachment-0005.py 


More information about the kde-i18n-de mailing list