Mise à jour du dictionnaire pour check_spell_ec

Xavier Besnard (Perso) xavier.besnard at neuf.fr
Ven 6 Jan 17:47:19 GMT 2023


Bonjour à vous.

Je me suis attaqué à la remise à jour du dictionnaire pour 
check_spell_ec. Gros morceau !!!

Heureusement, j'ai découvert Python durant la période COVID. Cela m'aide 
bien. Plutôt cool python (plus que C/ADA ou FORTRAN) !!!

Un peu de chiffres pour la partie "messages":

  * Plus de 500 répertoires,
  * Presque 3000 fichiers,
  * Erreurs remontées sur l'ensemble de l'arborescence "messages":
      o check_spell_ec: plus de 37 000 erreurs à partir d'un
        dictionnaire vide,
      o check_rules: plus de 3900 erreurs avec le fichier de règles actuel.

Pour l'instant, je passe les dossiers au check_spell_ec au fur et à 
mesure, tout en corrigeant quelquefois les fichiers po. J'en ai fait un 
bon tiers déjà mais avec les dossiers remontant peu d'erreurs. Le plus 
lourd arrive au fur et à mesure mais l'enrichissement progressif du dico 
réduit un peu le volume au fur et à mesure.

J'avais tenté de faire un fichier unique avec élimination des doublons, 
avec toutes les erreurs mais cela fait trop de choses à faire en même temps.

Premiers constats avec check_spell

  * Coquilles et typos trouvés mais pas autant que cela (utilisation du
    correcteur orthographique)
  * Besoin de limiter les entrées dans le dico, quitte à amender les
    traductions
  * Il y a toujours des détections parasites pour de nombreuses raisons
    (HTML, balises, commandes, ...) et qui ne pourront pas toutes être
    levées (à moins de revoir l'outil)

Si vous avez des idées....

Bon week end. Xavier
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://mail.kde.org/pipermail/kde-francophone/attachments/20230106/b3a6efc6/attachment.htm>


Plus d'informations sur la liste de diffusion kde-francophone