Re:Αυτόματη διόρθωση ανέτοιμων μεταφράσεων!!
Antonis G.
b3lievem at yandex.com
Sun Sep 15 13:14:27 BST 2024
Γεια σου Θεόφιλε,
πολύ εύστοχες οι παρατηρήσεις σου και θα συμφωνήσω ότι είναι σημαντικό να έχουμε συντομεύσεις πληκτρολογίου που δουλεύουν. Απλώς θέλω να διευκρινήσω ορισμένα πραγματα:
Όταν αλλάζει η θέση του '&' στο αρχικό κείμενο, το μεταφρασμένο μείνει χωρίς αλλαγές, έτσι η δουλειά των προηγουμένων μεταφραστών δεν χάνεται.
Πιστεύω ότι το heuristic που έφτιαξα κάνει καλύτερη 'μαντεξιά' σε πρώτη φάση από ότι θα έκανε ενας μεταφραστής που δεν μπορεί να δοκιμάσει τις αλλαγές. Αν και υπάρχει η τάση να βαζουμε το '&' στο ίδιο γράμμα με το αρχικό, στην πράξη αυτό δεν δουλεύει ικανοποιητικά!
Για παράδειγμα στο kate που χρησιμοποιω καθημερινα τρία από τα αντικείμενα στο κυρίως μενού είναι στο 'ε'. Το ένα έχει και τόνο, που σημαινει ότι δεν λειτουργει.
Στον αλγόριθμο που έφτιαξα βάζω πέναλτυ στα πιο κοινά γράμματα και πριμοδοτώ τα σπανιότερα, έτσι υποθετικά έχουν όλα ίσες πιθανότητες να 'πάρουν' το '&'. Επίσης όλα τα τονισμένα και το τελικό σίγμα αποκλείονται:
# Letter Frequencies of the Greek language
GREEK_LETTER_PENALTIES = {
'α': 10.81, 'τ': 7.99, 'ο': 7.23, 'ε': 7.18, 'σ': 7.00, 'ι': 6.64,
'ν': 6.19, 'ρ': 4.32, 'π': 4.15, 'κ': 3.77, 'μ': 3.43, 'η': 3.18,
'υ': 3.04, 'λ': 2.66, 'γ': 1.70, 'δ': 1.63, 'χ': 1.29, 'ω': 1.23,
'θ': 1.22, 'φ': 0.74, 'β': 0.67, 'ξ': 0.44, 'ζ': 0.33, 'ψ': 0.15
}
# List of Greek letters to exclude
EXCLUDED_LETTERS = {'ά', 'έ', 'ή', 'ί', 'ό', 'ύ', 'ώ', 'ϊ', 'ϋ', 'ΐ', 'ΰ', 'ς'}
Προς στο παρόν, δεν έχω κάνει commit κατι, διοτι υπάρχει μια παράληψη στο _POFileParser της βιβλιοθηκης που οδηγεί στο να χάνονται τα previous_msgid (ασαφή) από τις obsolete καταχωρήσεις. Θα μου πεις τι σημασία έχει, είναι και obsolete και fuzzy, θα μπορούσε να διαγραφεί τελείως από το αρχείο. Προσπαθώ να μην χειροτερέψω όσο μπορώ την ποιότητα των αρχείων.
More information about the kde-i18n-el
mailing list