Sonnet: Trigram data file for Greek

John Salatas jsalatas at ictpro.gr
Tue Jan 24 18:45:48 UTC 2017


On 2017-01-24 10:40 AM, Christoph Feck wrote:
> On 24.01.2017 09:01, John Salatas wrote:
>> I just built a trigram data file (attached) for Greek language using a
>> wikipedia dump as corpus. Can I just push it to sonnet's git or do I
>> need to generate a differential review in phabricator or something?
> 
> Isn't Greek language automatically detected by Greek script? As far as
> I know, no other language uses the Greek script.

It doesn't seem to be the case if it is mixed with other languages in 
the same sentence, which is rather typical in technical documents that 
contain English terms. For example the following excerpt from

https://el.wikipedia.org/wiki/Linux

Το Linux (Λίνουξ) ή GNU/Linux (Γκνού/Λίνουξ), είναι ένα λειτουργικό 
σύστημα που αποτελείται από ελεύθερο λογισμικό. Η χρήση του είναι 
παρόμοια με αυτή του Unix, αλλά όλος ο πηγαίος κώδικας του έχει γραφτεί 
από την αρχή ως ελεύθερο λογισμικό υπό την ελεύθερη άδεια χρήσης GNU 
General Public License.




More information about the Kde-frameworks-devel mailing list