<br>Make link-grammar usable for KDE would be a good idea but for sure it is not a 1-year project. Also, adding support for more languages is ... Not really interesting. <br><br>I was thinking about getting automatic data extraction, tag it and add it to Nepomuk. But most text or webpages I have myself on my computer are pretty random... <br>
<br>Another idea may be getting the data from konqueror history or akregator history or other data sources and create suggestions, etc. But I am not sure the fact that there is a concert of a guy you have a lot of music files of soon should really appear somewhere in your KDE desktop.<br>
<br>Also, here they are supposed to be interested in dialog management and topics like that, but any thing that resembles the office clip scares people ...<br><br><br><div class="gmail_quote">On Thu, Oct 23, 2008 at 7:26 AM, Alexander Dymo <span dir="ltr"><<a href="mailto:dymo@ukrpost.ua">dymo@ukrpost.ua</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div class="Ih2E3d">> > I don't even think that spell and grammar checking should be separated<br>

> > very much, since a spell checker should ideally know about the sentence<br>
> > structure, too.<br>
><br>
> Well, AFAIK (but checking is not my speciality), you can do a really good<br>
> and fast spell checker with simple statistical techniques and a simple<br>
> distance editing. For a grammar checker, you must have a full NL language<br>
> syntax parser and other techniques to find what are the errors and suggest<br>
> solutions. But, it's true that a good grammar checker must also be solid in<br>
> front of spelling errors.<br>
<br>
</div>That's why I like the idea of using Link parser<br>
<a href="http://www.abisource.com/projects/link-grammar/" target="_blank">http://www.abisource.com/projects/link-grammar/</a><br>
<a href="http://www.link.cs.cmu.edu/link/" target="_blank">http://www.link.cs.cmu.edu/link/</a><br>
<br>
It's quite convenient to use. It has both word dictionaries and grammar rules<br>
and when you try to build the graph (of links between words), it will figure<br>
out the morphology and syntax simultaneously.<br>
<br>
If the sentence is not correct, it will either leave words as not recognized<br>
morphologically (spelling error) or it will leave words outside the sentence<br>
link graph (syntax error). The algorithm to do that is IIRC O(n^3) which is<br>
great.<br>
<br>
I know abiword uses that now but I don't know how they do error reporting for<br>
syntax errors (which is quite interesting question itself).<br>
<br>
The only problem is that only english grammar is complete atm. There're<br>
italian and german grammars but they don't look like mature yet. There's also<br>
quite good russian grammar but it's unfortunatelly proprietary.<br>
<br>
</blockquote></div><br><br clear="all"><br>-- <br>Jordi Polo Carres<br>NLP laboratory - NAIST<br><a href="http://www.bahasara.org">http://www.bahasara.org</a><br><br>