<div dir="ltr"><div><div><div><div>As for text file, in linux world people don't usually use .txt extension, especially when writing something like vimwiki or something similar.<br><br></div>I guess cap the size is some what better solution ( 1-5MB is good enough).<br><br></div>And as for folder limitation, that doesn't sound good, people usually organze files in their own way, unless we are on some mobile phone that doesn't expose a filesystem interface (the interface force people to use those location), then it doesn't work.<br><br></div>I wonder if baloo could somehow estimate if some directory is problematic, and gives user warning about that.<br><br></div>And could even baloo index large text file partially? So it will never guess wrong.<br></div><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Oct 16, 2014 at 8:15 AM, Martin Gräßlin <span dir="ltr"><<a href="mailto:mgraesslin@kde.org" target="_blank">mgraesslin@kde.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="">On Thursday 16 October 2014 13:20:57 Vishesh Handa wrote:<br>
> Hey guys<br>
><br>
> While Baloo performs better than Nepomuk. It does have its share of<br>
> problems - mostly large text files, and high IO usage. Additionally, users<br>
> on linux often seem to have the craziest files. Currently, we do not index<br>
> plain text files which do not have a `.txt` extension, because otherwise we<br>
> land up indexing genome data and other strange files. (Actual bugs)<br>
<br>
</span>the txt being genome data doesn't surprise me[1], but I find it sad that now<br>
txt is disabled by default (I use them quite a lot for blog posts). As genome<br>
data is really huge wouldn't it make sense to go rather for file size or abort<br>
the indexing if it's obvious random gibberish?<br>
<br>
Restricting to the XDG dirs is certainly something which could be done, but I<br>
also find this unfortunate - my setup is older than those dirs ;-)<br>
<br>
Cheers<br>
Martin<br>
<br>
[1] Having worked in a lab which did genome sequence analysis and using Plasma<br>
on all systems.<br>_______________________________________________<br>
Plasma-devel mailing list<br>
<a href="mailto:Plasma-devel@kde.org">Plasma-devel@kde.org</a><br>
<a href="https://mail.kde.org/mailman/listinfo/plasma-devel" target="_blank">https://mail.kde.org/mailman/listinfo/plasma-devel</a><br>
<br></blockquote></div><br></div>