<table><tr><td style="">poboiko added a comment.
</td><a style="text-decoration: none; padding: 4px 8px; margin: 0 8px 8px; float: right; color: #464C5C; font-weight: bold; border-radius: 3px; background-color: #F7F7F9; background-image: linear-gradient(to bottom,#fff,#f1f0f1); display: inline-block; border: 1px solid rgba(71,87,120,.2);" href="https://phabricator.kde.org/D23787">View Revision</a></tr></table><br /><div><div><p><a href="https://phabricator.kde.org/p/bruns/" style="
              border-color: #f1f7ff;
              color: #19558d;
              background-color: #f1f7ff;
                border: 1px solid transparent;
                border-radius: 3px;
                font-weight: bold;
                padding: 0 4px;">@bruns</a>: I've missed <a href="https://phabricator.kde.org/D16593" style="background-color: #e7e7e7;
          border-color: #e7e7e7;
          border-radius: 3px;
          padding: 0 4px;
          font-weight: bold;
          color: black;text-decoration: line-through;">D16593: [ExtractorCollection] Use only best matching extractor plugin</a>, and had in mind previous situation where we've matched all extractors based on inheritance. In that case, "Secondly" part indeed does not seem to apply anymore.<br />
(as for my previous answer: I misunderstood you, thought you were asking about the case where <tt style="background: #ebebeb; font-size: 13px;">PlainTextExtractor</tt> did not match & matched afterwards)</p>

<blockquote style="border-left: 3px solid #a7b5bf; color: #464c5c; font-style: italic; margin: 4px 0 12px 0; padding: 4px 12px; background-color: #f8f9fc;"><p>Your script is wrong. E.g. SVG inherits from text/plain, but has its own extractor, thus is not fed to the PlaintextExtractor. Dito for anything inheriting from XML.</p></blockquote>

<p>I'm not claiming the list to be comprehensive, it's just a first approximation.<br />
I'm claiming just that there is plethora of plain-text-based types (and might be even more in the future), some of which <strong>in principle</strong> might cause an issue.</p>

<p>There were plenty of situations in the past when users first encountered Baloo choking on some files (see git log of <tt style="background: #ebebeb; font-size: 13px;">fileexcludefilters.cpp</tt> - SQL dumps, genome data, etc.), which made Baloo unusable for them.<br />
Luckily for us, they reported it, and we blacklisted it. But I think it's unlikely we will manage to cover all the problematic cases that way (not all users report issues, and we're not familiar with all possible mimetypes).<br />
This patch should serve as a preventive measure, reducing the probabilty of Baloo choking on it in the first place.</p></div></div><br /><div><strong>REPOSITORY</strong><div><div>R293 Baloo</div></div></div><br /><div><strong>REVISION DETAIL</strong><div><a href="https://phabricator.kde.org/D23787">https://phabricator.kde.org/D23787</a></div></div><br /><div><strong>To: </strong>poboiko, Baloo, bruns, ngraham<br /><strong>Cc: </strong>davidedmundson, broulik, kde-frameworks-devel, Baloo, hurikhan77, lots0logs, LeGast00n, fbampaloukas, GB_2, domson, ashaposhnikov, michaelh, astippich, spoorun, ngraham, bruns, abrahams<br /></div>