<table><tr><td style="">sitter added inline comments.
</td><a style="text-decoration: none; padding: 4px 8px; margin: 0 8px 8px; float: right; color: #464C5C; font-weight: bold; border-radius: 3px; background-color: #F7F7F9; background-image: linear-gradient(to bottom,#fff,#f1f0f1); display: inline-block; border: 1px solid rgba(71,87,120,.2);" href="https://phabricator.kde.org/D29381">View Revision</a></tr></table><br /><div><strong>INLINE COMMENTS</strong><div><div style="margin: 6px 0 12px 0;"><div style="border: 1px solid #C7CCD9; border-radius: 3px;"><div style="padding: 0; background: #F7F7F7; border-color: #e3e4e8; border-style: solid; border-width: 0 0 1px 0; margin: 0;"><div style="color: #74777d; background: #eff2f4; padding: 6px 8px; overflow: hidden;"><a style="float: right; text-decoration: none;" href="https://phabricator.kde.org/D29381#inline-168505">View Inline</a><span style="color: #4b4d51; font-weight: bold;">meven</span> wrote in <span style="color: #4b4d51; font-weight: bold;">textcreator.cpp:38</span></div>
<div style="margin: 8px 0; padding: 0 12px; color: #74777D;"><p style="padding: 0; margin: 8px;">Without libmagic, it is current state basically UTF-8 with bom detection otherwise local codec.</p>

<p style="padding: 0; margin: 8px;">I did not test exhaustive encodings so I wanted to let the door open for users to not rely on libmagic.<br />
libmagic works well from what I've tested but I could not be absolutely sure for the multiple encodings out there.<br />
Hopefully libmagic does a better job detecting UTF-8 (which I saw) but for users not using much UTF-8...</p>

<p style="padding: 0; margin: 8px;">And libmagic loads a 5M file storing its heuristics each time it loads ( /usr/share/misc/magic.mgc ).<br />
It would be great to keep this in memory somewhere, maybe a static.</p></div></div>
<div style="margin: 8px 0; padding: 0 12px;"><p style="padding: 0; margin: 8px;">Perhaps it'd make sense to refactor this a bit and construct some test cases around encoding detection so we get a sense of reliablity?</p>

<p style="padding: 0; margin: 8px;">The way I am looking at this: either libmagic always does the best job at detecting encodings, at which point we'll want it as a required dep, or there's something better in which case we don't want libmagic at all and instead use the something better ;)</p>

<p style="padding: 0; margin: 8px;">In the end the user isn't necessarily in charge of what a random file will be encoded with, so I don't think there's a point in letting the user (or the distro) build an inferior product by accidentally not including libmagic. The truth is neither we nor the user can with any certainty say what encodings the thumbnailer will encounter.</p></div></div></div></div></div><br /><div><strong>REPOSITORY</strong><div><div>R320 KIO Extras</div></div></div><br /><div><strong>REVISION DETAIL</strong><div><a href="https://phabricator.kde.org/D29381">https://phabricator.kde.org/D29381</a></div></div><br /><div><strong>To: </strong>meven, Frameworks, sitter, ngraham<br /><strong>Cc: </strong>pino, kde-frameworks-devel, kfm-devel, azyx, nikolaik, pberestov, iasensio, aprcela, fprice, LeGast00n, cblack, fbampaloukas, alexde, Codezela, feverfew, meven, michaelh, spoorun, navarromorales, firef, ngraham, andrebarros, bruns, emmanuelp, rdieter, mikesomov<br /></div>