<table><tr><td style="">bruns created this revision.<br />bruns added reviewers: Frameworks, astippich.<br />Herald added projects: Frameworks, Baloo.<br />Herald added subscribers: Baloo, kde-frameworks-devel.<br />bruns requested review of this revision.
</td><a style="text-decoration: none; padding: 4px 8px; margin: 0 8px 8px; float: right; color: #464C5C; font-weight: bold; border-radius: 3px; background-color: #F7F7F9; background-image: linear-gradient(to bottom,#fff,#f1f0f1); display: inline-block; border: 1px solid rgba(71,87,120,.2);" href="https://phabricator.kde.org/D16489">View Revision</a></tr></table><br /><div><strong>REVISION SUMMARY</strong><div><p>Currently, both XML and SVG documents are indexed as plain text due<br />
to mimetype inheritance. This fills the content index with meaningless<br />
data (tags, attributes, attribute values ...).</p>

<p>Use QDomElement::text() for generic XML documents and <text/> nodes<br />
for SVG to extract the content. Also try do find Dublin Core metadata<br />
and add the relevant properties.</p>

<p>Depends on <a href="https://phabricator.kde.org/D16488" style="background-color: #e7e7e7;
          border-color: #e7e7e7;
          border-radius: 3px;
          padding: 0 4px;
          font-weight: bold;
          color: black;text-decoration: none;">D16488</a></p></div></div><br /><div><strong>REPOSITORY</strong><div><div>R286 KFileMetaData</div></div></div><br /><div><strong>BRANCH</strong><div><div>xml_extractor</div></div></div><br /><div><strong>REVISION DETAIL</strong><div><a href="https://phabricator.kde.org/D16489">https://phabricator.kde.org/D16489</a></div></div><br /><div><strong>AFFECTED FILES</strong><div><div>src/extractors/CMakeLists.txt<br />
src/extractors/xmlextractor.cpp<br />
src/extractors/xmlextractor.h</div></div></div><br /><div><strong>To: </strong>bruns, Frameworks, astippich<br /><strong>Cc: </strong>kde-frameworks-devel, Baloo, ashaposhnikov, michaelh, astippich, spoorun, ngraham, bruns, abrahams<br /></div>