Hey Jorg<br><br>A couple of things<br><br>1. You have multiple extractors - One for resources which extract information from the file, and some web-extractors. Considering that Nepomuk now allows easy Qt based extractor plugins, how about we move your code over there? Your poppler based code would be quite useful. Same goes with the ODF.<br>
<br>2. Project Name - If one moves the extractors away, the only part that is left is the web-extractors. Why not rename the project to Nepomuk-WebExtractor or something similar? I know a project by that name already exists, but that can be removed. It's a dead project.<br>
<br>3. I would eventually like this to be a part of the KDE SC release. Web Extractors are something that I have wanted for a very very long time. I'm not sure if we can get this into 4.10, but I'd definitely like it to be a part of 4.11.<br>
<br>As to where it should be placed. I agree with Sebastian Kugler, kdelibs is not the place. We had initially planned on splitting kde-runtime/nepomuk into multiple repositories, but we're now waiting for KF5. Do you think this could go under kde-runtime (not in that repo)<br>
<br>4. ResourceWatcher - This is something that I would like done in the future. Not right now. We don't need to be perfectionists.<br><br>I would ideally like this to be part 3 of the file indexing system we have. Currently part 1 pushes the stat + rdf:type + mimetype. Part 2 indexes the contents of the file ( Your resource extractors go here ), and part 3 could extract information from the web.<br>
<br>This way, you would avoid using the ResourceWatcher, and everything would be better integrated. But I'm not sure how we would go about this, so lets stick with the current architecture for now.<br><br>5. Auto generated SimpleResource Headers - You've included them in your repo. That was what we originally wanted. We didn't want to repeat the mess that happened with breaking kdepim cause of ontology changes.<br>
<br>Does anyone have a problem with having generated headers in the code? One could generate them on the fly, but that would be slow (Jorg says around 10 minutes?) and if something is changed in the ontologies, the classes would change drastically thereby affecting the code. <br>
<br><div class="gmail_quote">On Wed, Oct 31, 2012 at 3:41 AM, Jörg Ehrichs <span dir="ltr"><<a href="mailto:Joerg.Ehrichs@gmx.de" target="_blank">Joerg.Ehrichs@gmx.de</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hi all,<br>
<br>
today I've moved my metadata extractor into KDE Review [1].<br>
As kde-libs is frozen till kf5 I like to get this into extragear/base<br>
(unless anyone has a better idea where to put this).<br>
<br>
For those who are unaware what this little program does:<br>
<br>
This programs is an extension to Nepomuk and is able to find<br>
additional metadata for videos/music and documents on the Internet.<br>
Based on filename / previous metadata extraction / mimetype one of the<br>
existing python plugin based (thanks to KROSS) fetcher are called,<br>
to get more information for a file.<br>
<br>
This can be, title, season, episode, writer, author, cast, cited<br>
references and so on.<br>
All this data is saved into Nepomuk and can be used with Dolphin /<br>
Bangarang to get more information from your files.<br>
<br>
The program is integrated into the dolpin service menu, can be called<br>
as command-line program, runs as a Nepomuk2::Service in the background<br>
(can be switched off)<br>
and has also adapters to be able to integrate into Konqueror and Chromium.<br>
<br>
More information on it can be found on my blog [2].<br>
Some more technical description is available via doxygen.<br>
<br>
Please review the current codebase to help this getting as stable as possible.<br>
<br>
Thanks in advance,<br>
Joerg<br>
<br>
[1] <a href="https://projects.kde.org/projects/kdereview/nepomuk-metadata-extractor" target="_blank">https://projects.kde.org/projects/kdereview/nepomuk-metadata-extractor</a><br>
[2] <a href="http://joerg-weblog.blogspot.de/search/label/Metadata%20Extractor" target="_blank">http://joerg-weblog.blogspot.de/search/label/Metadata%20Extractor</a><br>
</blockquote></div><br><br clear="all"><br>-- <br><span style="color:rgb(192,192,192)">Vishesh Handa</span><br><br>