<table><tr><td style="">astippich added a comment.
</td><a style="text-decoration: none; padding: 4px 8px; margin: 0 8px 8px; float: right; color: #464C5C; font-weight: bold; border-radius: 3px; background-color: #F7F7F9; background-image: linear-gradient(to bottom,#fff,#f1f0f1); display: inline-block; border: 1px solid rgba(71,87,120,.2);" href="https://phabricator.kde.org/D19087">View Revision</a></tr></table><br /><div><div><p>I get the feeling that we need to discuss how the PropertyMap should look like and how we achieve a seamless transition in a backwards compatible way.<br />
I have slowly been working to resolve <a href="https://phabricator.kde.org/T8196" style="background-color: #e7e7e7;
          border-color: #e7e7e7;
          border-radius: 3px;
          padding: 0 4px;
          font-weight: bold;
          color: black;text-decoration: none;">T8196</a>, which is why I am so insisting. This is the last missing piece.<br />
Currently, the clients expect a list in the map when there are multiple values, probably since the inception of baloo. All other entries are simply ignored. If the map is changed to having multiple entries with duplicate keys, then we have to adjust all clients and make sure that all possible combinations of applications and frameworks continue to work. <br />
Additionally, baloo's serialization/deserialization does currently alter the structure of the map. Multiple values with the same key will be merged into a list afterwards. This causes issues in baloo-widgets for example, which breaks for multiple properties when baloo indexing is off. Baloo-widget then uses KFM directly, which results in a different PropertyMap. <br />
Considering this, my plan was that to insert multiple values as single entry containing a list. Once all extractors are converted, the merging of multiple values into lists, currently done before serialization in baloo, will be removed. This yields a backwards compatible way of fixing the issue with multiple entries (That is also what <a href="https://phabricator.kde.org/D17302" style="background-color: #e7e7e7;
          border-color: #e7e7e7;
          border-radius: 3px;
          padding: 0 4px;
          font-weight: bold;
          color: black;text-decoration: none;">D17302</a> is for). This demands that the same list is retrieved after deserialization, with no merged values, e.g. additional entries in the list, during the serialization.</p>

<p>So there are a few things that I would like to consider:</p>

<ul class="remarkup-list">
<li class="remarkup-list-item">The same PropertyMap is generated either by baloo or KFM directly. Keeping the PropertyMap the same is only possible to a certain extend with JSON, e.g. with ints becoming doubles etc...</li>
<li class="remarkup-list-item">Extractors will insert multiple entries as a list.</li>
<li class="remarkup-list-item">Multiple extractors for the same mime type may insert duplicate entries.  This would  allow clients to easily differentiate between data from multiple extractors in the future.</li>
</ul>

</div></div><br /><div><strong>INLINE COMMENTS</strong><div><div style="margin: 6px 0 12px 0;"><div style="border: 1px solid #C7CCD9; border-radius: 3px;"><div style="padding: 0; background: #F7F7F7; border-color: #e3e4e8; border-style: solid; border-width: 0 0 1px 0; margin: 0;"><div style="color: #74777d; background: #eff2f4; padding: 6px 8px; overflow: hidden;"><a style="float: right; text-decoration: none;" href="https://phabricator.kde.org/D19087#inline-107508">View Inline</a><span style="color: #4b4d51; font-weight: bold;">bruns</span> wrote in <span style="color: #4b4d51; font-weight: bold;">propertydata.cpp:80</span></div>
<div style="margin: 8px 0; padding: 0 12px; color: #74777D;"><blockquote style="border-left: 3px solid #a7b5bf; color: #464c5c; font-style: italic; margin: 4px 0 12px 0; padding: 4px 12px; background-color: #f8f9fc;"><p style="padding: 0; margin: 8px;">All clients currently rely on having string lists (<strong>or variantlists</strong>)</p></blockquote>

<p style="padding: 0; margin: 8px;">Actually, string lists make the code more complicated, as the code already has to handle variant lists. There are no <tt style="background: #ebebeb; font-size: 13px;">QDoublelists</tt>, <tt style="background: #ebebeb; font-size: 13px;">QIntlists</tt> ... baloo-widgets treats a <tt style="background: #ebebeb; font-size: 13px;">QVariantList</tt> with string entries exactly like a <tt style="background: #ebebeb; font-size: 13px;">QStringlist</tt>, and dolphin uses baloo-widgets.</p>

<blockquote style="border-left: 3px solid #a7b5bf; color: #464c5c; font-style: italic; margin: 4px 0 12px 0; padding: 4px 12px; background-color: #f8f9fc;"><p style="padding: 0; margin: 8px;">It is also what is advertised in KFileMetaData.</p></blockquote>

<p style="padding: 0; margin: 8px;">KFileMetaData does not specify in any way how values for repeated properties are retuned. It explicitly allows calling ExtractionResult::add() with the same property multiple times, but that's it. PropertyMap is just a QMap<> typedef, and does not specify any behavior. For me, it seems much more natural to expect multiple individual entries for the same key, which should be retrieved with QMap::values().</p>

<p style="padding: 0; margin: 8px;">Currently, baloo-widgets (<a href="https://cgit.kde.org/baloo-widgets.git/tree/src/filemetadatawidget.cpp#n152" class="remarkup-link" target="_blank" rel="noreferrer">https://cgit.kde.org/baloo-widgets.git/tree/src/filemetadatawidget.cpp#n152</a>)  only uses <tt style="background: #ebebeb; font-size: 13px;">data[key]</tt>, i.e. it only retrieves the first value, but fixing this is a single line change (i.e. replace <tt style="background: #ebebeb; font-size: 13px;">data[key]</tt> by <tt style="background: #ebebeb; font-size: 13px;">QVariant(data.values(key))</tt>).</p>

<blockquote style="border-left: 3px solid #a7b5bf; color: #464c5c; font-style: italic; margin: 4px 0 12px 0; padding: 4px 12px; background-color: #f8f9fc;"><p style="padding: 0; margin: 8px;">Having it as string lists also makes the handling of them so much easier. It can be handled with one call to QVariant::toStringList().join().</p></blockquote>

<p style="padding: 0; margin: 8px;"><tt style="background: #ebebeb; font-size: 13px;">QVariant::toStringList()</tt> also works on <tt style="background: #ebebeb; font-size: 13px;">QVariantLists</tt> - <a href="https://doc.qt.io/qt-5/qvariant.html#toStringList" class="remarkup-link" target="_blank" rel="noreferrer">https://doc.qt.io/qt-5/qvariant.html#toStringList</a></p></div></div>
<div style="margin: 8px 0; padding: 0 12px;"><blockquote style="border-left: 3px solid #a7b5bf; color: #464c5c; font-style: italic; margin: 4px 0 12px 0; padding: 4px 12px; background-color: #f8f9fc;"><p style="padding: 0; margin: 8px;">Actually, string lists make the code more complicated, as the code already has to handle variant lists. There are no QDoublelists, QIntlists ... baloo- widgets treats a QVariantList with string entries exactly like a QStringlist, and dolphin uses baloo-widgets.</p></blockquote>

<p style="padding: 0; margin: 8px;">Dolphin has its own handling for the detailed view and does not use baloo-widgets there.</p>

<p style="padding: 0; margin: 8px;">I think here is actually a misunderstanding, by supporting string lists I meant that if one inserts a list, one also gets the same list after deserialization. I actually do not care if it is a string list before and a variant list afterwards, that is how the current code already works.</p>

<blockquote style="border-left: 3px solid #a7b5bf; color: #464c5c; font-style: italic; margin: 4px 0 12px 0; padding: 4px 12px; background-color: #f8f9fc;"><p style="padding: 0; margin: 8px;">KFileMetaData does not specify in any way how values for repeated properties are retuned. It explicitly allows calling ExtractionResult::add() with the same property multiple times, but that's it. PropertyMap is just a QMap<> typedef, and does not specify any behavior. For me, it seems much more natural to expect multiple individual entries for the same key, which should be retrieved with QMap::values().</p></blockquote>

<p style="padding: 0; margin: 8px;">You are right, ExtractionResult explicitly states that multiple calls are allowed. IMHO this should be more specified to "can be called multiple times from different extractors".</p>

<blockquote style="border-left: 3px solid #a7b5bf; color: #464c5c; font-style: italic; margin: 4px 0 12px 0; padding: 4px 12px; background-color: #f8f9fc;"><p style="padding: 0; margin: 8px;">Currently, baloo-widgets (<a href="https://cgit.kde.org/baloo-widgets.git/tree/src/filemetadatawidget.cpp#n152" class="remarkup-link" target="_blank" rel="noreferrer">https://cgit.kde.org/baloo-widgets.git/tree/src/filemetadatawidget.cpp#n152</a>) only uses data[key], i.e. it only retrieves the first value, but fixing this is a single line change (i.e. replace data[key] by QVariant(data.values(key))).</p></blockquote>



<blockquote style="border-left: 3px solid #a7b5bf; color: #464c5c; font-style: italic; margin: 4px 0 12px 0; padding: 4px 12px; background-color: #f8f9fc;"><p style="padding: 0; margin: 8px;">QVariant::toStringList() also works on QVariantLists - <a href="https://doc.qt.io/qt-5/qvariant.html#toStringList" class="remarkup-link" target="_blank" rel="noreferrer">https://doc.qt.io/qt-5/qvariant.html#toStringList</a></p></blockquote>

<p style="padding: 0; margin: 8px;">I know, otherwise the current code would not work at all.</p></div></div><br /><div style="border: 1px solid #C7CCD9; border-radius: 3px;"><div style="padding: 0; background: #F7F7F7; border-color: #e3e4e8; border-style: solid; border-width: 0 0 1px 0; margin: 0;"><div style="color: #74777d; background: #eff2f4; padding: 6px 8px; overflow: hidden;"><a style="float: right; text-decoration: none;" href="https://phabricator.kde.org/D19087#inline-107494">View Inline</a><span style="color: #4b4d51; font-weight: bold;">bruns</span> wrote in <span style="color: #4b4d51; font-weight: bold;">propertydata.cpp:83</span></div>
<div style="margin: 8px 0; padding: 0 12px; color: #74777D;"><p style="padding: 0; margin: 8px;">Only if it can be fixed it a straight-forward and trivial way, or when it is a regression. This is IMHO not the case here. <br />
Also, PropertyInfo::valueType specifies <tt style="background: #ebebeb; font-size: 13px;">QString</tt> for several properties where multiple values are completely reasonable.</p></div></div>
<div style="margin: 8px 0; padding: 0 12px;"><p style="padding: 0; margin: 8px;">Which property? I am only aware of Composer, which I plan to change.</p></div></div></div></div></div><br /><div><strong>REPOSITORY</strong><div><div>R293 Baloo</div></div></div><br /><div><strong>REVISION DETAIL</strong><div><a href="https://phabricator.kde.org/D19087">https://phabricator.kde.org/D19087</a></div></div><br /><div><strong>To: </strong>bruns, Baloo, Frameworks, ngraham, poboiko, astippich<br /><strong>Cc: </strong>kde-frameworks-devel, domson, ashaposhnikov, michaelh, astippich, spoorun, ngraham, bruns, abrahams<br /></div>