<div dir="ltr"><div>1.) Does the dataset contain full, original training images or just plain text links to images? <br></div><div><br></div><div>If it's just links and metadata, then one of the various CCs is fine.</div><div>Some popular datasets include entire images, in which case... I don't know. I'd avoid that...<br></div><div><br></div><div>2.) If we don't own the data used to "train" the binary blob model, do we even own the model? </div><div><br></div><div>Obviously only the owner of some work can license it to others.</div><div>We're kind of in legal no-man's land with all this stuff, so I don't know and I don't expect you to know either, but it feels like due diligence to consider it.</div><div>Does Intel have any suggestions about this? What do they do?<br></div><div><br></div><div>Even doing my best to put aside my personal (well-documented) feelings on copyright and generative AI aside, I don't really understand the legal/licensing mechanics of all this stuff to help you make a good judgement here. </div><div>If nothing else I'm curious to see where this stuff leads Krita.<br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Mon, Mar 25, 2024 at 7:17 AM Halla Rempt <<a href="mailto:halla@valdyas.org">halla@valdyas.org</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">We're looking into adding an experimental AI-based feature to Krita: automated inking. That gives us three components, and we're not sure about the license we should use for two of them: the model and the datase. Would CC be best here?<br>
<br>
Halla<br>
<br>
<br>
</blockquote></div>