<div dir="ltr">Hi all,<div><br></div><div>For some time now it has been known to me that the system for generating application documentation websites using Sphinx with l10n support has had issues with duplicating data - particularly images.</div><div><br></div><div>That leads to the following outcome, where aside from sites that we expect to be quite large (like <a href="http://www.kde.org">www.kde.org</a> and <a href="http://api.kde.org">api.kde.org</a>) all of the application documentation sites are quite big as well:</div><div><br></div><div>root@nicoda /srv/www # du -h --max-depth=1 ./generated/ | grep G<br>2.3G    ./generated/<a href="http://cutehmi.kde.org">cutehmi.kde.org</a><br>3.7G    ./generated/<a href="http://docs.digikam.org">docs.digikam.org</a><br>2.4G    ./generated/<a href="http://api.kde.org">api.kde.org</a><br>2.3G    ./generated/<a href="http://docs.krita.org">docs.krita.org</a><br>1.4G    ./generated/<a href="http://www.kde.org">www.kde.org</a><br>7.9G    ./generated/<a href="http://docs.kdenlive.org">docs.kdenlive.org</a><br>29G     ./generated/<br></div><div><br></div><div>This stands in comparison to the Docbook documentation site for all other KDE applications:</div><div><br></div><div>root@nicoda /srv/www # du -h --max-depth=1 . | grep G<br>29G     ./generated<br>16G     ./api.kde.org-legacy<br>6.0G    ./<a href="http://docs.kde.org">docs.kde.org</a><br>51G     .<br></div><div><br></div><div>It would be nice if we could please look into some fixes for this, as it looks like Sphinx is duplicating the images - once for every language - when that isn't necessary.</div><div>I could understand if the screenshots were updated as part of the translation, but it looks like they're not in the majority of cases - below being just a sample:</div><div><br></div><div>root@nicoda /srv/www/generated/<a href="http://docs.krita.org">docs.krita.org</a> # sha256sum zh_CN/_images/Krita_cpb_mixing.gif<br>12eb4cbad29a5a6486d3438dabb888a0aa0b9579e55b3be2f3c1d6e1d76fc1d7  zh_CN/_images/Krita_cpb_mixing.gif<br>root@nicoda /srv/www/generated/<a href="http://docs.krita.org">docs.krita.org</a> # sha256sum en/_images/Krita_cpb_mixing.gif<br>12eb4cbad29a5a6486d3438dabb888a0aa0b9579e55b3be2f3c1d6e1d76fc1d7  en/_images/Krita_cpb_mixing.gif<br></div><div><br></div><div>While this isn't a massive issue right now, it is a future scalability issue as for Krita at least each language costs 178MB or so, while for Digikam that sits at 415MB per language and Kdenlive is 392MB.</div><div><br></div><div>Many thanks,</div><div>Ben</div></div>