<html><head></head><body><div dir="auto">Perhaps git does not recognize the files as text, so does not do diffs.</div><br><br><div class="gmail_quote"><div dir="auto">Am 10. August 2023 14:00:05 MESZ schrieb Andre Heinecke <aheinecke@gnupg.org>:</div><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">
<pre class="k9mail"><div dir="auto">Hi,<br><br>tl;dr; po sync is blowing up our repository sizes far more then it appears to <br>be necessary. We might need a force push across all repos to correct that. <br>Kleopatra repo has increased in size tenfold since po files were added less <br>then a year ago.<br><br><br>I recently noticed that Kleopatra has gained some weight. While she is an old <br>lady, and when she was split up from the old KDEPIM repo took all her history <br>with it she was always quite chubby. But not by that much. ( I am messy with <br>Mega / Mebi here since it is not important for the overall picture) <br><br>So let us see:<br>A fresh clone of Kleopatra:<br>209M    kleopatra<br>Running:<br>git filter-repo --path po --invert-paths<br>21M     kleopatra<br><br>Let us do the same for KMail:<br>Before:<br>169M    kmail<br>after:<br>56M     kmail<br><br>Now yes Kleopatra has quite a few translations. Their checked out size is <br>about 29Megabytes. But there is something wrong here.<br><br>What I don't understand though is that if I look at the scripty commits in the <br>git log, nothing seems unusual. <br><br>But Let us take the language of Low Saxon. I hope that offends the least people <br>here. There have been no new translations there in ~10 years.<br><br>It's checked out size is 460KB.<br><br>In master we have:<br>715 translated messages, 709 fuzzy translations, 428 untranslated messages.<br>Going back to the first revision that added po files:<br>763 translated messages, 645 fuzzy translations, 391 untranslated messages.<br><br>Sizes are fairly equal with master of course a bit larger. Now this language, <br>unchanged in translation. Has alone added 10 Megabytes. That is about half of <br>the size of the complete history of the real source code for Kleopatra. <br><br>  du -hs .                                                                                                                                                                                      <br>  209M<br>  git filter-repo --path po/nds --invert-paths --force <br>  du -hs .                                                                                                                                                                                      <br>  199M<br><br>Now here is what I don't understand. If I look at the changes <br>git log -p po/nds/kleopatra.po | wc -c                                                                                                                                                                <br>164774<br>That seems reasonable for all the automatic scripty updates and even with all <br>the context lines, that is just 1,6MB uncompressed.<br><br>And this is where my git understanding runs into limits. To understand why the <br>history has gotten so large i tried some snippets from stackoverflow and from <br>there with:<br> git rev-list --objects --all po/nds/kleopatra.po| git cat-file --batch-<br>check='%(objecttype) %(objectname) %(objectsize) %(rest)'  |                                                         <br>  sed -n 's/^blob //p' |<br>  sort --numeric-sort --key=2 |<br>  cut -c 1-12,41-<br><br>I think that I can roughly see that apparently each commit in the repo has a <br>blob associated with it that is the same size of the file.<br><br>So can some git sleuth please investigte what is happening here? This kind of <br>repo growth is unstainable and at least for Kleopatra I see no possible <br>solution then to figure this out and then remove the po history from the last <br>year with a force push :-/<br><br>Don't get me wrong I like that the po files are now also in the repo, and that <br>this will of course increase the repo size, but something fishy is going on <br>here in my opinion.<br><br><br>Best Regards,<br>Andre<br><br></div></pre></blockquote></div><div dir="auto"><div class='k9mail-signature'>-- <br>Diese Nachricht wurde von meinem Android-Gerät mit K-9 Mail gesendet.</div></div></body></html>