<html><head></head><body><div class="ydp38a77ec1yahoo-style-wrap" style="font-family:Helvetica Neue, Helvetica, Arial, sans-serif;font-size:16px;"><div></div>
        <div dir="ltr" data-setdir="false">Just as an experiment I manually deleted the overflow lines..</div><div dir="ltr" data-setdir="false">But that isn't automatic.</div><div dir="ltr" data-setdir="false">And as I read on and experiment, I think that semi-automatic might be the best option.</div><div dir="ltr" data-setdir="false">So to rephrase my question:</div><div dir="ltr" data-setdir="false">What is the best semi-automatic way to bring a pdf bank statement into KMyMoney.</div><div dir="ltr" data-setdir="false"><br></div><div dir="ltr" data-setdir="false">I see that without serious programming a converter (I googled and tried a few) from text to Qif or to csv all require manual input.</div><div dir="ltr" data-setdir="false">The question is where in the food chain is the best place to make these changes.</div><div dir="ltr" data-setdir="false">I see that pdftotext doesn't like a wide column length, and I gather there is no way to change it?</div><div dir="ltr" data-setdir="false">Qif seems to want deposits listed with a plus sign and expenses with a minus.</div><div dir="ltr" data-setdir="false">There probably other things that would need tweaking.</div><div dir="ltr" data-setdir="false"><br></div><div dir="ltr" data-setdir="false">So I wonder what is the best way to get bank statements into KMyMoney. </div><div dir="ltr" data-setdir="false">My bank only lets me get a pdf.</div><div dir="ltr" data-setdir="false">Aaron</div><div><br></div>
        
        </div><div id="yahoo_quoted_9926242527" class="yahoo_quoted">
            <div style="font-family:'Helvetica Neue', Helvetica, Arial, sans-serif;font-size:13px;color:#26282a;">
                
                <div>
                    On Thursday, December 31, 2020, 04:41:34 PM EST,  <pjfarley3@earthlink.net> wrote:
                </div>
                <div><br></div>
                <div><br></div>
                <div><div id="yiv9995229445"><style>#yiv9995229445 #yiv9995229445 --
 
 _filtered {}
 _filtered {}
#yiv9995229445  
#yiv9995229445 p.yiv9995229445MsoNormal, #yiv9995229445 li.yiv9995229445MsoNormal, #yiv9995229445 div.yiv9995229445MsoNormal
        {margin:0in;font-size:11.0pt;font-family:sans-serif;}
#yiv9995229445 a:link, #yiv9995229445 span.yiv9995229445MsoHyperlink
        {color:blue;text-decoration:underline;}
#yiv9995229445 span.yiv9995229445EmailStyle19
        {font-family:sans-serif;color:windowtext;}
#yiv9995229445 .yiv9995229445MsoChpDefault
        {font-size:10.0pt;}
 _filtered {}
#yiv9995229445 div.yiv9995229445WordSection1
        {}
#yiv9995229445 </style><div><div class="yiv9995229445WordSection1"><p class="yiv9995229445MsoNormal">Jack,</p><p class="yiv9995229445MsoNormal">  </p><p class="yiv9995229445MsoNormal">It is quite common in bank statement PDF’s to have transactions be formatted like this (I hope the alignment works, I will format as fixed-font to try to help):</p><p class="yiv9995229445MsoNormal">  </p><p class="yiv9995229445MsoNormal"><span style="">MM/DD/YY   Payee Name                 Amount paid          Running balance</span></p><p class="yiv9995229445MsoNormal"><span style="">           Additional info about payment</span></p><p class="yiv9995229445MsoNormal"><span style="">           Can be multiple lines</span></p><p class="yiv9995229445MsoNormal"><span style="">  </span></p><p class="yiv9995229445MsoNormal"><span style="">MM/DD/YY   Next Payee Name            Amount Paid          Running balance</span></p><p class="yiv9995229445MsoNormal"><span style="">  </span></p><p class="yiv9995229445MsoNormal"><span style="">MM/DD/YY   DEPOSIT                    Amount deposited      Running Balance</span></p><p class="yiv9995229445MsoNormal">  </p><p class="yiv9995229445MsoNormal">So when the PDF is translated to text, those “additional info” line(s) appear as separate physical lines without the MM/DD/YY header or any money amounts following.</p><p class="yiv9995229445MsoNormal">  </p><p class="yiv9995229445MsoNormal">Depending heavily on the PDF construction, I have also (but rarely) seen the money amounts (paid or deposited and balance) show up on the SECOND line after conversion of the PDF to text.  The pdftotext “-layout” switch has improved over time to where I seldom see this any more, but it can happen.</p><p class="yiv9995229445MsoNormal">  </p><p class="yiv9995229445MsoNormal">Like I said, it can get complicated.</p><p class="yiv9995229445MsoNormal">  </p><p class="yiv9995229445MsoNormal">Peter</p><p class="yiv9995229445MsoNormal">  </p><div style="border:none;border-left:solid blue 1.5pt;padding:0in 0in 0in 4.0pt;"><div class="yiv9995229445yqt6407908609" id="yiv9995229445yqt86155"><div><div style="border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0in 0in 0in;"><p class="yiv9995229445MsoNormal"><b>From:</b> KMyMoney <kmymoney-bounces@kde.org> <b>On Behalf Of </b>Jack<br clear="none"><b>Sent:</b> Thursday, December 31, 2020 3:14 PM<br clear="none"><b>To:</b> kmymoney@kde.org<br clear="none"><b>Subject:</b> Re: More pdf2kmymoney (overflos/wrapping lines)</p></div></div><p class="yiv9995229445MsoNormal">  </p><div><p class="yiv9995229445MsoNormal">I started this yesterday, and I know there have been additional posts since, but I think this particular point hasn't been resolved.</p></div><div><p class="yiv9995229445MsoNormal">  </p></div><div><p class="yiv9995229445MsoNormal">On 12/30/20 8:59 PM, <a rel="nofollow noopener noreferrer" shape="rect" ymailto="mailto:pjfarley3@earthlink.net" target="_blank" href="mailto:pjfarley3@earthlink.net">pjfarley3@earthlink.net</a> wrote:</p></div><blockquote style="margin-top:5.0pt;margin-bottom:5.0pt;"><p class="yiv9995229445MsoNormal">In my experience pdftotext does not “overflow lines”.  That is probably “extra information” (i.e., “Memo” field data) related to the transaction on the previous line.  That is quite common in bank statements.  You have to expect such lines and be prepared to attach them  to the prior transaction.   I do it as the “Memo” field in my output. </p></blockquote><p class="yiv9995229445MsoNormal">Aaron would have to confirm, but I suspect he refers to a case where a single table row as shown in the PDF has two rows of text in each cell, becuase there is just too much text for one line.  Because PDF knows only about where exactly on the page any text is, but  not why it is there (no information about things like tables) the text output would have two lines.  The first would have the first line of text from each cell, and the send would have the second line of text from each cell.  Putting them back together is theoretically possible, but only if there is some way to know that the second line is not a new row (missing header info?) or part of a manually controlled cleanup phase of the conversion. </p></div></div></div></div></div></div>
            </div>
        </div></body></html>