<html>
<head>
<style><!--
.hmmessage P
{
margin:0px;
padding:0px
}
body.hmmessage
{
font-size: 10pt;
font-family:Tahoma
}
--></style>
</head>
<body class='hmmessage'><div dir='ltr'>
Hi,<br>yes I tried before pdftotext but the results of Okular are much better for my needs (parsing of pdf documents).<br>I need to parse "csv" or "fixed length" like documents that are unfortunately in pdf format, if anyone has any suggestion on how to parse them without translating them to text...<br><br><br><div>> From: aacid@kde.org<br>> To: okular-devel@kde.org<br>> Date: Thu, 10 Nov 2011 13:45:34 +0100<br>> Subject: Re: [Okular-devel] Export from pdf to txt,      invoking from the command line<br>> <br>> A Dijous, 10 de novembre de 2011, filippo di natale vàreu escriure:<br>> > Hi,<br>> > I like very much how Okular exports pdf to txt keeping the correct spacing<br>> > (doing the same with acrobat on windows gave no such clean results). Given<br>> > that I cannot invoke okular from the command line to make a pdf to txt<br>> > conversion (or so I seem to understand) which library okular uses to do its<br>> > pdf to txt conversion? Or, if it is developed internally in the project,<br>> > can it be used stand alone to make a command line pdf to txt converter, and<br>> > which part of the source code should I look ? Thanks,<br>> <br>> No, okular does not have a export to text command line. It should not be <br>> extremely difficult, but we do not have it yet.<br>> <br>> You can try to use pdftotext command line, it is not what okular uses but it <br>> is known to be good enough in some cases.<br>> <br>> Albert<br>> <br>> > <br>> > Filippo<br>> _______________________________________________<br>> Okular-devel mailing list<br>> Okular-devel@kde.org<br>> https://mail.kde.org/mailman/listinfo/okular-devel<br></div>                                         </div></body>
</html>