<html>
<head>
<style><!--
.hmmessage P
{
margin:0px;
padding:0px
}
body.hmmessage
{
font-size: 10pt;
font-family:Tahoma
}
--></style>
</head>
<body class='hmmessage'>
Hello,<br><br><br>Project background:<br><br>I need to read .doc files in asp.net. It's needed for our project (converter).<br>I have downloaded documentation from Microsoft about msword file format.<br>But the instruction is very tangled and contains just description of different msword structures.<br>I can read compound file format (OLE2) and get any stream from it such as "WordDocument" "Table1" "Table0" etc.<br>I can get text from "WordDocument" stream. As I know there is all text of whole documents.<br>Also I have download wvWare 2 but can't compile it.<br>What I want is to know how parse the .DOC files and get text formatting such as font name,color,size,boldness etc.<br><br>My question:<br>Could you advise me how to read text formatting? What structures should I read for that in my .NET project?<br><br>Your any advice and suggestion will be very helpful for me!<br><br>Thank you in advance,<br><BR><br><BR>Kardapolov Yuriy<br><BR><br><BR><br><BR>>I'm not really working on wvWare anymore. Actually, the code has been copied <br><BR>>into the Calligra office suite (http://www.calligra-suite.org) repository, and <br>>that is where people are really working on the filter. It might be better to <br>>contact them with your questions.<br><br>-Benjamin<br><br>On Thursday 14 April 2011 04:23:26 you wrote:<br>> Hello Benjamin Cail,<br>>  <br>> My questions:<br>> <br>> 1) Is it possible to compile wvWare 2 in MS Visual C++ 6? Is there other<br>> alternative to compile wvWare 2 in Windows where I will be able to debug<br>> and trace the code?<br>> <br>> 2) Could you advise me how to read text formatting? What structures should<br>> I read for that?<br>> <br>> Your any advice and suggestion will be very helpful for me!<br>> <br>> Thank you in advance,<br> <br>> Kardapolov Yuriy<br>                                        </body>
</html>