<html>
<head>
<style><!--
.hmmessage P
{
margin:0px;
padding:0px
}
body.hmmessage
{
font-size: 10pt;
font-family:Tahoma
}
--></style>
</head>
<body class='hmmessage'>
Hello,<br><br><br>Project background:<br><br>I need to read .doc files in asp.net. It's needed for our project (converter).<br>I have downloaded documentation from Microsoft about msword file format.<br>But the instruction is very tangled and contains just description of different msword structures.<br>I can read compound file format (OLE2) and get any stream from it such as "WordDocument" "Table1" "Table0" etc.<br>I can get text from "WordDocument" stream. As I know there is all text of whole documents.<br>Also I have download wvWare 2 but can't compile it.<br>What I want is to know how parse the .DOC files and get text formatting such as font name,color,size,boldness etc.<br><br>My question:<BR>Could you advise me how to read text formatting? What structures should I read for that in my .NET project?<br><BR><br>Your any advice and suggestion will be very helpful for me!<br><br>Thank you in advance,<br><br><br><br>Kardapolov Yuriy<br>                                     </body>
</html>