小编Ano*_*oop的帖子

用表等读取word文档(*.doc)内容

我有一个word文档(2003).我正在使用Powershell来解析文档的内容.该文档顶部包含几行文本,十几个表具有不同的列数,然后是一些文本.

我希望能够像下面这样阅读文档:

  1. 阅读文件(制作必要的物品等)
  2. 获取每行文字
  3. 如果不是表的一部分,则处理为文本和写入输出
  4. 其他
  5. 如果是表的一部分
  6. 获取表号(按顺序)并根据列解析输出
  7. 万一

下面是我开始编写的powershell脚本:

$objWord = New-Object -Com Word.Application
$objWord.Visible = $false
$objDocument = $objWord.Documents.Open($filename)
$paras = $objDocument.Paragraphs
foreach ($para in $paras) 
{ 
    Write-Output $para.Range.Text
}
Run Code Online (Sandbox Code Playgroud)

我不确定段落是否是我想要的.有什么更适合我的目的吗?我现在得到的只是文件的全部内容.我如何控制我得到的东西.就像我想得到一条线,能够确定它是否是表的一部分,并根据它的数字表采取行动.

powershell ms-word

5
推荐指数
1
解决办法
2万
查看次数

标签 统计

ms-word ×1

powershell ×1