gpt4 book ai didi

powershell - 阅读带有表格等的word文档(*.doc)内容

转载 作者:行者123 更新时间:2023-12-03 19:58:29 24 4
gpt4 key购买 nike

我有一个word文档(2003)。我正在使用 Powershell 来解析文档的内容。
该文档在顶部包含几行文本,十几个具有不同列数的表格,然后是更多文本。

我希望能够像下面这样阅读文档:

  • 阅读文档(制作必要的对象等)
  • 获取每一行文本
  • 如果不是表的一部分,则作为文本处理并写入输出
  • 否则
  • 如果表的一部分
  • 获取表号(按顺序)并根据列解析输出
  • 结束如果

  • 下面是我开始编写的powershell脚本:
    $objWord = New-Object -Com Word.Application
    $objWord.Visible = $false
    $objDocument = $objWord.Documents.Open($filename)
    $paras = $objDocument.Paragraphs
    foreach ($para in $paras)
    {
    Write-Output $para.Range.Text
    }

    我不确定段落是否是我想要的。有什么更适合我的目的吗?
    我现在得到的只是文档的全部内容。我如何控制我得到的东西。就像我想得到一条线一样,能够确定它是否是表格的一部分,并根据它是什么数字表格采取行动。

    最佳答案

    您可以通过 Tables 枚举 Word 文档中的表格。收藏。 Rows Columns 属性将允许您确定给定表中的行数/列数。可以通过 Cell 访问单个单元格目的。

    将打印文档中每个表格的最后一行和最后一列中单元格值的示例:

    $wd = New-Object -ComObject Word.Application
    $wd.Visible = $true
    $doc = $wd.Documents.Open($filename)
    $doc.Tables | ForEach-Object {
    $_.Cell($_.Rows.Count, $_.Columns.Count).Range.Text
    }

    关于powershell - 阅读带有表格等的word文档(*.doc)内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13105142/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com