- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有大约。 Excel 中包含 RTF(包括格式标签)的 12000 个单元格。我需要解析它们以获得未格式化的文本。
这是带有文本的单元格之一的示例:
{\rtf1\ansi\deflang1060\ftnbj\uc1
{\fonttbl{\f0 \froman \fcharset0 Times New Roman;}{\f1 \fswiss \fcharset238
Arial;}}
{\colortbl ;\red255\green255\blue255 ;\red0\green0\blue0 ;}
{\stylesheet{\fs24\cf2\cb1 Normal;}{\cs1\cf2\cb1 Default Paragraph Font;}}
\paperw11908\paperh16833\margl1800\margr1800\margt1440\margb1440\headery720\footery720
\deftab720\formshade\aendnotes\aftnnrlc\pgbrdrhead\pgbrdrfoot
\sectd\pgwsxn11908\pghsxn16833\marglsxn1800\margrsxn1800\margtsxn1440\margbsxn1440
\headery720\footery720\sbkpage\pgncont\pgndec
\plain\plain\f1\fs24\pard TPR 0160 000\par IPR 0160 000\par OB-R-02-28\par}
我真正需要的是这个:
TPR 0160 000
IPR 0160 000
OB-R-02-28
简单循环单元格并删除不必要的格式的问题是,并不是这 12000 个单元格中的所有内容都像这样简单。所以我需要手动检查许多不同的版本并编写几个变体;但最终还是有很多手工工作要做。
但是,如果我将一个单元格的内容复制到空文本文档并将其另存为 RTF,然后用 MS Word 打开它,它会立即解析文本,我就得到了我想要的内容。不幸的是,对于 12000 个单元来说这样做非常不方便。
所以我正在考虑 VBA 宏,将单元格内容移动到 Word,强制解析,然后将结果复制回原始单元格。不幸的是我不太确定该怎么做。
有人有任何想法吗?或者有不同的方法?我将非常感谢您提供解决方案或插入正确的方向。
TNX!
最佳答案
如果您确实想使用 Word 解析文本,此函数应该可以帮助您。正如评论所建议的,您需要 MS Word 对象库的引用。
Function ParseRTF(strRTF As String) As String
Dim wdDoc As Word.Document 'Ref: Microsoft Word 11.0 Object Library'
Dim f As Integer 'Variable to store the file I/O number'
'File path for a temporary .rtf file'
Const strFileTemp = "C:\TempFile_ParseRTF.rtf"
'Obtain the next valid file I/O number'
f = FreeFile
'Open the temp file and save the RTF string in it'
Open strFileTemp For Output As #f
Print #f, strRTF
Close #f
'Open the .rtf file as a Word.Document'
Set wdDoc = GetObject(strFileTemp)
'Read the now parsed text from the Word.Document'
ParseRTF = wdDoc.Range.Text
'Delete the temporary .rtf file'
Kill strFileTemp
'Close the Word connection'
wdDoc.Close False
Set wdDoc = Nothing
End Function
您可以使用类似于以下的内容为 12,000 个单元中的每一个单元调用它:
Sub ParseAllRange()
Dim rngCell As Range
Dim strRTF As String
For Each rngCell In Range("A1:A12000")
'Parse the cell contents'
strRTF = ParseRTF(CStr(rngCell))
'Output to the cell one column over'
rngCell.Offset(0, 1) = strRTF
Next
End Sub
ParseRTF 函数运行大约需要一秒钟(至少在我的机器上),因此对于 12,000 个单元格,大约需要三个半小时。
<小时/>在周末思考这个问题后,我确信有一个更好(更快)的解决方案。
我记得剪贴板的 RTF 功能,并意识到可以创建一个类,将 RTF 数据复制到剪贴板,粘贴到 Word 文档,并输出生成的纯文本。该解决方案的好处是不必为每个 rtf 字符串打开和关闭单词 doc 对象;它可以在循环之前打开并在循环之后关闭。
下面是实现此目的的代码。它是一个名为 clsRTFParser 的类模块。
Private Declare Function GlobalAlloc Lib "kernel32" _
(ByVal wFlags&, ByVal dwBytes As Long) As Long
Private Declare Function GlobalLock Lib "kernel32" _
(ByVal hMem As Long) As Long
Private Declare Function GlobalUnlock Lib "kernel32" _
(ByVal hMem As Long) As Long
Private Declare Function lstrcpy Lib "kernel32" _
(ByVal lpString1 As Any, ByVal lpString2 As Any) As Long
Private Declare Function OpenClipboard Lib "user32" _
(ByVal Hwnd As Long) As Long
Private Declare Function EmptyClipboard Lib "user32" () As Long
Private Declare Function RegisterClipboardFormat Lib "user32" Alias _
"RegisterClipboardFormatA" (ByVal lpString As String) As Long
Private Declare Function SetClipboardData Lib "user32" _
(ByVal wFormat As Long, ByVal hMem As Long) As Long
Private Declare Function CloseClipboard Lib "user32" () As Long
'---'
Dim wdDoc As Word.Document 'Ref: Microsoft Word 11.0 Object Library'
Private Sub Class_Initialize()
Set wdDoc = New Word.Document
End Sub
Private Sub Class_Terminate()
wdDoc.Close False
Set wdDoc = Nothing
End Sub
'---'
Private Function CopyRTF(strCopyString As String) As Boolean
Dim hGlobalMemory As Long
Dim lpGlobalMemory As Long
Dim hClipMemory As Long
Dim lngFormatRTF As Long
'Allocate and copy string to memory'
hGlobalMemory = GlobalAlloc(&H42, Len(strCopyString) + 1)
lpGlobalMemory = GlobalLock(hGlobalMemory)
lpGlobalMemory = lstrcpy(lpGlobalMemory, strCopyString)
'Unlock the memory and then copy to the clipboard'
If GlobalUnlock(hGlobalMemory) = 0 Then
If OpenClipboard(0&) <> 0 Then
Call EmptyClipboard
'Save the data as Rich Text Format'
lngFormatRTF = RegisterClipboardFormat("Rich Text Format")
hClipMemory = SetClipboardData(lngFormatRTF, hGlobalMemory)
CopyRTF = CBool(CloseClipboard)
End If
End If
End Function
'---'
Private Function PasteRTF() As String
Dim strOutput As String
'Paste the clipboard data to the wdDoc and read the plain text result'
wdDoc.Range.Paste
strOutput = wdDoc.Range.Text
'Get rid of the new lines at the beginning and end of the document'
strOutput = Left(strOutput, Len(strOutput) - 2)
strOutput = Right(strOutput, Len(strOutput) - 2)
PasteRTF = strOutput
End Function
'---'
Public Function ParseRTF(strRTF As String) As String
If CopyRTF(strRTF) Then
ParseRTF = PasteRTF
Else
ParseRTF = "Error in copying to clipboard"
End If
End Function
您可以使用类似于以下的内容为 12,000 个单元中的每一个单元调用它:
Sub CopyParseAllRange()
Dim rngCell As Range
Dim strRTF As String
'Create new instance of clsRTFParser'
Dim RTFParser As clsRTFParser
Set RTFParser = New clsRTFParser
For Each rngCell In Range("A1:A12000")
'Parse the cell contents'
strRTF = RTFParser.ParseRTF(CStr(rngCell))
'Output to the cell one column over'
rngCell.Offset(0, 1) = strRTF
Next
End Sub
我已经在我的机器上使用示例 RTF 字符串模拟了这一点。对于 12,000 个细胞,需要两分半钟,这是一个更合理的时间范围!
关于excel - Excel 中的富文本格式(带有格式化标签)为无格式文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1673025/
我的意思是这三个富人的论点: #{rich:clientId('id')} #{rich:element('id')} #{rich:component('id')} 例如在这些方法调用(action
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: What are the differences between pointer variable and
对于实习,我将不得不开发一个桌面应用程序。重点是创建丰富的 UI(酷炫的效果、声音等)。我应该使用哪种技术? - 闪光 ? (在这种情况下,我应该使用 flex 项目吗?AIR ?这和一个简单的 ra
关闭。这个问题需要更多 focused .它目前不接受答案。 想改进这个问题?更新问题,使其仅关注一个问题 editing this post . 7年前关闭。 Improve this questi
关闭。这个问题是opinion-based 。目前不接受答案。 想要改进这个问题吗?更新问题,以便 editing this post 可以用事实和引文来回答它。 . 已关闭 9 年前。 Improv
我想知道这一行的作用: foo || (foo = this.foo) 在下面的函数定义中 someFunction: function(foo) { foo || (foo = thi
我有一个数据模型,其中有一个 Item可以属于一个或多个 Categories .我正在尝试显示 允许用户选择哪个Categories Item应该属于。我正在使用 RichFaces 和 Seam
我意识到我大部分时间都在使用三元运算符,如下所示: foo ? foo:酒吧; 这变得很麻烦,因为变量长度变得很长,例如。克。 appModel.settings.notifications ? ap
我要做出一个设计决定。 在我的 web(ajax) 应用程序中,我们需要决定将用户界面逻辑放在哪里? 是否应该通过 javascript 完全加载(纯单页)。只有数据来来去去。 或 服务器是否应该发送
有人向我指出我在某些 C++ 代码中有一个看起来像拼写错误的地方: protected: Foo x, y,; 我原以为结尾的逗号会出错,但显然不是?这是未定义的,还是发生了什么?大概是坏事
谁能解释一下这是做什么的? var foo = foo || alert(foo); 最佳答案 如果 foo 已经被定义并且计算结果为真,它设置 foo = foo,即它什么都不做。 如果定义了 fo
看起来这应该是可能的,但是......? 使用 richfaces 和 JSF,我正在使用 rich:dataList 遍历 List ...一切都很好,除了我希望能够选择性地“呈现”每次迭代,这可能
我有以下带有 rich:calendar 的 xhtml 文件,我正试图禁用一些日子 using this example .但是永远不会调用 javascript 函数。我不知道为什么。
我的应用程序在 90% 的时间里都使用 Ajax 调用来获取后端数据。我需要为所有这些调用实现 CSRF 预防。所以我需要在每次调用时传递 token 。我在哪里生成 token ?在客户端还是服务器
我正在尝试重构和引入一些旧代码,我遇到了这样的事情: struct foo; typedef struct foo * foo; 尝试编译它时,出现以下错误: Sourc
我想使用类似 TextView 的东西进行类似串行/TTY/文本终端的同步用户交互。我的意思是我需要以下操作: 在末尾添加一些新文本(使用各种 Span 设置样式) 同步等待用户在最后输入一些进一步的
片段 1: if ( x ) { foo(); } 片段 2: x ? foo() : 0; 这两个片段之间有什么区别? 编辑:更正了语法错误。 更新:顺便说一句,似乎还有一个更短的符号:
这个问题已经有答案了: How do I compare strings in Java? (23 个回答) 已关闭 7 年前。 我的类实现了一个非常简单的 RPN 计算器原型(prototype)。
我正在我的元素中使用,我需要为其自定义 CSS。我想在文件上传按钮中删除“+”标记(参见图片),我该怎么做? 提前致谢。 最佳答案 只是覆盖样式,按钮类是rf-fu-btn-cnt-add,加号是背景
我在 jsf .xhtml 页面中有一个 richdatatable。我有一个特定单元格的很长的文本。我如何设置列的宽度并在指定的单元格中显示文本。我是 JSF 和 CSS 的新手。我正在提供一个例子
我是一名优秀的程序员,十分优秀!