小编ima*_*dei的帖子

Excel中的格式文本格式(带有格式化标签),用于未格式化的文本

我有约.excel中包含RTF的12000个单元格(包括格式化标签).我需要解析它们以获取未格式化的文本.

这是带有文本的其中一个单元格的示例:

{\rtf1\ansi\deflang1060\ftnbj\uc1
{\fonttbl{\f0 \froman \fcharset0 Times New Roman;}{\f1 \fswiss \fcharset238
Arial;}}
{\colortbl ;\red255\green255\blue255 ;\red0\green0\blue0 ;}
{\stylesheet{\fs24\cf2\cb1 Normal;}{\cs1\cf2\cb1 Default Paragraph Font;}}
\paperw11908\paperh16833\margl1800\margr1800\margt1440\margb1440\headery720\footery720
\deftab720\formshade\aendnotes\aftnnrlc\pgbrdrhead\pgbrdrfoot
\sectd\pgwsxn11908\pghsxn16833\marglsxn1800\margrsxn1800\margtsxn1440\margbsxn1440
\headery720\footery720\sbkpage\pgncont\pgndec
\plain\plain\f1\fs24\pard TPR 0160 000\par IPR 0160 000\par OB-R-02-28\par}
Run Code Online (Sandbox Code Playgroud)

而我真正需要的是这个:

TPR 0160 000
IPR 0160 000
OB-R-02-28
Run Code Online (Sandbox Code Playgroud)

简单地循环遍历单元格并删除不必要的格式化的问题是,并非这些12000单元格中的所有内容都像这样简单.所以我需要手动检查许多不同的版本并编写几个变体; 并且最后还会有很多手工工作要做.

但是,如果我将一个单元格的内容复制到空文本文档并将其保存为RTF,然后用MS Word打开它,它会立即解析文本,我得到了我想要的内容.不幸的是,对于12000个电池来说这是非常不方便的.

所以我在考虑VBA宏,将单元格内容移动到Word,强制解析然后将结果复制回原始单元格.不幸的是,我不确定该怎么做.

有人有什么想法吗?还是一种不同的方法?我将非常感谢解决方案或推动正确的方向.

TNX!

excel parsing vba rtf

3
推荐指数
1
解决办法
3万
查看次数

标签 统计

excel ×1

parsing ×1

rtf ×1

vba ×1