我需要匹配所有这些开始标记:
<p>
<a href="foo">
Run Code Online (Sandbox Code Playgroud)
但不是这些:
<br />
<hr class="foo" />
Run Code Online (Sandbox Code Playgroud)
我想出了这个,并希望确保我做对了.我只抓住了a-z.
<([a-z]+) *[^/]*?>
Run Code Online (Sandbox Code Playgroud)
我相信它说:
/,然后我有这个权利吗?更重要的是,你怎么看?
我正在寻找一种方法将HTML文本转换为RTF字符串.是否有任何图书馆可以完成这项工作.我在项目中动态获取html内容,需要以RTF格式呈现.我正在使用HTML解析器将HTML文本转换为普通字符串,然后尝试使用PyRTF转换为RTF格式.有没有更好的方法可以做到这一点.谢谢你提前.
我已经在网站上看到很多关于RTF到HTML的帖子以及其他一些关于一些HTML到RTF转换器的帖子,但我真的想要全面细分被认为是最广泛使用的商业产品,开放源产品或人们建议回家种植.如果您认为这是一个重复的问题,请道歉,但我正在尝试创建一个产品矩阵,以查看我们的应用程序最可行的内容.我也认为这对其他人有帮助.
转换器将用于ASP.NET 2.0应用程序(我们将很快升级到3.5但仍然坚持使用WebForms)使用SQLServer 2005(很快就会在2008年)作为数据库.
通过阅读一些帖子,SautinSoft似乎很受欢迎作为商业组件.您是否建议将HTML转换为RTF的其他商业组件?价格确实很重要,但即使它在昂贵的一面有点,请列出来.
对于开源,我读到OpenOffice.org可以作为服务运行,以便它可以转换文件.但是,这似乎只是基于Java的.我想,我需要某种互操作才能使用它?什么.NET开源组件(如果有的话)用于将HTML转换为RTF?
对于本土,XSLT是XHTML的一种方式吗?如果是这样,您建议使用什么组件生成XHTML?否则,你推荐其他家庭成长的复仇者.
此外,请注意我目前不太关心RTF到HTML.如果商业组件提供这个并且价格仍然相同,那很好,否则请不要提及它.