有没有人有一个分裂html字符串(来自一个小的mce编辑器)并使用C#将它分成N个部分的例子?
我需要均匀地分割字符串而不分割单词.
我想只是拆分html并使用HtmlAgilityPack尝试修复损坏的标签.虽然我不确定如何找到分裂点,但理想情况下它应该基于文本而不是html.
谁有任何想法如何去做?
UPDATE
根据要求,这是输入和所需输出的示例.
INPUT:
<p><strong>Lorem ipsum dolor sit amet, <em>consectetur adipiscing</em></strong> elit.</p>
Run Code Online (Sandbox Code Playgroud)
输出(当分成3个小组时):
Part1: <p><strong>Lorem ipsum dolor</strong></p>
Part2: <p><strong>sit amet, <em>consectetur</em></strong></p>
Part3: <p><strong><em>adipiscing</em></strong> elit.</p>
Run Code Online (Sandbox Code Playgroud)
更新2:
我刚刚玩过Tidy HTML,这似乎很适合修复损坏的标签,所以如果我能找到一种方法来找到拆分品牌,这可能是个不错的选择?
更新3
在.NET C#中对整个单词使用类似于此Truncate字符串的方法,我现在设法获得将构成每个部分的纯文本单词列表.所以,比如说使用Tidy HTML我有一个有效的HTML结构用于html,并且给出了这个单词列表,任何人都知道现在最好的分割方法是什么?
更新4
任何人都可以看到使用正则表达式以下列方式使用HTML查找索引的问题:
给定纯文本字符串"sit amet,consectetur",用正则表达式替换所有空格"(\ s | <(.| \n)+?>)*",理论上找到具有空格和/或任意组合的字符串标签
那么我可以使用Tidy HTML来修复损坏的html标签吗?
非常感谢
马特
我不喜欢<iostream>在C++库中使用.我更喜欢使用类似于"printf"和"scanf"的东西<stdio.h>.
我可以使用Boost的格式库替换<iostream>我的所有C++程序吗?
有没有人知道任何使用使用编译时技术实现的设计模式的库,例如模板元编程?我知道Loki实现了一些,但我需要找到其他库.
我有两个类,一个继承自另一个.编译时,我收到以下错误:
Entity.obj:错误LNK2019:未解析的外部符号"public:__thiscall Utility :: Parsables :: Base :: Base(void)"(?? 0Base @ Parsables @ Utility @@ QAE @ XZ)在函数"public:__thiscall Utility"中引用:: Parsables :: Entity :: Entity(void)"(?? 0Entity @ Parsables @ Utility @@ QAE @ XZ)
Entity.obj:错误LNK2019:未解析的外部符号"public:virtual __thiscall Utility :: Parsables :: Base :: ~Base(void)"(?? 1Base @ Parsables @ Utility @@ UAE @ XZ)在函数"public"中引用: virtual __thiscall Utility :: Parsables :: Entity ::〜Entity(void)"(?? 1Entity @ Parsables @ Utility @@ UAE @ XZ)
D:\ Programming\Projects\Caffeine\Debug\Caffeine.exe:致命错误LNK1120:2个未解析的外部
我真的无法弄清楚发生了什么......谁能看到我做错了什么?我正在使用Visual C++ Express 2008.这是文件..
"包括/实用/ Parsables/Base.hpp"
#ifndef CAFFEINE_UTILITY_PARSABLES_BASE_HPP
#define CAFFEINE_UTILITY_PARSABLES_BASE_HPP …Run Code Online (Sandbox Code Playgroud) 有没有办法找出c#中是否存在电子邮件地址?
例如,我有一个电子邮件地址,如abcded@yahoo.com或asdf234@hotmail.com我该如何进行验证?
我已经有一段Visual Studio 2008键盘快捷键列在我的墙上很长一段时间了 - http://nerdfortress.s3.amazonaws.com/visual-studio-2008-keyboard-shortcuts.html.
有没有人知道Visual Studio 2010类似的东西?
我有一段时间记下了我的一些代码:
/**
* Add a BCC.
*
* Note that according to the conventions of the SMTP protocol all
* addresses, including BCC addresses, are included in every email as it
* is sent over the Internet. The BCC addresses are stripped off blind
* copy email only at the destination email server.
*
* @param string $email
* @param string $name
* @return object Email
*/
Run Code Online (Sandbox Code Playgroud)
我不记得从哪里得到它(可能的来源),但这不应该与这个问题相关.基本上,每当我尝试通过SMTP发送带有BCC的电子邮件时,BCC地址都不会被隐藏 - 我已经阅读了整个RFC的SMTP协议(几年前),我认为我什么都没有丢失.
奇怪的是,如果我使用内置mail()函数向BCC发送电子邮件,一切正常,我不知道为什么 - 我想推送自己的电子邮件发件人,但我不明白这一点.
有人可以对这个黑暗的主题有所了解吗?
我无法通过joshua bloch的"java puzzlers"来制作以下代码的正面或反面.
public class Test22{
public static void main(String args[]){
int j=0;
for(int i=0;i<100;i++){
j=j++;
}
System.out.println(j); //prints 0
int a=0,b=0;
a=b++;
System.out.println(a);
System.out.println(b); //prints 1
}
}
Run Code Online (Sandbox Code Playgroud)
我不能得到j打印0的部分.据作者说,
j=j++
Run Code Online (Sandbox Code Playgroud)
类似于
temp=j;
j=j+1;
j=temp;
Run Code Online (Sandbox Code Playgroud)
但
a=b++
Run Code Online (Sandbox Code Playgroud)
制作b 1.所以它应该像这样评估,
a=b
b=b+1
Run Code Online (Sandbox Code Playgroud)
遵循相同的逻辑,不应该
j=j++
Run Code Online (Sandbox Code Playgroud)
被评估为,
j=j
j=j+1
Run Code Online (Sandbox Code Playgroud)
这里的温度在哪里?任何解释都将非常感激."我对此深有所怀疑.;)>>提前致谢.
在CouchDb的文档中,所描述的删除文档附件的方法是向附件的URL发送DELETE调用.
但是,我注意到如果您编辑文档并从_attachment字段中删除附件存根,则将无法再访问它.
如果我从下面的文档中删除foo.txt并保存到CouchDb,它将在下次访问文档时消失:
{
"_id":"attachment_doc",
"_rev":1589456116,
"_attachments":
{
"foo.txt":
{
"stub":true,
"content_type":"text/plain",
"length":29
}
}
}
Run Code Online (Sandbox Code Playgroud)
附件是否实际上已删除在磁盘上或只是删除了它的引用?
我目前md5_file()用来运行大约15个URL并验证他们的MD5哈希值.有没有办法让我更快?贯穿所有这些需要太长时间.