相关疑难解决方法(0)

使用Html Agility Pack从HTML BODY节点提取内部文本

需要HTML Agility Pack的帮助!

基本上我想用HTML的正文节点获取纯文本.到目前为止,我已经在vb.net中尝试了这个并且它无法返回innertext意味着没有看到任何变化,至少从我能看到的内容.

Dim htmldoc As HtmlDocument = New HtmlDocument
htmldoc.LoadHtml(html)

Dim paragraph As HtmlNodeCollection = htmldoc.DocumentNode.SelectNodes("//body")

If Not htmldoc Is Nothing Then
   For Each node In paragraph
       node.ParentNode.RemoveChild(node, True)
   Next
End If

Return htmldoc.DocumentNode.WriteContentTo
Run Code Online (Sandbox Code Playgroud)

我试过这个:

Return htmldoc.DocumentNode.InnerText
Run Code Online (Sandbox Code Playgroud)

但还是没有运气!

任何建议???

html c# vb.net html-agility-pack

10
推荐指数
1
解决办法
2万
查看次数

HtmlAgilityPack - 获取文档中的所有节点

我想使用HtmlAgilityPack将遍历documnet中的所有节点

foreach (HtmlNode node in myhtml.DocumentNode.SelectNodes("//@"))
Run Code Online (Sandbox Code Playgroud)

做?

c# xpath html-agility-pack

10
推荐指数
1
解决办法
1万
查看次数

C#:HtmlAgilityPack提取内部文本

我正在使用HtmlAgilityPack.是否有一行代码可以获取html的所有内部文本,例如,删除所有html标签和脚本?

c# html-parsing

7
推荐指数
1
解决办法
2万
查看次数

使用CSQuery解析HTML

如何div使用CSQuery通过ID 从标记中检索值?

例如,

<h3>
    <div id='type'>
        Room 1
    </div>
    <div id='price'>
        145
    </div>
</h3>
Run Code Online (Sandbox Code Playgroud)

在这种情况下,我想把内容type和内容price.

html c# asp.net parsing csquery

6
推荐指数
1
解决办法
1万
查看次数

如何用HtmlAgilityPack解析<option>标签的InnerText?

语境:

我试图在这里解析这个页面中的"城市" .我已经设法模拟了这个组合框的数据请求,这是一个Ajax调用.

小提琴请求:

POST http://www.telelistas.net/AjaxHandler.ashx HTTP/1.1
Host: www.telelistas.net
Connection: keep-alive
Content-Length: 106
Origin: http://www.telelistas.net
X-Requested-With: XMLHttpRequest
User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko)      Chrome/23.0.1271.97 Safari/537.11
Content-Type: application/x-www-form-urlencoded; charset=UTF-8
Accept: */*
Referer: http://www.telelistas.net/
Accept-Encoding: gzip,deflate,sdch
Accept-Language: pt-BR,pt;q=0.8,en-US;q=0.6,en;q=0.4
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.3
Cookie: cert_Origin=directo; email=bdc.testes@gmail.com; auto=automatico=0; searchparameters=bottom=0&btnsite=0&email=&uf=rj&origem=0&nome=&pagina=1&codlogradouro=&predio=213&tiquete=0&localidadeendmap=&codbairro=0&pcount=25&estacionamento=0&letra=&top=&entrega=0&pchave=&info=&logradouro=rua+da+lapa&codtitulo=-1&chave=&zoom=&comercial=0&ddd=0&comib=0&btnemail=0&pgresultado=&localidade=&telefone=&manobrista=0&codlocalidade=21000&site=&cartoes=0&atividade=&bairro=&reserva=0&residencial=0; perfil=logged=1&iduser=2563063&email=bdc.testes@gmail.com&usertype=2&specialsearch=3&siteusernome=BigDataCorp&siteuserdatanasc=15/01/1988&siteusersexo=M&siteuserlocalidade=21000&siteuseruf=RJ&siteuserddd=21&siteusertelefone=94118439&siteuserprofissao=4&siteuserrenda=5000&siteuserformacao=4&siteusernovidades=0&siteusernovidadesrevista=&siteusernovidadesparceiros=0&siteusercpf=10541308769&siteuseracesso=brasil&siteusercep=22631000&siteuseridade=24&siteuserparceiro=telelistas&siteuserconhecimento=2&siteuseroperadora=oi&siteuserurlorigem=http://www.telelistas.net/&siteuserdatacadastro=13/12/2012 11:45:00; __utma=70879631.392027796.1355939587.1356014801.1356021821.5; __utmb=70879631.1.10.1356021821; __utmc=70879631; __utmz=70879631.1355939587.1.1.utmcsr=(direct)|utmccn=(direct)|utmcmd=(none)

PostData : state=rj&style=busca_interna&selectedCity=21000&clientId=pch_localidade_select&method=GetSearchCitiesNamed
Run Code Online (Sandbox Code Playgroud)

问题:

以下是此请求返回的字符串片段:

<select name='pch_localidade_select' class='busca_interna' id='pch_localidade_select' tabindex="4"><option value="">Selecione</option><option selected value="21000">Rio de Janeiro</option><option value="21380">Abraão</option><option value="21001">Afonso Arinos</option><option value="21002">Agência Luterback</option><option value="21847">Agriões de Dentro</option>
Run Code Online (Sandbox Code Playgroud)

我想要做的是达到InnerText …

c# html-agility-pack

3
推荐指数
1
解决办法
4055
查看次数

标签 统计

c# ×5

html-agility-pack ×3

html ×2

asp.net ×1

csquery ×1

html-parsing ×1

parsing ×1

vb.net ×1

xpath ×1