有一段时间,我一直试图找到一种方法,通过消除与广告和所有其他杂乱相关的文本,智能地从URL中提取"相关"文本.经过几个月的研究,我把它作为一个问题放弃了无法准确确定.(我尝试了不同的方法,但没有一个是可靠的)
一周后,我偶然发现了Readability - 一个将任何URL转换为可读文本的插件.它看起来非常准确.我的猜测是,他们以某种方式拥有足够聪明的算法来提取相关文本.
有谁知道他们是怎么做到的?或者我怎么能可靠地做到这一点?
有没有人将BeautifulSoup与ASP.NET/C#集成(可能使用IronPython或其他方式)?是否有一个BeautifulSoup替代品或一个与ASP.NET/C#很好地工作的端口
计划使用该库的目的是从任何随机URL中提取可读文本.
谢谢
我一直在寻找几个用于ASP.NET的Mocking框架,并遇到了Microsoft Moles.这似乎是微软研究团队的一部分,并且想知道如果有人在这里选择Moles而不是其他成熟的Mocking框架,如Moq.
在ASP.NET环境中,播放mp3文件的最佳方式是什么?我是否需要使用Flash插件(某些用户可能没有闪存).此外,这需要在IPhone或IPod上工作.
asp.net ×3
asp.net-mvc ×1
c# ×1
extraction ×1
ironpython ×1
javascript ×1
mocking ×1
moq ×1
mp3 ×1