小编Hüs*_*gin的帖子

Html 解析与正则表达式

我有一个固定的结构良好的 html 源,传入的数据清晰且小,只包含一些 div 列表。我知道使用 html 解析器进行 html 解析,但这看起来像是一种特殊情况,我不确定应该使用哪一个。问题情况如下

  • 数据清晰且结构良好
  • 数据量小
  • 性能很重要,应用程序必须能够获取尽可能多的数据
  • 应用程序将数据写入MongoDB数据库
  • 实现编程语言为 Scala 或 Python

任何意见都很有价值,那我该怎么办?

html python regex scala html-parsing

3
推荐指数
1
解决办法
3628
查看次数

标签 统计

html ×1

html-parsing ×1

python ×1

regex ×1

scala ×1