HTML下载和文本提取

Cam*_*mel 4 html linux text-extraction download

下载URL列表并仅提取文本内容的好工具或工具集是什么?不需要Spidering,但控制下载文件名称和线程将是一个奖励.

该平台是linux.

dsm*_*dsm 5

wget | html2ascii

注意:html2ascii也可以被调用html2ahtml2text(我无法在网上找到合适的手册页).

另见:lynx.