小编ali*_*jel的帖子

如何将网页内容下载到与网页完全相同的文本文件中？

我正在尝试从网页中提取一些信息。想象一下，您有一个名字（俄罗斯西伯利亚中北部），并且想要从网页中提取包含该名称的整行。为了解决这个问题，我使用 lynx 命令 ( ) 将网页 ( https://geofon.gfz-potsdam.de/eqinfo/list.php) 下载到文本文件中lynx --dump "https://geofon.gfz-potsdam.de/eqinfo/list.php" > text.txt，并尝试 grep 包含名称“俄罗斯西伯利亚中北部”的行。下面一行显示了网页中的信息，所有信息都是连续的：

\n\n

2018-05-27 04:27:17 4.8 60.07\xc2\xb0N 128.42\xc2\xb0E    10  A       Northcentral Siberia, Russia\n

Run Code Online (Sandbox Code Playgroud)\n\n

但是当我将网页下载到文本文件中时，上面的行分成两行，如下所示：

\n\n

2018-05-27 04:27:17 4.8 60.07\xc2\xb0N 128.42\xc2\xb0E    10  A   Northcentral \nSiberia, Russia\n

Run Code Online (Sandbox Code Playgroud)\n\n

在这种情况下，如果我尝试使用其全名（俄罗斯西伯利亚北部）和 grep 提取该行，它将失败。我该如何处理呢？

grep lynx

ali*_*jel

2018 05-28

2
推荐指数

1
解决办法

1546
查看次数

标签统计

grep ×1

lynx ×1

如何将网页内容下载到与网页完全相同的文本文件中？

标签 统计

小编ali_jel的帖子

标签统计