我有这个python爬虫输出
[+] Site to crawl: http://www.example.com
[+] Start time: 2020-05-24 07:21:27.169033
[+] Output file: www.example.com.crawler
[+] Crawling
[-] http://www.example.com
[-] http://www.example.com/
[-] http://www.example.com/icons/ubuntu-logo.png
[-] http://www.example.com/manual
[i] 404 Not Found
[+] Total urls crawled: 4
[+] Directories found:
[-] http://www.example.com/icons/
[+] Total directories: 1
[+] Directory with indexing
Run Code Online (Sandbox Code Playgroud)
我想使用 awk 或任何其他工具在“爬行”和“爬行的总网址”之间划清界限,所以基本上我想使用变量将 NR 分配给第一个关键字“爬行”,并将第二个变量分配给它 NR第二个限制器“爬行的总网址”的值,然后削减两者之间的范围,我尝试了这样的事情:
awk 'NR>$(Crawling) && NR<$(urls)' file.txt
Run Code Online (Sandbox Code Playgroud)
但没有什么真正奏效,我得到的最好的是从 Crawling+1 行到文件末尾的剪切,这实际上没有帮助,所以如何做以及如何使用带有变量的 awk 剪切一系列行!