我打算写一个从网站上获取信息的解析器.
不管这个网站出了什么问题,我很快就会获取信息并将其放入文件中,这一切都是胡言乱语.
该网站是anidb.net
任何人都可以告诉我为什么我得到胡言乱语而不是HTML?
我的代码
<?php
$url = 'http://anidb.net/perl-bin/animedb.pl?show=anime&aid=854';
file_put_contents("file.txt", file_get_contents($url));
?>
Run Code Online (Sandbox Code Playgroud)
我还可以添加使用浏览器的View Source功能,我看到了HTML.
我检查了您指定的页面上的标题,并且它正在返回:
Content-Encoding: gzip
Run Code Online (Sandbox Code Playgroud)
这意味着你所看到的'乱码'确实是gzip编码的.这是另一个应该帮助你的线程: 解码通过PHP中的cURL检索的gzip网页