这对我来说只是一项爱好任务。我尝试通过 scapy 获取 booking.com 起始页 html。
\n\n def start_requests(self):\n print(\'step 1\')\n start_url = \'https://www.booking.com\'\n yield scrapy.Request(url=start_url, headers=self.headers, callback=self.step2)\n\n def step2(self, response):\n print(\'step 2\')\n print(response.status)\n print(response.headers)\n print(response.text)\n\nRun Code Online (Sandbox Code Playgroud)\n\n我在response.text 中得到一些奇怪的东西。这是响应的部分:
\n\n\nO\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbdxa\xef\xbf\xbdX\xef\xbf\xbd\xef\xbf\xbd_\ \O^\'IM\xef\xbf\xbdl\xef\xbf\xbdF\xef\xbf\xbd\xef\xbf\xbd6(]1\xef\xbf\xbdr\xef\xbf\xbd\xef\xbf\ xbdLB>\xef\xbf\xbdO\xef\xbf\xbdg\xef\xbf\xbd#p.\xef\xbf\xbd:x\xef\xbf\xbd}8Rh\xef\xbf\xbd\xef\xbf\ xbd\xef\xbf\xbd\xd3\x93\xef\xbf\xbdQ\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd2h\xef\xbf\xbd\xef\xbf\xbd\xc6\ xbaU\xef\xbf\xbds\xef\xbf\xbd&\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd0{\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbdl ] Y&\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbdF9\xef\xbf\xbd@\xef\xbf\xbdWCR\xef\xbf\ xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd7\xef\xbf\xbd* *)JE-\xef\xbf\xbd-\xef\xbf\xbd\xef\xbf\xbd&\xef\xbf\xbd\xef\xbf\xbd\n )\xd4\xbcS\xef\xbf\xbd\xef \xbf\xbd\xef\xbf\xbd\xef\xbf\xbdy\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbdz\xef\xbf\xbdR\xef\xbf\xbd@\xef\ xbf\xbdJ\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd1\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\ xbdN\xef\xbf\xbd\xef\xbf\xbd60\xef\xbf\xbd\xef\xbf\xbd&\'\xef\xbf\xbdlK\xef\xbf\xbdE\xef\xbf\xbd J\xef\
R.\xd2\x98\xc9\xa7\xef\xbf\xbde\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbdS\xef\xbf\xbd\xef\xbf\xbd\xcf\xb5\xef\xbf\xbd\xef\xbf\xbdC\xef\xbf\xbd(\xef\xbf\xbd\xef\xbf\xbd6$\xef\xbf\xbd&\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbdL2\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd{\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbdB^\xef\xbf\xbd@\xef\xbf\xbd\xef\xbf\xbd~~[\'\xef\xbf\xbd \xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbdT2\xef\xbf\xbd|"|\xef\xbf\xbd\xef\xbf\xbdX\xef\xbf\xbdL\n 5\xcb\x94-\xef\xbf\xbd\xd8\xae\xef\xbf\xbd Axbf \xbd8\xef\xbf\xbd\xef\xbf\xbdX\xef\xbf\xbd@5`\xef\xbf\xbdy*\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd:\ xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbdO\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xe2\x8e\xbb\xef\xbf\xbd\xef\ xbf\xbd\xe2\x90\x8a\xef\xbf\xbd\xef\xbf\xbdR\xef\xbf\xbd\xef\xbf\xbd71\xe2\x94\xb4\xef\xbf\xbdA"\xe2\x89 \xa0\xef\xbf\xbdE\xd9\xb9\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd[\xef\xbf\xbd9B\xef\xbf\xbd\ xef\xbf\xbd6,\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd#\xef\xbf\xbd$0%(L\xef\xbf\xbd2\'\ xc2\xb0\xef\xbf\xbd\xef\xbf\xbd\xe2\x89\xa4\xe2\x89\xa5\xef\xbf\xbd&\xef\xbf\xbd\xc4\x8e\xef\xbf\xbdL\ xc8\x8b7\xef\xbf\xbd <\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd*p\xef\xbf\xbdABU\xef\xbf\xbd\xc4 \x81lK\xef\xbf\xbd=\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbdi\xdd\x90\xef\xbf\xbd\'\xef\xbf\xbdb>I\xef\ xbf\xbd\'\xef\xbf\xbdJ\xef\xbf\xbd\xef\xbf\xbdo7\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\ xbf\xbde\xef\xbf\xbd|\n \xef\xbf\xbd\xe2\x89\xa5\xef\xbf\xbd4\xef\xbf\xbd\xef\xbf\xbdV\xc4\x8f\xef\xbf\xbdL\xef\xbf\xbd0\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xe2\x97 \x86\xef\xbf\xbdx\xd5\x92Pef\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd&l\xef\xbf\xbd\xef\xbf\xbdd{X \xef\xbf\xbdh\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd#\xef\xbf\xbd\xef\xbf\xbd q$\xef\xbf\xbdd\xef\xbf\ xbd$\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd?\xef\xbf\xbd:\xef\xbf\xbdM\xef\xbf\xbd\xef\xbf \xbd&jb{\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd0\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\ xbd\xef\xbf\xbd@\xef\xbf\xbd\n \xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbdS\xef\xbf\xbd_\xef\xbf\xbd\xef\xbf \xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd4ztlS\xef\xbf\xbd\xef\xbf\xbd4\xef\xbf\xbd2^\xef\xbf\xbd\xef\xbf\ xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd5^\xef\xbf\xbd7\'\xef\xbf\xbd QFUH:\xef\xbf\xbd\xef\xbf\xbd7\xe2 \x96\x92\xef\xbf\xbd\xef\xbf\xbd\xe2\x94\x82 \xef\xbf\xbd\xe2\x94\x98\xef\xbf\xbd。\xef\xbf\xbd\xef\ xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xdd\x94\xef\xbf\xbd\xef\xbf\xbdM\xef\xbf\xbd\xe2\x90\x8b\ xef\xbf\xbd\xc8\xb5\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbdA\xe2\x8e\xbd\xe2\x94\xbc:\xef\xbf \xbdZ\xef\xbf\xbd:\xef\xbf\xbd\xef\xbf\xbdF\xef\xbf\xbd\xef\xbf\xbd\xe2\x94\x9c\xef\xbf\xbdD\xef\xbf\ xbd-\xdf\xaf8*\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xc7\xa0H*\xef \xbf\xbd\xef\xbf\xbd\xd8\x94\xe2\x94\x82\xef\xbf\xbdJ\xef\xbf\xbdC\xef\xbf\xbdoe2|\xef\xbf\xbd\xef\xbf\ …