小编M. *_*pée的帖子

字符串格式-法国口音

我在从Wikipedia抓取一些字符串数据时遇到问题。这是我的代码:

import scrapy
import json

class communes_spider(scrapy.Spider):
    name = "city"
    start_urls = ['https://fr.wikipedia.org/wiki/Liste_des_communes_de_Belgique_par_population']

    def parse(self, response):
        for city in response.css('table.wikitable td a::text').getall():
            if city == '2':
                pass
            elif city == '3':
                pass
            else:        
                yield {
                    'cities': city + ', BE'
                }
Run Code Online (Sandbox Code Playgroud)

问题在于字符串是法语,有些城市包含“è”或“é”。当我将它们导出到json文件时,像“ Li \ u00e8ge”这样的单词被导出为“Liège”。如何将那些弦变成法语字母?

python web-crawler scrapy

0
推荐指数
1
解决办法
75
查看次数

标签 统计

python ×1

scrapy ×1

web-crawler ×1