我在越南的餐馆使用Python在Windows上建立了一个回答应用程序的问题.要写越南语字符,我需要使用Unicode.
首先,我从TripAdvisor网站克隆数据,使用HTML charset = utf-8并构建我的Mongo数据库.TripAdvisor中一个名为"đànẵng"的城市有一个代码:
>>> print repr("?a? n??ng") # from tripadvisor website
>>> '\xc4\x91a\xcc\x80 n\xc4\x83\xcc\x83ng'
Run Code Online (Sandbox Code Playgroud)
但是,当我从Firefox的地址栏查询时,城市"đànẵng"有不同的代码:
>>> print repr("?à n?ng") # Firefox's address bar
>>> '\xc4\x91\xc3\xa0 n\xe1\xba\xb5ng'
Run Code Online (Sandbox Code Playgroud)
这就是我无法在我的数据库中找到该城市的原因.我尝试在notepad ++上编写这个城市名称,并获得与使用Firefox的地址栏相同的结果
>>> print repr("?à n?ng") # notepad++ using 'Encoding UTF-8'
>>> '\xc4\x91\xc3\xa0 n\xe1\xba\xb5ng'
Run Code Online (Sandbox Code Playgroud)
有没有办法在两种类型的代码之间进行转换?
或者有没有办法在这种情况下将城市名称"đànẵng"与不同的代码相匹配?