我在将unicode转换为html实体时遇到问题.
这是我目前的代码:
>> name = u'\xc3\xa1\xc3\xa1\xc3\xa1\xc3\xa1'
>> entities = name.encode('ascii', 'xmlcharrefreplace')
>> print str(entities)
áááá
Run Code Online (Sandbox Code Playgroud)
每个\xc3\xa1= á(多字节字符),但当我将其转换为实体时,我为单个字符获得2个实体.