高飞的Unicode问题:m�

ric*_*ent 1 unicode encoding

我有一些文本进入一个显然存在某种Unicode问题的数据库.进入的文字是"5m�in area",这似乎是某种度量单位,但我无法理清上下文中的含义.搜索Google会显示许多类似的结果,因此这显然是一组常见的符号.

Tim*_*ker 5

它是Unicode替换字符0xFFFD(?); 另请参见如何在字符串中替换�

所以我猜这个文本曾经是5m² in area,并且在它到达你的数据库之前就²被乱码了?.