标签: mojibake

如何从文件开头删除ï»？

我有一个CSS文件,当我使用gedit打开它时看起来很好,但是当它被PHP读取(将所有CSS文件合并为一个)时,这个CSS前面有以下字符:ï»¿

PHP删除所有空格,因此代码中间的随机ï»¿会弄乱整个事物.正如我所提到的,当我在gedit中打开文件时,我实际上看不到这些字符,因此我无法轻易删除它们.

我搜索了问题,文件编码显然有问题,这是有道理的,因为我已经通过ftp和rsync将文件转移到不同的Linux/Windows服务器,并使用一系列文本编辑器.我不太了解字符编码,所以请帮助.

如果有帮助,文件将以UTF-8格式保存,gedit将不允许我以ISO-8859-15格式保存(该文档包含一个或多个无法使用指定字符编码进行编码的字符).我尝试用Windows和Linux行结尾保存它,但都没有帮助.

php byte-order-mark utf-8 character-encoding mojibake

Mat*_*att

2015 05-10

140
推荐指数

7
解决办法

19万
查看次数

"â€"在页面上显示而不是"'"

â€™正在我的页面上显示而不是'.

我在我的标签和HTTP标头中都Content-Type设置了:UTF-8<head>

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />

Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

另外,我的浏览器设置为Unicode (UTF-8):

在此输入图像描述

那么问题是什么,我该如何解决？

encoding utf-8 mojibake

Jit*_*yas

2013 12-29

119
推荐指数

8
解决办法

23万
查看次数

在PHP中获取"而不是撇号(')

我已经尝试将文本转换为utf8或从utf8转换,这似乎没有帮助.

我越来越:

"Itâ€™s Getting the Best of Me"

Run Code Online (Sandbox Code Playgroud)

它应该是:

"It’s Getting the Best of Me"

Run Code Online (Sandbox Code Playgroud)

我从这个网址获取这些数据.

php utf-8 character-encoding mojibake

Min*_*int

2016 04-01

53
推荐指数

5
解决办法

8万
查看次数

如何转换这些奇怪的字符？(Ã,Ã,Ã,Ã¹,Ã)

我的页面经常显示像Ã,Ã,Ã,Ã,Ã,代替普通字符的东西.

我使用utf8作为头页和MySQL编码.这是怎么发生的？

php mysql character-encoding utf8-decode mojibake

Leo*_*rdo

2013 05-23

46
推荐指数

4
解决办法

24万
查看次数

如何在字符串中替换ï¿½

我有一个包含字符的字符串ï¿½我无法正确替换它.

String.replace("ï¿½","");

不起作用,有谁知道如何删除/替换字符串中的ï¿½？

java string encoding mojibake

Thy*_*hys

2013 09-24

25
推荐指数

4
解决办法

11万
查看次数

Facebook JSON编码严重

我下载了我的Facebook信使数据(在你的Facebook帐户中,转到设置,然后转到你的Facebook信息,然后下载你的信息,然后创建一个文件,至少选中了消息框)来做一些很酷的统计数据

但是编码有一个小问题.我不确定,但看起来Facebook对这些数据使用了错误的编码.当我用文本编辑器打开它时,我看到这样的事情:Rados\u00c5\u0082aw.当我尝试用python(UTF-8)打开它时,我得到了RadosÅ\x82aw.但是我应该得到:Rados?aw.

我的python脚本:

text = open(os.path.join(subdir, file), encoding='utf-8')
conversations.append(json.load(text))

Run Code Online (Sandbox Code Playgroud)

我尝试了一些最常见的编码.示例数据是:

{
  "sender_name": "Rados\u00c5\u0082aw",
  "timestamp": 1524558089,
  "content": "No to trzeba ostatnie treningi zrobi\u00c4\u0087 xD",
  "type": "Generic"
}

Run Code Online (Sandbox Code Playgroud)

python unicode mojibake python-3.x

Jak*_*yka

2018 09-05

23
推荐指数

4
解决办法

3334
查看次数

将特殊字符(如Ã和Ãƒ)转换回原来的拉丁语alphbet对应C#

我一直在考虑从似乎有它的编码方式有点糊涂随着时间的推移和包含的混合MySQL数据库的出口HTML char codes,如& uuml;代表相同的字母和问题较多的字符,如Ã¼和Ãƒ.我的任务是将一些一致性带回文件并将所有内容都放入正确的拉丁字符中,例如ú和ó.

我正在处理的字符串类型的一个例子是

DesinfektionslÃƒÂsungstÃƒÂ¼cherfÃƒÂ¼rFlÃƒÂ¤chen

哪个应该等同于

50 Tattoo Desinfektionsl ö    sungst ü    cher f ü    r Fl ä    chen 
50 Tattoo Desinfektionsl ÃƒÂ¶ sungst ÃƒÂ¼ cher f ÃƒÂ¼ r Fl ÃƒÂ¤ chen

Run Code Online (Sandbox Code Playgroud)

有没有一种方法,在C#中使用/.NET 4.5,将成功地重新编码的喜欢Ã¼和Ãƒ对UTF-8？

那么什么方法是可取的？

也就是段字符在上面的例子串某些其它字符组合的实际段字符或部分？

我已经创建了一个查找表,如果需要查找和替换下面的内容,但我不确定它是多么完整.

Ã‰ -> É
â€œ -> "
â€ -> "
Ã‡ -> Ç
Ãƒ -> Ã
Ã©, 'é
Ã  -> À
Ãº -> ú …

Run Code Online (Sandbox Code Playgroud)

c# latin character-encoding special-characters mojibake

Gga*_*Gga

2013 02-20

16
推荐指数

3
解决办法

5万
查看次数

如何将Unicode字符作为JSP/Servlet request.getParameter传递？

经过大量的反复试验,我仍然无法弄清楚问题.JSP,servlet和数据库都被设置为接受UTF-8编码,但即使我在任何具有任何双字节字符的东西上使用request.getParameter,如em dash,它们也会被破坏为字符.

我已经手动提交数据库,它能够接受这些字符,没问题.如果我从servlet中的数据库中提取文本并将其打印在我的jsp页面的表单中,则显示没有问题.

唯一一次,当我尝试在使用request.getParameter检索它之后尝试将其显示在其他地方时,它发现它作为已损坏的字符返回.

有没有其他人有这个问题？我该如何解决？

unicode jsp servlets character-encoding mojibake

作者

2016 07-07

14
推荐指数

1
解决办法

8126
查看次数

但如果他输入类似'München'的东西,那么PHP会将'MÃ¼nchen'与'München'进行比较,即使它应该也不会触发TRUE.由于它在任何地方都指定了UTF-8,我猜测服务器正在转换为其他东西(我在另一个线程上读取的Windows-1252)因为它不支持或未配置为UTF-8.我在加载到生产之前在本地服务器上使用Apache; 我没有改变(也不知道如何)任何默认设置.我一直在研究Windows 7,使用Notepad ++进行编辑,用ANSI输入我的文件.如果我bin2hex('München')得到'4dc3bc6e6368656e'.

如果我echo $_POST['field'];正确显示'München'.

我到处都在研究解释,我发现我应该包括我已经拥有的那些标签/标题.

任何帮助深表感谢.

php encoding utf-8 character-encoding mojibake

lun*_*gov

2012 01-29

13
推荐指数

1
解决办法

4万
查看次数