标签: mojibake

如何从文件开头删除ï»?

我有一个CSS文件,当我使用gedit打开它时看起来很好,但是当它被PHP读取(将所有CSS文件合并为一个)时,这个CSS前面有以下字符:

PHP删除所有空格,因此代码中间的随机会弄乱整个事物.正如我所提到的,当我在gedit中打开文件时,我实际上看不到这些字符,因此我无法轻易删除它们.

我搜索了问题,文件编码显然有问题,这是有道理的,因为我已经通过ftp和rsync将文件转移到不同的Linux/Windows服务器,并使用一系列文本编辑器.我不太了解字符编码,所以请帮助.

如果有帮助,文件将以UTF-8格式保存,gedit将不允许我以ISO-8859-15格式保存(该文档包含一个或多个无法使用指定字符编码进行编码的字符).我尝试用Windows和Linux行结尾保存它,但都没有帮助.

php byte-order-mark utf-8 character-encoding mojibake

140
推荐指数
7
解决办法
19万
查看次数

"â€"在页面上显示而不是"'"

’正在我的页面上显示而不是'.

我在我的标签和HTTP标头中都Content-Type设置了:UTF-8<head>

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

另外,我的浏览器设置为Unicode (UTF-8):

在此输入图像描述

那么问题是什么,我该如何解决?

encoding utf-8 mojibake

119
推荐指数
8
解决办法
23万
查看次数

在PHP中获取"而不是撇号(')

我已经尝试将文本转换为utf8或从utf8转换,这似乎没有帮助.

我越来越:

"It’s Getting the Best of Me"
Run Code Online (Sandbox Code Playgroud)

它应该是:

"It’s Getting the Best of Me"
Run Code Online (Sandbox Code Playgroud)

我从这个网址获取这些数据.

php utf-8 character-encoding mojibake

53
推荐指数
5
解决办法
8万
查看次数

如何转换这些奇怪的字符?(Ã,Ã,Ã,ù,Ã)

我的页面经常显示像Ã,Ã,Ã,Ã,Ã,代替普通字符的东西.

我使用utf8作为头页和MySQL编码.这是怎么发生的?

php mysql character-encoding utf8-decode mojibake

46
推荐指数
4
解决办法
24万
查看次数

如何在字符串中替换�

我有一个包含字符的字符串�我无法正确替换它.

String.replace("�","");

不起作用,有谁知道如何删除/替换字符串中的�?

java string encoding mojibake

25
推荐指数
4
解决办法
11万
查看次数

Facebook JSON编码严重

我下载了我的Facebook信使数据(在你的Facebook帐户中,转到设置,然后转到你的Facebook信息,然后下载你的信息,然后创建一个文件,至少选中了消息框)来做一些很酷的统计数据

但是编码有一个小问题.我不确定,但看起来Facebook对这些数据使用了错误的编码.当我用文本编辑器打开它时,我看到这样的事情:Rados\u00c5\u0082aw.当我尝试用python(UTF-8)打开它时,我得到了RadosÅ\x82aw.但是我应该得到:Rados?aw.

我的python脚本:

text = open(os.path.join(subdir, file), encoding='utf-8')
conversations.append(json.load(text))
Run Code Online (Sandbox Code Playgroud)

我尝试了一些最常见的编码.示例数据是:

{
  "sender_name": "Rados\u00c5\u0082aw",
  "timestamp": 1524558089,
  "content": "No to trzeba ostatnie treningi zrobi\u00c4\u0087 xD",
  "type": "Generic"
}
Run Code Online (Sandbox Code Playgroud)

python unicode mojibake python-3.x

23
推荐指数
4
解决办法
3334
查看次数

将特殊字符(如Ã和Ã)转换回原来的拉丁语alphbet对应C#

我一直在考虑从似乎有它的编码方式有点糊涂随着时间的推移和包含的混合MySQL数据库的出口HTML char codes,如& uuml;代表相同的字母和问题较多的字符,如üÃ.我的任务是将一些一致性带回文件并将所有内容都放入正确的拉丁字符中,例如úó.

我正在处理的字符串类型的一个例子是

DesinfektionslÃÂsungstücherfürFlächen

哪个应该等同于

50 Tattoo Desinfektionsl ö    sungst ü    cher f ü    r Fl ä    chen 
50 Tattoo Desinfektionsl ö sungst ü cher f ü r Fl ä chen
Run Code Online (Sandbox Code Playgroud)

有没有一种方法,在C#中使用/.NET 4.5,将成功地重新编码的喜欢üÃUTF-8

那么什么方法是可取的?

也就是段字符在上面的例子串某些其它字符组合的实际段字符或部分?

我已经创建了一个查找表,如果需要查找和替换下面的内容,但我不确定它是多么完整.

É -> É
“ -> "
†-> "
Ç -> Ç
à -> Ã
é, 'é
à -> ú -> ú …
Run Code Online (Sandbox Code Playgroud)

c# latin character-encoding special-characters mojibake

16
推荐指数
3
解决办法
5万
查看次数

如何将Unicode字符作为JSP/Servlet request.getParameter传递?

经过大量的反复试验,我仍然无法弄清楚问题.JSP,servlet和数据库都被设置为接受UTF-8编码,但即使我在任何具有任何双字节字符的东西上使用request.getParameter,如em dash,它们也会被破坏为字符.

我已经手动提交数据库,它能够接受这些字符,没问题.如果我从servlet中的数据库中提取文本并将其打印在我的jsp页面的表单中,则显示没有问题.

唯一一次,当我尝试在使用request.getParameter检索它之后尝试将其显示在其他地方时,它发现它作为已损坏的字符返回.

有没有其他人有这个问题?我该如何解决?

unicode jsp servlets character-encoding mojibake

14
推荐指数
1
解决办法
8126
查看次数

$ _POST将从utf-8转换为Ãü等

我是新来的,所以如果我做错了什么,我道歉.

我有一个表单,用于将用户输入提交到另一个页面.用户需要键入ä,ö,é等...我已在文档中放置了以下所有内容:

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
header('Content-Type:text/html; charset=UTF-8');
<form action="whatever.php" accept-charset="UTF-8">
Run Code Online (Sandbox Code Playgroud)

我甚至尝试过:

ini_set('default_charset', 'UTF-8');
Run Code Online (Sandbox Code Playgroud)

当另一个页面加载时,我需要检查用户输入的内容如下:

if ( $_POST['field'] == $check ) {
  ...
}
Run Code Online (Sandbox Code Playgroud)

但如果他输入类似'München'的东西,那么PHP会将'München'与'München'进行比较,即使它应该也不会触发TRUE.由于它在任何地方都指定了UTF-8,我猜测服务器正在转换为其他东西(我在另一个线程上读取的Windows-1252)因为它不支持或未配置为UTF-8.我在加载到生产之前在本地服务器上使用Apache; 我没有改变(也不知道如何)任何默认设置.我一直在研究Windows 7,使用Notepad ++进行编辑,用ANSI输入我的文件.如果我bin2hex('München')得到'4dc3bc6e6368656e'.

如果我echo $_POST['field'];正确显示'München'.

我到处都在研究解释,我发现我应该包括我已经拥有的那些标签/标题.

任何帮助深表感谢.

php encoding utf-8 character-encoding mojibake

13
推荐指数
1
解决办法
4万
查看次数

通过PrimeFaces输入组件检索的Unicode输入已损坏

当我还是用PrimeFaces V2.2.1,我能键入Unicode输入诸如与PrimeFaces输入组件中国如<p:inputText><p:editor>,并检索在管理bean方法好形状的输入.

但是,在我升级到PrimeFaces v3.1.1后,所有这些字符都变成了Mojibake或问号.只有拉丁语输入才能正常,中文,阿拉伯语,希伯来语,西里尔语等字符会变得格格不入.

这是怎么造成的,我该如何解决?

unicode jsf character-encoding primefaces mojibake

13
推荐指数
1
解决办法
1万
查看次数