标签: encoding

什么是Unicode,UTF-8,UTF-16?

什么是Unicode的基础以及为什么需要UTF-8或UTF-16?我在Google上研究了这个并在这里搜索过,但我不清楚.

在VSS进行文件比较时,有时会有消息说这两个文件有不同的UTF.为什么会这样呢?

请简单解释一下.

unicode encoding utf-8 utf-16

368
推荐指数
8
解决办法
28万
查看次数

如何让UTF-8在Java webapps中运行?

我需要在我的Java webapp(servlets + JSP,没有使用框架)中使用UTF-8来支持äöå常规芬兰语文本和???特殊情况下的西里尔字母.

我的设置如下:

  • 开发环境:Windows XP
  • 制作环境:Debian

使用的数据库:MySQL 5.x.

用户主要使用Firefox2,但Opera 9.x,FF3,IE7和谷歌Chrome也用于访问该网站.

怎么做到这一点?

java mysql encoding tomcat utf-8

363
推荐指数
3
解决办法
21万
查看次数

如何在Maven中配置编码?

当我maven install在我的多模块maven项目上运行时,我总是得到以下输出:

[WARNING] File encoding has not been set, using platform encoding UTF-8, i.e. build is platform dependent!
Run Code Online (Sandbox Code Playgroud)

所以,我google了一下,但我能找到的是我必须添加:

<properties>
    <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
</properties>
Run Code Online (Sandbox Code Playgroud)

...到我的pom.xml.但它已经存在(在父母中pom.xml).

配置<encoding>maven-resources-plugin或maven-compiler-plugin也无法修复它.

所以有什么问题?

java encoding maven-2 maven-3 maven

346
推荐指数
5
解决办法
20万
查看次数

在Python中管道stdout时设置正确的编码

管道Python程序的输出时,Python解释器会对编码感到困惑,并将其设置为None.这意味着这样的程序:

# -*- coding: utf-8 -*-
print u"åäö"
Run Code Online (Sandbox Code Playgroud)

正常运行时会正常工作,但失败时:

UnicodeEncodeError:'ascii'编解码器无法对位置0中的字符u'\ xa0'进行编码:序数不在范围内(128)

当在管道序列中使用时.

在配管时使这项工作的最佳方法是什么?我可以告诉它使用shell/filesystem /无论使用什么编码吗?

到目前为止我看到的建议是直接修改你的site.py,或者使用这个hack对defaultencoding进行硬编码:

# -*- coding: utf-8 -*-
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
print u"åäö"
Run Code Online (Sandbox Code Playgroud)

是否有更好的方法使管道工作?

python terminal encoding stdout python-2.x

327
推荐指数
7
解决办法
19万
查看次数

如何在Sublime Text中查看文件的当前编码?

如何在Sublime Text中查看文件的当前编码?

这似乎是一件非常简单的事情,但搜索并没有产生太大的影响.任何指针将不胜感激!

encoding sublimetext2

315
推荐指数
5
解决办法
20万
查看次数

为什么base64编码的字符串最后有一个=符号

我知道base64编码是什么以及如何base64在C#中计算编码,但是我已经多次看到当我将字符串转换为base64时,最后会有一个=.

提出了几个问题:

  1. 难道一个base64字符串总是以结束=
  2. 为什么=最后会附加?

base64 encoding

298
推荐指数
9
解决办法
14万
查看次数

Android用省略号替换"..."

自AVD工具16以来我收到此警告:

Replace "..." with ellipsis character (..., &#8230;) ?
Run Code Online (Sandbox Code Playgroud)

在我的strings.xml中

在这条线上

 <string name="searching">Searching...</string>
Run Code Online (Sandbox Code Playgroud)

我如何替换......它只是字面意思: ...

如果有人能解释这个编码吗?

xml encoding android adt

296
推荐指数
4
解决办法
9万
查看次数

MySQL中的utf8mb4和utf8字符集有什么区别?

MySQL中utf8mb4utf8charsets有什么区别?

我已经知道ASCII,UTF-8,UTF-16UTF-32编码; 但我很想知道utf8mb4编码组与MySQL服务器中定义的其他编码类型的区别.

是否有任何特殊利益/建议使用utf8mb4而不是utf8

mysql encoding utf-8 character-encoding utf8mb4

294
推荐指数
5
解决办法
16万
查看次数

检测编码并使所有内容UTF-8

我正在从各种RSS源中读出大量文本并将它们插入到我的数据库中.

当然,在馈送中使用了几种不同的字符编码,例如UTF-8和ISO-8859-1.

不幸的是,有时文本的编码存在问题.例:

  1. "Fußball"中的"ß"应该在我的数据库中看起来像这样:"Ÿ".如果是"Ÿ",则会正确显示.

  2. 有时,"Fußball"中的"ß"在我的数据库中看起来像这样:"ß".当然,它显示错误.

  3. 在其他情况下,"ß"保存为"ß" - 所以没有任何改变.然后它也显示错误.

我该怎么做才能避免案例2和3?

如何使所有内容编码相同,最好是UTF-8?我utf8_encode()什么时候必须使用,什么时候必须使用utf8_decode()(很清楚效果是什么,但什么时候必须使用这些功能?)什么时候我必须对输入什么都不做?

你能帮助我并告诉我如何使一切编码相同吗?也许有功能mb_detect_encoding()?我能为此写一个函数吗?所以我的问题是:

  1. 如何找出文本使用的编码?
  2. 如何将其转换为UTF-8 - 无论旧的编码是什么?

像这样的功能会起作用吗?

function correct_encoding($text) {
    $current_encoding = mb_detect_encoding($text, 'auto');
    $text = iconv($current_encoding, 'UTF-8', $text);
    return $text;
}
Run Code Online (Sandbox Code Playgroud)

我已经测试了它,但它不起作用.它出什么问题了?

php encoding utf-8 character-encoding

293
推荐指数
7
解决办法
34万
查看次数

如何检测文本文件的编码/代码页

在我们的应用中,我们收到的文本文件(.txt,.csv从不同的来源,等等).在阅读时,这些文件有时会包含垃圾,因为文件是在不同的/未知的代码页中创建的.

有没有办法(自动)检测文本文件的代码页?

detectEncodingFromByteOrderMarks,对StreamReader构造,工程UTF8 和其他的Unicode标文件,但是我正在寻找一种方法来检测代码页,像ibm850,windows1252.


谢谢你的回答,这就是我所做的.

我们收到的文件来自最终用户,他们没有关于代码页的线索.接收者也是最终用户,到目前为止,这是他们对代码页的了解:代码页存在,并且令人讨厌.

解:

  • 在记事本中打开收到的文件,查看一段乱码文本.如果有人被称为弗朗索瓦(François)或其他东西,那么凭借你的人类智慧你可以猜到这一点
  • 我创建了一个小应用程序,用户可以使用该应用程序打开文件,并在使用正确的代码页时输入用户知道它将出现在文件中的文本.
  • 遍历所有代码页,并显示提供用户提供的文本解决方案的代码页.
  • 如果弹出一个代码页,请让用户指定更多文本.

.net c# globalization encoding text

292
推荐指数
8
解决办法
29万
查看次数