标签: character-encoding

使用 UTF-8 正确编码 - java

我在将以下字符串正确写入文件时遇到问题。尤其是“——”这个字。问题出现在我的本地机器 (Windows 7) 和服务器 (Linux) 上

字符串：“Cœurs d'artichauts Grillées”

是否工作（– 正确显示，而撇号被翻译成问号）：
```
Files.write(path, content.getBytes(StandardCharsets.ISO_8859_1));
```
Run Code Online (Sandbox Code Playgroud)
不起作用（导致文件）：
```
Files.write(path, content.getBytes(StandardCharsets.UTF_8));
```
Run Code Online (Sandbox Code Playgroud)

根据这个问题的第一个答案，UTF-8 应该也能正确编码 – 。有谁知道我做错了什么？

java encoding utf-8 iso-8859-1 character-encoding

oni*_*ght

2018 05-15

0
推荐指数

1
解决办法

712
查看次数

验证者:如何解决此错误？

我在验证器中收到此错误:

Line 47, Column 187: character "&amp;" is the first character of a delimiter but occurred as data 
…num, silver diamonds. cartier tiffany & Co.  $18 WALKING LIBERTY DOLLARS   $15…



This message may appear in several cases: 
You tried to include the "<" character in your page: you should escape it as "&lt;"
You used an unescaped ampersand "&": this may be valid in some contexts, but it is recommended to use "&amp;", which is always safe.
Another possibility is …

Run Code Online (Sandbox Code Playgroud)

xhtml character-encoding

Ale*_*ore

2010 03-02

-1
推荐指数

1
解决办法

41
查看次数

什么是字符编码？

我有几个字符无法正确识别.人物如:

º
á
ó
(etc..)

这意味着字符编码不是utf-8对吗？那么,你能告诉我它可以是什么字符编码吗？

encoding character-encoding

aF.*_*aF.

2010 07-02

-1
推荐指数

1
解决办法

1593
查看次数

URL中的非字母数字字符

如果我在Chrome或Internet Explorer中访问http://†.com,它会将我带到http://xn--lvg.com.

我知道它在Opera,Safari和Firefox中不起作用.

为什么†被翻译成xn--lvg？它们之间的关系是什么？是否有列表将这些奇怪的字符映射到Chrome或Internet Explorer中的已翻译等效字符？

unicode url alphanumeric character-encoding

Pac*_*ier

2012 02-05

-1
推荐指数

1
解决办法

313
查看次数

奇偶校验位和错误检测

我在大学的计算机体系结构课程中遇到过这种情况。我无法理解奇偶校验位；为什么它有偶数和奇数两种。

谁能给我清楚地解释一下奇偶校验码？

c architecture assembly character-encoding

S.A*_*hid

2012 01-02

-1
推荐指数

1
解决办法

1846
查看次数

£ 符号显示为中间有问号的菱形

我正在创建一个网络应用程序，其中涉及向用户显示财务数据。来自英国，使用 GBP \xc2\xa3 作为货币，这个字符被大量使用。

\n\n

然而，时不时地，\xc2\xa3 显示为中间有问号的菱形，并且在网页上它抛出一个无效字符 UTF-8 byte 1 of 1 byte string。

\n\n

有没有一种 UTF 安全的方式来显示标志\xc2\xa3？这是我目前正在做的一个例子：

\n\n

 "Rent Per Annum: \xc2\xa3" + \'${tenant.currentRent}\'\n

Run Code Online (Sandbox Code Playgroud)\n

jsp spring-mvc utf-8 character-encoding spring-roo

Ste*_*ake

2012 09-12

-1
推荐指数

1
解决办法

4433
查看次数

这个符号是什么以及它是如何工作的？

我在他们的标题中有一个网站上有这个符号()(参见这个标题,它也在那里).它也被黑客新闻采集并显示为角色.我想知道它是什么以及它是如何工作的？

编辑:我附上了截图在此输入图像描述

html character-encoding

Aiv*_*ras

2013 04-11

-1
推荐指数

1
解决办法

390
查看次数

Python 将乱码转换为希伯来语

这是我的代码：

\n\n

# -*- coding: utf-8-*-\narray=["\xc3\xa0","\xc3\xa1","\xc3\xa2","\xc3\xa3","\xc3\xa4","\xc3\xa5","\xc3\xa6","\xc3\xa7","\xc3\xa8","\xc3\xa9","\xc3\xaa","\xc3\xab","\xc3\xac","\xc3\xad","\xc3\xae","\xc3\xaf","\xc3\xb0","\xc3\xb1","\xc3\xb3","\xc3\xb4","\xc3\xb5","\xc3\xb6","\xc3\xb8","\xc3\xb9","\xc3\xba","\xc3\xbb","\xc3\xbc","\xc3\xbd","\xc3\xbe","\xc3\xbf"]\narray1=["\xd7\x90","\xd7\x91","\xd7\x92","\xd7\x93","\xd7\x94","\xd7\x95","\xd7\x96","\xd7\x97","\xd7\x98","\xd7\x99","\xd7\x9a","\xd7\x9b","\xd7\x9c","\xd7\x9d","\xd7\x9e","\xd7\x9f","\xd7\xa0","\xd7\xa1","\xd7\xa2","\xd7\xa3","\xd7\xa4","\xd7\xa5","\xd7\xa6","\xd7\xa7","\xd7\xa8","\xd7\xa9","\xd7\xaa"]\nstr="\xc3\xa1\xc3\xaf \xc3\xa9\xc3\xa4\xc3\xa5\xc3\xa3\xc3\xa4"\nmessage=""\nfor i in range(0,len(str)):\n   s=str[i]\n   index=-1\n   for j in range(0,len(array)):\n       if(array[j]==s):\n           index=j\n           break\n   if(index!=-1):\n   message+=array1[index]\n   print array1[index]\nprint message\n

Run Code Online (Sandbox Code Playgroud)\n\n

错误是：

\n\n

SyntaxError: EOL while scanning string literal\n

Run Code Online (Sandbox Code Playgroud)\n\n

在第 2 行

\n\n

我有一个希伯来语文本文件，但无论编码是什么，它总是以乱码显示。这是一个将其转换为希伯来语的 python 程序。原始文件位于 IS0-8859-1

python unicode character-encoding hebrew

ita*_*345

2013 08-19

-1
推荐指数

1
解决办法

6331
查看次数

在Excel中打开CSV时,某些字符无法正确显示

我知道有些人会认为这是重复的问题,但我尝试了stackoverflow上提供的所有解决方案.

我的问题是,在excel中打开时我无法在CSV中显示某些字符,但是notepad++正确显示它.

Notepad ++输出:

在此输入图像描述

Excel输出:

在此输入图像描述

我知道有些人会建议我显示一些标题等等,但我只是将这个CSV保存到服务器.用户将在需要时使用FTP下载它.

php csv excel encoding character-encoding

Apu*_*pta

lucky-day

-1
推荐指数

1
解决办法

2042
查看次数

语言在底层如何表示 UTF-8？

我最近看了Computerphile 的 Tom Scott 谈论 UTF-8，之后进行了一些研究，了解到 UTF-8 可用于对最多 6 个字节的字符进行编码，每个字节使用以下标头：

0xxx xxxx    # 1 Byte character
110x xxxx    # 2 Byte character
1110 xxxx    # 3 Byte character
1111 0xxx    # 4 Byte character
1111 10xx    # 5 Byte character
1111 110x    # 6 Byte character

Run Code Online (Sandbox Code Playgroud)

然后用它10xx xxxx来表示额外的字节（我知道RFC3629将其限制为最多 4 个字节）。

我的理解是否正确，这允许对 2,164,286 个不同的字符进行编码（忽略任何保留字符）？

0xxx xxxx    # 7 bits                      =>       128
110x xxxx    # 5 bits + 6 bits   = 11 bits =>     2,048
1110 …

Run Code Online (Sandbox Code Playgroud)

c++ utf-8 character-encoding

Nic*_*ick

2021 10-07

-1
推荐指数

1
解决办法

286
查看次数

标签统计

character-encoding ×10

encoding ×3

utf-8 ×3

unicode ×2

alphanumeric ×1

architecture ×1

assembly ×1

c ×1

c++ ×1

csv ×1

excel ×1

hebrew ×1

html ×1

iso-8859-1 ×1

java ×1

jsp ×1

php ×1

python ×1

spring-mvc ×1

spring-roo ×1

url ×1

xhtml ×1

标签 统计

标签统计