标签: character-encoding

使用 UTF-8 正确编码 - java

我在将以下字符串正确写入文件时遇到问题。尤其是“——”这个字。问题出现在我的本地机器 (Windows 7) 和服务器 (Linux) 上

字符串:“Cœurs d'artichauts Grillées”

  1. 是否工作(– 正确显示,而撇号被翻译成问号):

    Files.write(path, content.getBytes(StandardCharsets.ISO_8859_1));
    
    Run Code Online (Sandbox Code Playgroud)
  2. 不起作用(导致文件):

    Files.write(path, content.getBytes(StandardCharsets.UTF_8));
    
    Run Code Online (Sandbox Code Playgroud)

根据这个问题的第一个答案,UTF-8 应该也能正确编码 – 。有谁知道我做错了什么?

java encoding utf-8 iso-8859-1 character-encoding

0
推荐指数
1
解决办法
712
查看次数

验证者:如何解决此错误?

我在验证器中收到此错误:

Line 47, Column 187: character "&" is the first character of a delimiter but occurred as data 
…num, silver diamonds. cartier tiffany & Co.  $18 WALKING LIBERTY DOLLARS   $15…



This message may appear in several cases: 
You tried to include the "<" character in your page: you should escape it as "&lt;"
You used an unescaped ampersand "&": this may be valid in some contexts, but it is recommended to use "&amp;", which is always safe.
Another possibility is …
Run Code Online (Sandbox Code Playgroud)

xhtml character-encoding

-1
推荐指数
1
解决办法
41
查看次数

什么是字符编码?

我有几个字符无法正确识别.人物如:

º
á
ó
(etc..)

这意味着字符编码不是utf-8对吗?那么,你能告诉我它可以是什么字符编码吗?

encoding character-encoding

-1
推荐指数
1
解决办法
1593
查看次数

URL中的非字母数字字符

如果我在Chrome或Internet Explorer中访问http://†.com,它会将我带到http://xn--lvg.com.

我知道它在Opera,Safari和Firefox中不起作用.

为什么†被翻译成xn--lvg?它们之间的关系是什么?是否有列表将这些奇怪的字符映射到Chrome或Internet Explorer中的已翻译等效字符?

unicode url alphanumeric character-encoding

-1
推荐指数
1
解决办法
313
查看次数

奇偶校验位和错误检测

我在大学的计算机体系结构课程中遇到过这种情况。我无法理解奇偶校验位;为什么它有偶数和奇数两种。

谁能给我清楚地解释一下奇偶校验码?

c architecture assembly character-encoding

-1
推荐指数
1
解决办法
1846
查看次数

£ 符号显示为中间有问号的菱形

我正在创建一个网络应用程序,其中涉及向用户显示财务数据。来自英国,使用 GBP \xc2\xa3 作为货币,这个字符被大量使用。

\n\n

然而,时不时地,\xc2\xa3 显示为中间有问号的菱形,并且在网页上它抛出一个无效字符 UTF-8 byte 1 of 1 byte string。

\n\n

有没有一种 UTF 安全的方式来显示标志\xc2\xa3?这是我目前正在做的一个例子:

\n\n
 "Rent Per Annum: \xc2\xa3" + \'${tenant.currentRent}\'\n
Run Code Online (Sandbox Code Playgroud)\n

jsp spring-mvc utf-8 character-encoding spring-roo

-1
推荐指数
1
解决办法
4433
查看次数

这个符号是什么以及它是如何工作的?

我在他们的标题中有一个网站上有这个符号()(参见这个标题,它也在那里).它也被黑客新闻采集并显示为角色.我想知道它是什么以及它是如何工作的?

编辑:我附上了截图 在此输入图像描述

html character-encoding

-1
推荐指数
1
解决办法
390
查看次数

Python 将乱码转换为希伯来语

这是我的代码:

\n\n
# -*- coding: utf-8-*-\narray=["\xc3\xa0","\xc3\xa1","\xc3\xa2","\xc3\xa3","\xc3\xa4","\xc3\xa5","\xc3\xa6","\xc3\xa7","\xc3\xa8","\xc3\xa9","\xc3\xaa","\xc3\xab","\xc3\xac","\xc3\xad","\xc3\xae","\xc3\xaf","\xc3\xb0","\xc3\xb1","\xc3\xb3","\xc3\xb4","\xc3\xb5","\xc3\xb6","\xc3\xb8","\xc3\xb9","\xc3\xba","\xc3\xbb","\xc3\xbc","\xc3\xbd","\xc3\xbe","\xc3\xbf"]\narray1=["\xd7\x90","\xd7\x91","\xd7\x92","\xd7\x93","\xd7\x94","\xd7\x95","\xd7\x96","\xd7\x97","\xd7\x98","\xd7\x99","\xd7\x9a","\xd7\x9b","\xd7\x9c","\xd7\x9d","\xd7\x9e","\xd7\x9f","\xd7\xa0","\xd7\xa1","\xd7\xa2","\xd7\xa3","\xd7\xa4","\xd7\xa5","\xd7\xa6","\xd7\xa7","\xd7\xa8","\xd7\xa9","\xd7\xaa"]\nstr="\xc3\xa1\xc3\xaf \xc3\xa9\xc3\xa4\xc3\xa5\xc3\xa3\xc3\xa4"\nmessage=""\nfor i in range(0,len(str)):\n   s=str[i]\n   index=-1\n   for j in range(0,len(array)):\n       if(array[j]==s):\n           index=j\n           break\n   if(index!=-1):\n   message+=array1[index]\n   print array1[index]\nprint message\n
Run Code Online (Sandbox Code Playgroud)\n\n

错误是:

\n\n
SyntaxError: EOL while scanning string literal\n
Run Code Online (Sandbox Code Playgroud)\n\n

在第 2 行

\n\n

我有一个希伯来语文本文件,但无论编码是什么,它总是以乱码显示。这是一个将其转换为希伯来语的 python 程序。原始文件位于 IS0-8859-1

\n

python unicode character-encoding hebrew

-1
推荐指数
1
解决办法
6331
查看次数

在Excel中打开CSV时,某些字符无法正确显示

我知道有些人会认为这是重复的问题,但我尝试了stackoverflow上提供的所有解决方案.

我的问题是,在excel中打开时我无法在CSV中显示某些字符,但是notepad++正确显示它.

Notepad ++输出:

在此输入图像描述

Excel输出:

在此输入图像描述

我知道有些人会建议我显示一些标题等等,但我只是将这个CSV保存到服务器.用户将在需要时使用FTP下载它.

php csv excel encoding character-encoding

-1
推荐指数
1
解决办法
2042
查看次数

语言在底层如何表示 UTF-8?

我最近看了Computerphile 的 Tom Scott 谈论 UTF-8,之后进行了一些研究,了解到 UTF-8 可用于对最多 6 个字节的字符进行编码,每个字节使用以下标头:

0xxx xxxx    # 1 Byte character
110x xxxx    # 2 Byte character
1110 xxxx    # 3 Byte character
1111 0xxx    # 4 Byte character
1111 10xx    # 5 Byte character
1111 110x    # 6 Byte character
Run Code Online (Sandbox Code Playgroud)

然后用它10xx xxxx来表示额外的字节(我知道RFC3629将其限制为最多 4 个字节)。

我的理解是否正确,这允许对 2,164,286 个不同的字符进行编码(忽略任何保留字符)?

0xxx xxxx    # 7 bits                      =>       128
110x xxxx    # 5 bits + 6 bits   = 11 bits =>     2,048
1110 …
Run Code Online (Sandbox Code Playgroud)

c++ utf-8 character-encoding

-1
推荐指数
1
解决办法
286
查看次数