标签: unicode

问号（“？”）附加到字符串

所以我正在编写一个程序并使用其他人编写的现有库。他们的库正在调用 TheMovieDatabase.com 并检索有关电影的信息，包括 Youtube 预告片名称，如“sErD7Y00R_8”。

当我调试并查看存储该值的预告片名称字符串变量时，它显示为“sErD7Y00R_8”，但是当它插入我的数据库或打印到控制台时，它似乎附加了一个？（问号）到最后，显示如下：“sErD7Y00R_8？”

这显然给我带来了一些问题。我不明白它为什么这样做以及如何解决它。我只能猜测它是一些非常规文本字符或其他东西，但这只是一个猜测。

这是包装器库的链接： https://github.com/LordMike/TMDbLib/

这是我在包装器库中调用的方法，传入 ID 143049：

TMDbLib.Objects.Movies.Movie tmdbMovie = client.GetMovie(id, MovieMethods.Credits | MovieMethods.Keywords | MovieMethods.Images | MovieMethods.Trailers | MovieMethods.Reviews | MovieMethods.Releases);

Run Code Online (Sandbox Code Playgroud)

这是之后立即打印到控制台的内容：

Console.WriteLine("'" + tmdbMovie.Trailers.Youtube[i].Source + "'");

Run Code Online (Sandbox Code Playgroud)

.Length 属性返回 12，因此它看起来是 1 个字符，它不会在调试器中显示，但会打印为 ? 在控制台中

根据评论，我打印出了 Encoding.GetBytes 详细信息：

Encoding the entire string:
System.Text.UTF7Encoding       : 20  38  :73 45 72 44 37 59 30 30 52 2B 41 46 38 2D 38 2B 49 41 34 2D 
System.Text.UTF8Encoding       : 14  39  :73 45 72 44 37 …

Run Code Online (Sandbox Code Playgroud)

c# string unicode strip

Kai*_*ran

2015 04-01

-1
推荐指数

1
解决办法

7415
查看次数

如何在两个unicode字符串之间添加空格？

#!/usr/bin/python\n# -*- coding: utf-8 -*-\n\nimport re\nseparators = [u"\xe0\xa5\xa4", u",", u"."]\ndat=open(r"C:\\Users\\User\\Desktop\\text4.txt",\'r\').read()\ntext=dat.decode("utf-8")\nwros=text.split()\nout=""\nimport string\nspace=" "\ncounter=0;\nfor word in wros:\n        out=u" ".join(word)\n\nwrit=open("C:\\\\Users\\\\User\\\\Desktop\\\\text5.txt",\'w\')\nwrit.write(out.encode(\'utf-8\'))\nwrit.close()\n

Run Code Online (Sandbox Code Playgroud)\n\n

text4.txt 包含 \xe0\xa4\xad\xe0\xa4\xbe\xe0\xa4\xb0\xe0\xa4\xa4 \xe0\xa4\x95\xe0\xa4\xbe \xe0\xa4\x87\xe0\xa4 \xa4\xe0\xa4\xbf\xe0\xa4\xb9\xe0\xa4\xbe\xe0\xa4\xb8 \xe0\xa4\x95\xe0\xa4\xbe\xe0\xa4\xab\xe0\xa5\x80 \xe0\xa4\xb8\xe0\xa4\xae\xe0\xa5\x83\xe0\xa4\xa6\xe0\xa5\x8d\xe0\xa4\xa7\xe0\xa4\x8f\xe0\xa4\xb5\xe0 \xa4\x82 \xe0\xa4\xb5\xe0\xa4\xbf\xe0\xa4\xb8\xe0\xa5\x8d\xe0\xa4\xa4\xe0\xa5\x83\xe0\xa4\xa4\xe0\xa4 \xb9\xe0\xa5\x88\xe0\xa5\xa4\ntext5.txt 输出为 \xe0\xa4\xb9 \xe0\xa5\x88 \xe0\xa5\xa4

\n\n

所需的输出为 \xe0\xa4\xad\xe0\xa4\xbe\xe0\xa4\xb0\xe0\xa4\xa4 \xe0\xa4\x95\xe0\xa4\xbe \xe0\xa4\x87\xe0\xa4\ xa4\xe0\xa4\xbf\xe0\xa4\xb9\xe0\xa4\xbe\xe0\xa4\xb8\xe0\xa4\x95\xe0\xa4\xbe\xe0\xa4\xab\xe0\xa5\x80 \ xe0\xa4\xb8\xe0\xa4\xae\xe0\xa5\x83\xe0\xa4\xa6\xe0\xa5\x8d\xe0\xa4\xa7\xe0\xa4\x8f\xe0\xa4\xb5\xe0\ xa4\x82\xe0\xa4\xb5\xe0\xa4\xbf\xe0\xa4\xb8\xe0\xa5\x8d\xe0\xa4\xa4\xe0\xa5\x83\xe0\xa4\xa4\xe0\xa4\ xb9\xe0\xa5\x88\xe0\xa5\xa4

\n\n

请告诉我我所做的事情是错误的？\n需要帮助！提前致谢

python unicode concatenation

ims*_*i17

2016 12-02

-1
推荐指数

1
解决办法

1542
查看次数

如何在 C++ 中调用 unicode 函数 CreateProcessW 来启动 Windows 可执行文件？

这里有一个如何在堆栈交换上调用 CreateProcess 的示例，但是 Windows 10 似乎不再支持此功能，并且您必须使用 unicode 版本 CreateProcessW。

与 ASCI 版本类似，我正在寻找一个示例：

启动一个 EXE
等待 EXE 完成。
可执行文件完成时正确关闭所有句柄。

c++ unicode createprocess

Blu*_*ue7

2017 10-19

-1
推荐指数

1
解决办法

6810
查看次数

Python - isalpha() 在 unicode 修饰符上返回 True

u'\\u02c7'.isalpha()如果符号\xcb\x87不是字母，为什么返回 True？此方法仅适用于 ASCII 字符吗？

python unicode python-unicode

Kos*_*tya

2018 04-01

-1
推荐指数

1
解决办法

1328
查看次数

计算字符串中的韩文字符数

我希望能够计算输入中有多少韩文字母，就像我处理英文字母和数字一样：

a=0
b=0
c=0
d=0
e=0

num = input("type something ")

for i in num:
    if(i.isupper()):
        a=a+1
    elif(i.islower()):
        b=b+1
    elif(i.isdigit()):
        c=c+1


print("uppercase letters: ",a)
print("lowercase letters: ",b)
print("numbers: ",c)
print("korean letters: ",d)

Run Code Online (Sandbox Code Playgroud)

但我不知道该怎么做，我是否必须以ord()某种方式合并？

python unicode python-3.x

Cha*_*Kim

2018 05-20

-1
推荐指数

1
解决办法

1532
查看次数

如何在标识符中使用 Unicode 字符编译 Java 代码

首先，我知道这违反了所有惯例和建议，但无论如何我想这样做。

我如何（或者是否有可能）在标识符（方法名称、变量名称等）中使用 Unicode 字符来编译 Java 代码？

我希望能够执行以下操作：

public class  extends  {\n    public void \xd1\x81\xd0\xb4\xd0\xb5\xd0\xbb\xd0\xb0\xd0\xb9\xd0\xa7\xd1\x82\xd0\xbe\xd0\xbd\xd0\xb8\xd0\xb1\xd1\x83\xd0\xb4\xd1\x8c() { ... }\n}\n

Run Code Online (Sandbox Code Playgroud)\n

这是一个完全荒谬的例子，但你明白了。

java unicode

Vol*_*lt4

2023 11-13

-1
推荐指数

1
解决办法

248
查看次数

如何 console.log() ，任何字母但粗体？

有一些方法可以使用 unicode 在 javascript 中打印字母，例如

console.log(\u0062)产生 ab ，所以它与 put 相同console.log(b)

但现在，我确实知道有一些方法可以 console.log 粗体字母，例如

console.log('')

Run Code Online (Sandbox Code Playgroud)

在控制台中打印粗体字。

但是，例如以粗体打印的函数是什么？

这是我的想法

const printBold = (word: string) => {
  //splits the string, gets every letter, and replaces with the bold unicode equivalent
}

Run Code Online (Sandbox Code Playgroud)

但是...我无法找到粗体字母的等效 unicode，或者创建以粗体登录的函数的方法。

也许我可以做类似的事情

const map = {
 "a": "bold_a",
 "b": ''
}

Run Code Online (Sandbox Code Playgroud)

并向转换器提供该数据，但是...我从哪里获得粗体 unicode 或字符？我唯一能找到的，我从这个答案复制了它们 /sf/answers/4939874481/

javascript unicode fonts

mou*_*777

lucky-day

-1
推荐指数

1
解决办法

3448
查看次数

Python将文本解码为ascii

如何解码这样的unicode字符串:

什么%2527s%2bthe%2btime%252C%2bnow%253F

像这样的ascii:

什么+的+时间+现在

python unicode decode

tim*_*tim

2011 09-23

-2
推荐指数

1
解决办法

670
查看次数

Python中的Unicode

在Python 2.7的文档中,有关Unicode的三条规则描述如下:

如果代码点<128,则由相应的字节值表示.

如果代码点在128和之间0x7ff,则它变成128到255之间的两个字节值.

代码点> 0x7ff被转换为三字节或四字节序列,其中序列的每个字节在128和255之间.

然后我做了一些测试:

>>>> unichr(40960)

u'\ua000'

>>> ord(u'\ua000')

40960

Run Code Online (Sandbox Code Playgroud)

在我看来,40960是一个代码点> 0x7ff,所以它应该变成三个或四个字节的序列,其中序列的每个字节在128到255之间,但它只能变成两个字节的序列,并且u'\ a000'中的值'00'低于128,与上述规则不匹配.为什么？

更重要的是,我发现了一些更多的Unicode字符,比如u'\u1234'等.我发现它中的值("12"&&"34")也低于128,但根据首先提到的理论,它们不应该是低于128.我失去了任何其他理论？

谢谢你的所有答案.

python unicode

Sea*_*ene

2011 11-26

-2
推荐指数

1
解决办法

916
查看次数

有没有办法像在 Windows 计算器中显示的一样为“x 的 y 根”绘制符号？

我查看了 Windows 计算器，我看到在科学模式下，有一个按钮显示为“x 的 y 根”，如下所示：

我希望在我自己的 Swing 项目中复制此按钮的外观。有没有办法这样做？我看过 Unicode 字符，但没有这个特殊符号。

java unicode swing

Whi*_*art

2017 08-17

-2
推荐指数

1
解决办法

393
查看次数

标签统计

unicode ×10

python ×5

java ×2

c# ×1

c++ ×1

concatenation ×1

createprocess ×1

decode ×1

fonts ×1

javascript ×1

python-3.x ×1

python-unicode ×1

string ×1

strip ×1

swing ×1

标签 统计

标签统计