标签: codepoint

如何在 Swift 中获取字符/字符串的 unicode 代码点表示?

作为通用解决方案,我们如何在 Swift 中获取字符或字符串的 unicode 代码点?

\n\n

考虑以下:

\n\n
let A: Character = "A"     // "\\u{0041}"\nlet A\xcc\x81: Character = "A\xcc\x81"     // "\\u{0041}\\u{0301}"\n\nlet sparklingHeart = ""  // "\\u{1F496}"\nlet SWIFT = "SWIFT"        // "\\u{0053}\\u{0057}\\u{0049}\\u{0046}\\u{0054}"\n
Run Code Online (Sandbox Code Playgroud)\n\n

如果我没有记错的话,所需的函数可能会返回一个字符串数组,例如:

\n\n
extension Character {\n    func getUnicodeCodePoints() -> [String] {\n        //...\n    }\n}\n\nA.getUnicodeCodePoints()\n// the output should be: ["\\u{0041}"]\n\nA\xcc\x81.getUnicodeCodePoints()\n// the output should be: ["\\u{0041}", "\\u{0301}"]\n\nsparklingHeart.getUnicodeCodePoints()\n// the output should be: ["\\u{1F496}"]\n\nSWIFT.getUnicodeCodePoints()\n// the output should be: ["\\u{0053}", "\\u{0057}", "\\u{0049}", "\\u{0046}", "\\u{0054}"]\n
Run Code Online (Sandbox Code Playgroud)\n\n

任何更多建议的优雅方法将不胜感激。

\n

string unicode character codepoint swift

2
推荐指数
1
解决办法
1884
查看次数

使用带有 \dot 输入参数的 codepoint() 会产生不同的结果

我想看看是否可以从 Julia 中的符号中检测到 \\dot 运算符,这是我尝试过的:

\n

以下两个块返回不同的结果

\n
julia> [codepoint(i) for i in string(:x\xcc\x87)]\n1-element Vector{UInt32}:\n 0x00001e8b\n
Run Code Online (Sandbox Code Playgroud)\n
julia> [codepoint(i) for i in "x\xcc\x87"]\n2-element Vector{UInt32}:\n 0x00000078\n 0x00000307\n
Run Code Online (Sandbox Code Playgroud)\n

理想情况下,我会在开头有一个符号,而不是字符串,所以我需要使用第一种方法,但这不会返回 0x307,这是 \\dot 的 unicode,使得很难检测 \\dot。

\n

那么差异背后的机制是什么呢?谢谢。

\n

unicode codepoint julia

2
推荐指数
1
解决办法
46
查看次数

如果我使用Java 8的String.codePoints来获取int codePoints数组,那么数组的长度是字符数吗?

给定String stringJava中的一个,确实string.codePoints().toArray().length反映String了人类会发现有意义的实际字符的长度吗?换句话说,它是否平滑了转义字符和其他编码工件?

编辑 "人类"我的意思是"程序员",因为我想大多数程序员会看到\r\n两个角色,ESC一个角色等等.但是现在我看到即使是重音标记也会被雾化,所以无关紧要.

java codepoint character-encoding java-8

1
推荐指数
1
解决办法
997
查看次数

如何反转“String.fromCodePoint”,即将字符串转换为代码点数组?

String.fromCodePoint(...[127482, 127480])给了我一面美国国旗 ()。

如何将标志变回[127482, 127480]

javascript string codepoint unicode-string

1
推荐指数
1
解决办法
962
查看次数

如何在python中的代码点上拆分unicode字符串?(例如,\ u00B7或\ u2022)?

我尝试了一切我能想到的......

1. unicode_obj.split('\u2022')
2. re.split(r'\u2022', unicode_object)
3. re.split(r'(?iu)\u2022', unicode_object)
Run Code Online (Sandbox Code Playgroud)

没有任何效果

问题是我想拆分特殊字符.

example string : u'<special char like middot:\u00b7 or bullet:\u2022> sdfhsdf <repeat special char> sdfjhdgndujhfsgkljng <repeat special char> ... etc'
Run Code Online (Sandbox Code Playgroud)

请帮忙.

提前致谢.

python unicode split codepoint points

0
推荐指数
1
解决办法
1809
查看次数

在 Erlang 中将字符串转换为字符的最惯用的方法是什么?

将其转换为最惯用的方法是什么:"helloworld"to ["h","e","l","l","o","w","o","r","l","d"]in Erlang ?

string erlang codepoint

0
推荐指数
1
解决办法
949
查看次数

Flutter:如何绘制 Font Awesome 图标?

我正在CustomPainter根据以下问题使用 flutter 进行绘制:Flutter: How to Paint an Icon on Canvas?

final icon = Icons.cake;
TextPainter textPainter = TextPainter(textDirection: TextDirection.rtl);
textPainter.text = TextSpan(
    text: String.fromCharCode(icon.codePoint),
    style: TextStyle(fontSize: 20.0, fontFamily: icon.fontFamily));
textPainter.layout();
textPainter.paint(canvas, Offset(200.0, 200.0));
Run Code Online (Sandbox Code Playgroud)

这适用于材料设计图标。不过,我想使用相同的技术来绘制 Font Awesome 图标。我正在使用font_awesome_flutter 8.5.0 包,这是我的代码:

final icon = Icon(FontAwesomeIcons.fish, size: 20, color: Colors.teal[700]);
TextPainter textPainter = TextPainter(textDirection: TextDirection.rtl);
textPainter.text = TextSpan(
    text: String.fromCharCode(icon.codePoint),
    style: TextStyle(fontSize: 20.0, fontFamily: icon.fontFamily));
textPainter.layout();
textPainter.paint(canvas, Offset(200.0, 200.0));
Run Code Online (Sandbox Code Playgroud)

我从 IDE 收到一条消息,指出“未为类 'Icon' 定义 getter 'codePoint'”。请问我该如何解决这个问题?

codepoint font-awesome flutter

0
推荐指数
1
解决办法
1679
查看次数

java 从 unicode 代码点获取 unicode 表示字符串

我想\u从整数代码点获取 java 使用的字符串表示形式。我找遍了所有地方,但还没有找到一个有效的答案\ud83e\udd82。我从字节码查看器编译和反编译 jar 得到了符号。我不知道它是如何获得这些字符串或从哪里获得的。在 Java 中进行开发时,复制 unicode 字符然后将其粘贴并获取它的 Java 字符串版本非常有用。因此,每个使用它的类不必都采用 utf-8 格式。

java unicode codepoint

0
推荐指数
1
解决办法
1213
查看次数

带有肤色的表情符号如何在内部表示?

我正在编写一个处理表情符号的计算机程序。我对如何在内部表示表情符号变体感兴趣。

诸如这些竖起大拇指的表情符号看起来是同一个字符,但具有不同的特征,例如肤色。此外,这些字符似乎占用了相对大量的内存:

console.log('a'.length) // 1
console.log(''.length) // 4
Run Code Online (Sandbox Code Playgroud)

这些字符在内部是如何表示的?

unicode codepoint emoji

-25
推荐指数
1
解决办法
717
查看次数