相关疑难解决方法(0)

如何遍历Java String的unicode代码点?

所以我知道String#codePointAt(int),但它是由char偏移索引,而不是由代码点偏移索引.

我正在考虑尝试这样的事情:

但我担心的是

  • 我不确定自然处于高代理范围内的代码点是否会存储为两个char值或一个值
  • 这似乎是迭代字符的一种非常昂贵的方式
  • 有人必须想出更好的东西.

java string unicode

99
推荐指数
4
解决办法
3万
查看次数

Unicode中的汉字完整范围是什么?

U + 4E00..U + 9FFF是整套的一部分,但不是全部

unicode cjk

83
推荐指数
4
解决办法
9万
查看次数

使用正则表达式匹配utf-8编码中的任何中文字符

例如,我想匹配组成的字符串mn中国的字符,然后我可以使用:

[single Chinese character regular expression]{m,n}
Run Code Online (Sandbox Code Playgroud)

是否存在单个汉字的正则表达式,可能是存在的任何汉字?

regex unicode non-english flex-lexer

26
推荐指数
3
解决办法
4万
查看次数

在字符串中测试日文/中文字符

我有一个程序可以读取一堆文本并对其进行分析.文本可能是任何语言,但我需要测试日语和中文,以不同的方式分析它们.

我已经读过,我可以测试它上面的每个字符的unicode数字,看看它是否在CJK字符范围内.这很有帮助,但是如果可能的话,我想将它们分开来处理针对不同字典的文本.有没有办法测试角色是日文还是中文?

string unicode language-detection

6
推荐指数
1
解决办法
4495
查看次数

如何在android中检查给定文本是英文还是中文?

我正在设计一个英文和中文的Android应用程序.我想知道用户是否输入英文文本或中文文本?有没有办法在Android中检查这个?

android

5
推荐指数
1
解决办法
3165
查看次数

日文和中文中 unicode 代码点的不同表示

我正在尝试显示与 unicode 0x95E8 对应的字形。这个代码点基本上是 CJK 块(中文、日文、韩文)。

我正在努力知道这个特定代码点的字形表示对于日语和中文是否可能不同。

当我在 JTextArea 中显示这个 U+95E8 时,我能够看到“?” linux/windows 上的字符。但是当我试图在我的“嵌入式设备”中显示相同的代码点时。显示的字符变为。

japanese_glyph

我想知道这个代码点 U+95E8 是否应该在所有 CJK(中文、日文、韩文)语言环境中具有统一的表示形式,或者对于其中一些语言环境是否不同。这种表现会不会是因为不同设备安装的字体不同?我很抱歉我的无知,但我并不太喜欢国际化。

import java.awt.*;
import java.awt.event.*;
import java.util.Locale;

import javax.swing.*;

public class TextDemo extends JPanel implements ActionListener {

    public TextDemo() {
    }

    public void actionPerformed(ActionEvent evt) {
    }

    /**
     * Create the GUI and show it.  For thread safety,
     * this method should be invoked from the
     * event dispatch thread.
     * @throws InterruptedException 
     */
    private static void createAndShowGUI() throws InterruptedException {

        JFrame frame …
Run Code Online (Sandbox Code Playgroud)

java unicode locale localization chinese-locale

5
推荐指数
2
解决办法
718
查看次数

如何在Java字符串中检测日文文本?

我需要能够在Java字符串中检测日语字符.

目前我正在获取UnicodeBlock并检查它是否等于Character.UnicodeBlock.KATAKANA或Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS,但我不是100%将覆盖所有内容.

有什么建议?

java unicode character-encoding

4
推荐指数
2
解决办法
8702
查看次数