相关疑难解决方法(0)

有没有办法检查unicode文本是否使用某种语言?

我将从用户那里获取需要验证的文本是中文字符.

有什么方法可以检查吗?

c# unicode .net-4.0

20
推荐指数
3
解决办法
1万
查看次数

18
推荐指数
4
解决办法
1万
查看次数

在java中检测中文字符

使用Java如何检测String是否包含中文字符?

    String chineseStr = "???" ;

if (isChineseString(chineseStr)) {
  System.out.println("The string contains Chinese characters");
}else{
  System.out.println("The string contains Chinese characters");
}
Run Code Online (Sandbox Code Playgroud)

你能帮我解决一下这个问题吗?

java unicode encoding utf-8

14
推荐指数
1
解决办法
2万
查看次数

如何验证中文(unicode)和英文名称?

我有一个多语种网站(中文和英文).

我喜欢在javascript中验证文本字段(名称字段).到目前为止,我有以下代码.

var chkName = /^[characters]{1,20}$/;

if( chkName.test("[name value goes here]") ){
  alert("validated");
}
Run Code Online (Sandbox Code Playgroud)

问题是,/ ^ [字符] {1,20} $ /只匹配英文字符.是否可以匹配任何(包括unicode)字符?我以前使用以下正则表达式,但我不想在每个characeters之间留出空格.

/^(.+){1,20}$/
Run Code Online (Sandbox Code Playgroud)

javascript regex unicode character-properties

10
推荐指数
1
解决办法
2万
查看次数

Python:检查字符串是否包含中文字符?

这可能是一个字符串

ipath= "./data/NCDC/??/??/9705626661750dat.txt"
Run Code Online (Sandbox Code Playgroud)

或这个

ipath = './data/NCDC/ciampino/6240476818161dat.txt'
Run Code Online (Sandbox Code Playgroud)

我怎么知道第一个字符串包含中文

我发现这个答案可能有用: 使用Python和Regex查找字符串中的所有中文文本

但它没有成功:

import re
ipath= "./data/NCDC/??/??/9705626661750dat.txt"
re.findall(ur'[\u4e00-\u9fff]+', ipath) # => []
Run Code Online (Sandbox Code Playgroud)

python regex unicode python-2.x

10
推荐指数
4
解决办法
1万
查看次数

检测字符串中的中文(多字节)字符

$str = "This is a string containing ?? characters. Some more characters - ??????? ";
Run Code Online (Sandbox Code Playgroud)

如何从此字符串中检测中文字符并打印以第一个字符开头并以" - "结尾的部分?(这将是"中文字符.更多字符 - ").

谢谢!

php cjk multibyte

8
推荐指数
1
解决办法
6822
查看次数

如何让oninput()只在输入汉字而不是IME按键时触发?

我有一个基本的<input type="text" oninput="funct()"></input>.

\n\n

然而,当我输入中文时,oninput它也是由 IME 输入触发的,而不仅仅是结果字符。例如,当我用拼音输入法输入“\xe6\x88\x91\xe5\x80\x91”时,我的函数funct()显示console.log(WHAT_I_TYPED),控制台显示:

\n\n
    \n
  • w
  • \n
  • \n
  • 口碑营销
  • \n
  • 沃姆
  • \n
  • 女性
  • \n
  • \xe6\x88\x91\xe5\x80\x91
  • \n
\n\n

我希望它只读取“\xe6\x88\x91\xe5\x80\x91”。但是,我不想修改函数中的文本,因为中文输入法太多,无法实现。

\n

html javascript input function ime

8
推荐指数
1
解决办法
635
查看次数

在Android中区分CJK语言(中文,日文,韩文)

我希望能够识别中文,日文和韩文书写字符,包括一般组和细分语言.原因如下:

  • 认识到CJK是一个普通群体:我正在制作蒙古文垂直脚本TextView.为此,我需要将文本行旋转90度,因为字形水平存储在字体中.但是,对于CJK语言,我需要再次将它们旋转回来,以便它们以正确的方向书写,但只是在线上堆叠在一起.
  • 将CJK区分为特定语言:我也制作蒙古语词典,当用户输入CJK字符进行查找时,我想自动识别该语言.因为汉字也被日本人和韩国人使用,我猜我不能完全实现这一点,但我想在编码允许的最大程度上做到这一点.

在语言方面,我所知道的子类别是

为了完整起见,汉语也用于越南语(因此CJK也称为CJKV).对于我目前的目的,我不需要担心它,但它可能是未来的考虑因素.我也忽略了像汉语拼音或日本罗马字母这样的罗马字母.它们将在TextView中与英语和蒙古语相同(即与其余部分一起旋转90度).在台湾使用的Bopomofo也可能是未来的考虑因素,但我暂时不理会它.另请参见此处此处的语言示例.

我已经看到了一些相关的问题,这些问题通常涉及Java或Android中的一种特定语言,但没有一个与规范性答案有关的首要问题.其他问题对于Unicode更为通用,但没有说明如何在Java和Android中执行此操作.以下是一些具体的内容.

所以我的问题是,我可以使用Unicode代码点区分CJK语言多少?如何在Android中测试它们?我在Java和Android上看到了一些较新的测试,虽然这些测试很有用,但我还需要支持较旧的Android设备.

java unicode android cjk

6
推荐指数
1
解决办法
3139
查看次数

为什么我们应该使用String.Index而不是Int作为String中Character的索引?

我读过有关 Swift 5 中的 Unicode 的文档String不明白为什么我们不能CharacterString以下位置获取 a :

let someString = ""
let oneCharacter = someString[2] // Error
Run Code Online (Sandbox Code Playgroud)

为什么我们应该使用更复杂的方式来获取 a Character

let strawberryIndex = someString.index(someString.startIndex, offsetBy: 2) // String.Index type
someString[strawberryIndex] // Character()
Run Code Online (Sandbox Code Playgroud)

使用 String.Index 类型有什么意义?

swift swift5

6
推荐指数
1
解决办法
1457
查看次数

如何在android中检查给定文本是英文还是中文?

我正在设计一个英文和中文的Android应用程序.我想知道用户是否输入英文文本或中文文本?有没有办法在Android中检查这个?

android

5
推荐指数
1
解决办法
3165
查看次数