假设我创建了一个速记书写系统,它有自己的自定义唯一字符集,而 Unicode 中不存在这些字符。
有没有一种方法可以让我:
亲自绘制每个角色,
然后为每个字符分配自己的 Unicode 代码,
然后将这些代码写入 HTML 页面中,
然后在网站上发布该 HTML 页面,
然后以某种方式使其他人在访问该网站的页面时能够实际查看这些独特的字符?
unicode customization character-encoding special-characters non-ascii-characters
由于我已在 W10 上将 R 更新到 4.1.0/4.1.1 版本,因此我遇到了 2 个有关法语重音字符的问题。
有人面临同样的问题吗?你解决了吗?
在此先感谢您的帮助。纽布R.
我正在尝试安装一个正则表达式,在文件中得到一些单词,这个单词的所有字母都与单词模式匹配.
我的问题是,正则表达式找不到重音词,但在我的文本文件中有很多重音词.
我的命令行是:
cat input/words.txt | grep '^[éra]\{1,4\}$' > output/words_era.txt
cat input/words.txt | grep '^[carroça]\{1,7\}$' > output/words_carroca.txt
Run Code Online (Sandbox Code Playgroud)
而文件的内容是:
carroça
éra
éssa
roça
roco
rato
onça
orça
roca
Run Code Online (Sandbox Code Playgroud)
我该如何解决?
我收到了文件,遗憾的是,我无法获得有关它们是如何生成的信息.我需要解析这些文件.
除了一个字符外,该文件完全是ASCII:0xDB(十进制表示219).
显然(从查看文件)这个字符是货币符号.我知道因为:
我认为在这些文件中,0xDB应该代表欧元符号(实际上非常有可能这个0xDB出现在欧洲符号应该出现的所有地方).
该文件的命令说,这有关文件:
ISO-8859 English text, with CRLF, LF line terminators
Run Code Online (Sandbox Code Playgroud)
一个hexdump都给出了这样的:
00000030 71 75 61 6e 74 20 db 32 2e 36 30 0a 20 41 49 4d |quant .2.60. AIM|
^^ ^
Run Code Online (Sandbox Code Playgroud)
这些文件通常都是通常格式化/可解析的.实际上我除了那个奇怪的0xDB字符外,还得到了所有的信息.
有谁知道发生了什么?货币符号(据说欧元符号)是如何成为0xDB的?
它既不是ISO-8859-1(又名ISO Latin 1)也不是ISO-8859-15,因为在这两种情况下代码点219对应于'Û'(正如Unicode代码点219是'具有CIRCUMFLEX'的LATIN CAPITAL LETTER U').
它不是扩展ASCII.
我想做典型的高亮代码.所以我有类似的东西:
$valor = preg_replace("/(".$_REQUEST['txt_search'].")/iu", "<span style='background-color:yellow; font-weight:bold;'>\\1</span>", $valor);
Run Code Online (Sandbox Code Playgroud)
现在,请求单词可能类似于"josé".有了它,我也想要"jose"或"JOSÉ"或"José"等.
有了这个表达式,如果我写"josé",它会匹配"josé"和"JOSÉ"(以及所有案例变体).它始终只与重音变体匹配.如果我搜索"jose",它会匹配"JOSE","jose","Jose"而不是重音符号.所以我部分地想要我想要的,因为我对重音和非重音分别不区分大小写.
我需要它完全结合,这意味着重音(unicode)不敏感,所以我可以搜索"jose",并突出显示"josé","josÉ","José","JOSE","JOSÉ","JoSé",... .
我不想在单词上替换重音,因为当我在屏幕上打印时,我需要看到真实的单词.
有任何想法吗?
谢谢!
我希望能够检测到用户:
目前,我正在使用像这样的ASCII范围(C#语法):
string searchKeyWord = Console.ReadLine();
var romajis = from c in searchKeyWord where c >= ' ' && c <= '~' select c;
if (romajis.Any())
{
// Romajis
}
else
{
// Japanese input
}
Run Code Online (Sandbox Code Playgroud)
有没有更好,更快(更强...)的方法来做到这一点?
编辑:问题可以推广到具有非ASCII字符集的任何其他语言。
你好,
我有一个Java程序,带有命令行界面.它用于Linux和Windows.Java代码是可移植的,我希望它保持可移植性.
我的Java源文件是Unicode的 - 这很好.在他们中间,我有这样的行:
System.err.println("Paramètre manquant. … ");
Run Code Online (Sandbox Code Playgroud)
我使用Eclipse将程序打包为JAR存档.
然后,程序由以下命令运行:
java -jar MyProgram.jar parameters
在Windows XP命令行中,这给出:
ParamÞtre manquant. …
是否有可移植的方法在Java程序中使用重音编写字符串,以便它们在Windows命令行中正确显示?或者我们只是不得不忍受Windows愚蠢地用冰岛刺取代重音E?
我使用Java 6.
java windows portability internationalization non-ascii-characters
我是一个初学程序员,试图编写一个生成随机密码的python脚本.但是,即使我声明编码#utf-8,我总是得到一个非ASCII字符错误,如Stack Overflow中另一个类似的问题所述.这是源代码:
import string
import random
#coding: utf-8
print "Password generator will create a random customizable password."
print "Choose your options wisely."
number = int(input("How many letters do you want in your password?"))
caps = str(input("Do you want capital letters in your password? Y/N"))
symbols = str(input( "Do you want punctuation, numbers and other symbols in your password? Y/N"))
punctuation = ("!", ".", ":", ";", ",", "?", "'", "@", "£", "$", "«", "»", "~", "^","%", "#", "&", "/", range(0, 11)) …Run Code Online (Sandbox Code Playgroud) 我正在使用Visual Studio和C#编写一个非常简单的Windows应用程序来编辑电影的字幕文件.我想要一个程序,在没有对话句时为对话句添加空格.例如:
-嘿,怎么了?
-没什么.
至
- 嘿,怎么了?
- 没什么.
我使用工具箱创建一个界面,只有一个按钮,用于选择正确的文件.这是我对此按钮的代码:
private void button1_Click(object sender, EventArgs e)
{
if (openFileDialog1.ShowDialog() == DialogResult.OK)
{
string text = File.ReadAllText(openFileDialog1.FileName, Encoding.GetEncoding("iso-8859-1"));
text = text.Replace("-A", "- A");
File.WriteAllText(openFileDialog1.FileName, text, Encoding.GetEncoding("iso-8859-1"));
}
}
Run Code Online (Sandbox Code Playgroud)
这样做基本上用" - A"代替"-A",从而创造一个空间.这是我提出的解决方案,我打算用每个字母做这个,包括重音字母,如À,Á,È,É等等.
这不起作用.如果我把text = text.Replace(" - É"," - É"); 该计划什么都不做.
我想知道的是我该如何解决这个问题.
感谢您的阅读,如果您有更好的替代方案,请随时告诉我.
我正在尝试使用:
text = "?"
file.write(text)
Run Code Online (Sandbox Code Playgroud)
在python 3.但我收到此错误消息:
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)
如何在python文件中打印符号★?这与用作星级的符号相同.