标签: non-ascii-characters

HTML5 数据列表中的口音

在表单中,我有一个带有数据列表的文本输入。在数据列表中,我添加了不会出现在我的文本输入中的重音术语。例如:如果我输入“a”,带有“ä”或“à”的术语将不会出现在建议中...

最好是整体对口音不敏感

有没有人遇到过这个问题?

谢谢

html non-ascii-characters html-datalist

5
推荐指数
1
解决办法
786
查看次数

使用 iTerm2,如何输入带有重音符号的字符?

我有几个朋友的名字有像'ö'这样的字母。在 OS XI 的所有其他地方都可以按住“o”,然后在小弹出菜单中选择 2。这在 iTerm2 中不起作用。在 iTerm2 中,我得到了很多 o。我还在 OS X 键盘文本设置中设置了一些替换,以允许输入一个人的姓名首字母以替换他们的名字。

是否可以让这些输入法中的任何一种与 iTerm2 一起使用?

如果这些都行不通,我有什么选择?我真的希望我不需要为每种不同类型的口音记住一堆 alt+key 的快捷键。

unicode non-ascii-characters iterm2 osx-yosemite

5
推荐指数
1
解决办法
1248
查看次数

JavaScript - 使用正则表达式匹配非ascii符号

我想在评论中匹配所有提到的用户.例:

var comment = '@Agneš, @Petar, please take a look at this';
var mentionedUsers = comment.match(/@\w+/g);

console.log(mentionedUsers)
Run Code Online (Sandbox Code Playgroud)

我期待["@Agneš", "@Petar"]但是得到["@Agne", "@Petar"].如您所见,š符号不匹配.

如何匹配所有字母符号包括非ascii?

javascript regex utf non-ascii-characters

5
推荐指数
1
解决办法
446
查看次数

此Codeigniter功能不考虑所有重音字符

这是我在这里找到的重音字符列表.

ÂÃÄÀÁÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõöøùúûüýþÿ

我使用Codeigniter函数 convert_accented_characters将重音字符转换为ASCII字符.但是,它似乎失败了两个字符(Þþ),见输出:

AAAeAAAAECEEEEIIIIDjNOOOOOeOUUUUeYÞssaaaaaeaaeceeeeiiiidjnoooooeouuuueyþy

如何扩展此数组以考虑这两个字符.

这种变化是否足够?

'/?/Þ/þ' => 'p',在第88行?我不熟悉这些角色以及它们来自哪个语言!

php codeigniter non-ascii-characters

5
推荐指数
1
解决办法
445
查看次数

正则表达式也匹配重音字符

我有以下 PHP 代码:

\n\n
$search = "foo bar que";\n$search_string = str_replace(" ", "|", $search);\n\n$text = "This is my foo text with qu\xc3\xa9 and other accented characters.";\n$text = preg_replace("/$search_string/i", "<b>$0</b>", $text);\n\necho $text;\n
Run Code Online (Sandbox Code Playgroud)\n\n

显然,“que”与“qu\xc3\xa9”不匹配。我怎样才能改变这一点?有没有办法让preg_replace忽略所有口音?

\n\n

必须匹配的字符(西班牙语):

\n\n
\xc3\xa1,\xc3\x81,\xc3\xa9,\xc3\x89,\xc3\xad,\xc3\x8d,\xc3\xb3,\xc3\x93,\xc3\xba,\xc3\x9a,\xc3\xb1,\xc3\x91\n
Run Code Online (Sandbox Code Playgroud)\n\n

我不想在应用正则表达式之前替换所有重音字符,因为文本中的字符应该保持不变:

\n\n

“这是我的foo文本,带有qu\xc3\xa9和其他重音字符。”

\n\n

并不是

\n\n

“这是我的foo文本,带有que和其他重音字符。”

\n

php regex character non-ascii-characters accent-insensitive

5
推荐指数
1
解决办法
1575
查看次数

Pandas DataFrame的重音字符在Excel中出现乱码

附:

# -*- coding: utf-8 -*-
Run Code Online (Sandbox Code Playgroud)

在我的.ipynb顶部,Jupyter现在正确显示重音字符.

当我导出到csv(with .to_csv())pandas包含重音字符的数据框时:

在此输入图像描述

...在Excel中打开csv时,字符无法正确呈现.

在此输入图像描述

无论我是否设置都是这种情况encoding='utf-8'.pandas/python是否可以在这里完成所有这些,这是一个Excel问题?或者可以在导出到csv之前完成某些事情?

  • Python:2.7.10
  • 熊猫:0.17.1
  • Excel:Excel for Mac 2011

python csv excel non-ascii-characters pandas

5
推荐指数
2
解决办法
2325
查看次数

pickle.load 中的 UnicodeDecodeError

我在使用 pickle 加载 pkl 文件时遇到一些问题。我使用的是 Windows 7 和 Python 3.5.1 64 位。pkl 文件是从这里下载的。

这是我的代码:

import pickle

# Load model weights and metadata
weightFile = open('vgg16.pkl', 'rb')
d = pickle.load(weightFile)
Run Code Online (Sandbox Code Playgroud)

当我运行它时,我得到输出

"C:\Program Files\Python35\python.exe" C:/work/lasagne/tutorial/lasagne-tutorial2.py
Traceback (most recent call last):
  File "C:/work/lasagne/tutorial/lasagne-tutorial2.py", line 5, in <module>
    d = pickle.load(weightFile)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xbc in position 1: ordinal not in range(128)

Process finished with exit code 1
Run Code Online (Sandbox Code Playgroud)

这个错误信息是什么意思?它说有一个 acsii 编解码器无法解码的字节,但是 pkl 文件不应该是二进制的(因此不包含 ascii 字符)吗?

我加载文件时做错了什么吗?我可以做什么来修复该错误?

pickle non-ascii-characters windows-7 python-3.5

5
推荐指数
1
解决办法
3724
查看次数

在网站上显示自定义(个人创建的)Unicode 字符

假设我创建了一个速记书写系统,它有自己的自定义唯一字符集,而 Unicode 中不存在这些字符。

有没有一种方法可以让我:

  • 亲自绘制每个角色,

  • 然后为每个字符分配自己的 Unicode 代码,

  • 然后将这些代码写入 HTML 页面中,

  • 然后在网站上发布该 HTML 页面,

  • 然后以某种方式使其他人在访问该网站的页面时能够实际查看这些独特的字符?

unicode customization character-encoding special-characters non-ascii-characters

5
推荐指数
0
解决办法
2498
查看次数

用于 ASCII 的类似 UTF8 字符

我正在寻找一个包含 ASCII 字符和相同外观的 UTF8 字符的表。我知道这也取决于字体是否看起来相同,但从通用开始就足够了。

>>> # PY3 code:
>>> a='H'  # ascii
>>> b='?'  # utf8
>>> a==b
False
>>> ' '.join(format(ord(x), 'b') for x in a)
'1001000'
>>> ' '.join(format(ord(x), 'b') for x in b)
'10000011101'
>>> a='P'  # ascii
>>> b='?'  # utf8
>>> a==b
False
>>> ' '.join(format(ord(x), 'b') for x in a)
'1010000'
>>> ' '.join(format(ord(x), 'b') for x in b)
'1110100001'
Run Code Online (Sandbox Code Playgroud)

ascii utf-8 non-ascii-characters extended-ascii

5
推荐指数
1
解决办法
6735
查看次数

R - 法语重音字符的问题

由于我已在 W10 上将 R 更新到 4.1.0/4.1.1 版本,因此我遇到了 2 个有关法语重音字符的问题。

有人面临同样的问题吗?你解决了吗?

在此先感谢您的帮助。纽布R.

emacs r non-ascii-characters

5
推荐指数
0
解决办法
226
查看次数