标签: ascii

什么是ANSI格式?

什么是ANSI编码格式?它是系统默认格式吗?它与ASCII有什么不同?

ascii ansi character-encoding codepages

204
推荐指数
7
解决办法
31万
查看次数

如何检查Python中的字符串是否为ASCII?

我想检查一个字符串是否是ASCII格式.

我知道ord(),但是当我尝试时ord('é'),我有TypeError: ord() expected a character, but string of length 2 found.我知道它是由我构建Python的方式引起的(如ord()文档中所述).

还有其他方法可以检查吗?

python string unicode ascii

197
推荐指数
9
解决办法
19万
查看次数

什么是垂直标签?

垂直制表符的原始历史用法是什么(\v在C语言中,ASCII 11)?

键盘上有钥匙吗?有人是如何生成它的?

是否有任何语言或系统仍在使用,垂直制表符会做一些有趣和有用的事情?

ascii character character-encoding special-characters

196
推荐指数
6
解决办法
11万
查看次数

在Python中将Unicode转换为ASCII而没有错误

我的代码只是抓取一个网页,然后将其转换为Unicode.

html = urllib.urlopen(link).read()
html.encode("utf8","ignore")
self.response.out.write(html)
Run Code Online (Sandbox Code Playgroud)

但我得到一个UnicodeDecodeError:


Traceback (most recent call last):
  File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__
    handler.get(*groups)
  File "/Users/greg/clounce/main.py", line 55, in get
    html.encode("utf8","ignore")
UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position 2818: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)

我认为这意味着HTML包含一些在某处错误形成的Unicode尝试.我可以删除导致问题的任何代码字节而不是出错吗?

python unicode ascii utf-8 character-encoding

170
推荐指数
9
解决办法
46万
查看次数

(grep)正则表达式匹配非ASCII字符?

在Linux上,我有一个包含大量文件的目录.其中一些具有非ASCII字符,但它们都是有效的UTF-8.一个程序有一个错误,阻止它使用非ASCII文件名,我必须找出有多少受影响.我打算这样做find,然后做一个grep打印非ASCII字符,然后做一个wc -l找到数字.它不一定是grep; 我可以使用任何标准的Unix 正则表达式,如Perl,sed,AWK等.

但是,是否存在"任何不是ASCII字符的字符"的正则表达式?

regex unicode grep ascii

157
推荐指数
3
解决办法
13万
查看次数

在java中将字符转换为ASCII数值

我有,String name = "admin";
然后我做String char = name.substring(0,1); //char="a"

我想将char其转换为ASCII值(97),我该如何在java中执行此操作?

java string ascii

155
推荐指数
7
解决办法
82万
查看次数

PHP:如何删除字符串中的所有不可打印字符?

我想我需要删除0-31和127的字符,

是否有一个函数或一段代码来有效地执行此操作.

php ascii utf-8

147
推荐指数
11
解决办法
20万
查看次数

^ = 32背后的想法是什么,将小写字母转换为高位字母,反之亦然?

我在解决代码问题上遇到了一些问题.通常我首先检查字符是英文字母的上部还是下部,然后减去或添加32以将其转换为相应的字母.但我发现有人^= 32做了同样的事情.这里是:

char foo = 'a';
foo ^= 32;
char bar = 'A';
bar ^= 32;
cout << foo << ' ' << bar << '\n'; // foo is A, and bar is a
Run Code Online (Sandbox Code Playgroud)

我已经搜索了这方面的解释并没有找到答案.那么为什么会这样呢?

c++ ascii bit-manipulation

146
推荐指数
10
解决办法
2万
查看次数

为什么Python在默认编码为ASCII时会打印unicode字符?

从Python 2.6 shell:

>>> import sys
>>> print sys.getdefaultencoding()
ascii
>>> print u'\xe9'
é
>>> 
Run Code Online (Sandbox Code Playgroud)

我希望在print语句之后有一些乱码或错误,因为"é"字符不是ASCII的一部分,我没有指定编码.我想我不明白ASCII是默认编码的意思.

编辑

我将编辑移动到了答案部分并按照建议接受了它.

python unicode encoding ascii python-2.x

137
推荐指数
3
解决办法
8万
查看次数

从以十六进制编码的ASCII字符串转换为纯ASCII?

如何在Python中从十六进制转换为纯ASCII?

请注意,例如,我想将"0x7061756c"转换为"paul".

python hex ascii

134
推荐指数
8
解决办法
39万
查看次数