字符代码(HTML)是​什么?我在我的一个jQuery脚本中发现了它,并想知道它是什么..
谢谢.
编辑:
这是它所在的脚本(它被添加到最后,在Firebug中找到它)
<script src="http://code.jquery.com/jquery-latest.js" type="text/javascript"></script>
<script type="text/javascript">
var $jnyh = jQuery.noConflict();
$jnyh(function() {
$jnyh("#title-nyh").click(function() {
$jnyh(".show-hide-nyh").slideDown("slow");
}, function() {
if(!$jnyh(this).data('pinned'))
$jnyh(".show-hide-nyh").slideUp("slow");
});
$jnyh("#title-nyh").click(function() {
$jnyh(this).parent().toggleClass("title-btm-brdr");
$jnyh(this).toggleClass("chev-up-result");
var pin = $jnyh(this).data('pinned');
$jnyh(this).data('pinned', !pin);
if(pin) $jnyh(".show-hide-nyh").slideUp("slow");
});
});?​
</script>
Run Code Online (Sandbox Code Playgroud) 我正在尝试使用名为bidi的Python包.在这个包中的模块(algorithm.py)中,有一些行给出了错误,尽管它是包的一部分.
以下是这些行:
# utf-8 ? we need unicode
if isinstance(unicode_or_str, unicode):
text = unicode_or_str
decoded = False
else:
text = unicode_or_str.decode(encoding)
decoded = True
Run Code Online (Sandbox Code Playgroud)
这是错误信息:
Traceback (most recent call last):
File "<pyshell#25>", line 1, in <module>
bidi_text = get_display(reshaped_text)
File "C:\Python33\lib\site-packages\python_bidi-0.3.4-py3.3.egg\bidi\algorithm.py", line 602, in get_display
if isinstance(unicode_or_str, unicode):
NameError: global name 'unicode' is not defined
Run Code Online (Sandbox Code Playgroud)
我应该如何重写这部分代码,以便它在Python3中工作?如果有人使用Python 3的bidi包,请告诉我他们是否发现了类似的问题.我感谢您的帮助.
我需要在我的html页面上插入Omega(Ω).我正在使用其HTML转义代码来执行此操作,因此我可以编写Ω并获取Ω.当我将它放入HTML元素时,这一切都很好; 但是,当我尝试将它放入我的JS时,例如var Omega = Ω,它将该代码解析为JS并且整个事情都不起作用.有谁知道如何去做?
试图理解现代Unicode的微妙之处让我头疼.特别是,代码点,字符,字形和字形之间的区别 - 在最简单的情况下,当使用ASCII字符处理英文文本时,所有这些概念彼此之间都存在一对一的关系 - 这给我带来了麻烦.
看看这些术语如何在像Matthias Bynens的JavaScript这样的文档中使用有一个unicode问题或Wikipedia关于Han统一的文章,我收集到这些概念不是一回事,并且将它们混淆是危险的,但我有点像努力去理解每个术语的含义.
Unicode Consortium提供了一个词汇表来解释这些东西,但它充满了"定义",如下所示:
抽象字符.用于组织,控制或表示文本数据的信息单元....
...
性格....(2)抽象字符的同义词.(3)Unicode字符编码的基本编码单位....
...
雕文.(1)表示一个或多个字形图像的抽象形式.(2)字形图像的同义词.在显示Unicode字符数据时,可以选择一个或多个字形来描绘特定字符.
...
Grapheme.(1)在特定书写系统的背景下最低限度的独特写作单位....
这些定义中的大多数都具有非常学术和正式的声音质量,但缺乏任何意义的质量,或者将定义问题推迟到另一个词汇表条目或标准部分.
因此,我寻求那些比我学得更多的人的神秘智慧.这些概念中的每一个究竟是如何彼此不同的,在什么情况下它们之间不会有一对一的关系?
我真的很困惑.我试着编码,但错误说can't decode....
>>> "??".encode("utf8")
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)
我知道如何避免字符串上带有"u"前缀的错误.我只是想知道为什么在调用编码时错误是"无法解码".什么是Python在幕后做什么?
我陷入了一个令人惊讶的问题.
我在我的应用程序中加载了一个文本文件,并且我有一些逻辑比较了μ的值.
我意识到,即使文本相同,比较值也是错误的.
Console.WriteLine("?".Equals("µ")); // returns false
Console.WriteLine("µ".Equals("µ")); // return true
Run Code Online (Sandbox Code Playgroud)
在后面的行中,字符μ被复制粘贴.
任何想法都会有所帮助.
我得到了以下模式的错误:
UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)
不知道是什么u'\ufeff',它在网络抓取时显示出来.我该如何纠正这种情况?该.replace()字符串的方法不能进行这项工作.
我想要类似的东西
0x2022 8226 BULLET •
Run Code Online (Sandbox Code Playgroud)
但更大.
我甚至无法在http://www.ssec.wisc.edu/~tomw/java/unicode.html上找到它们.
我应该搜索什么?点?子弹?
我想在Java中显示Unicode字符.如果我这样做,它的工作正常:
String symbol = "\u2202";
符号等于"∂".这就是我想要的.
问题是我知道Unicode编号,需要从中创建Unicode符号.我试过(对我而言)显而易见的事情:
int c = 2202;
String symbol = "\\u" + c;
Run Code Online (Sandbox Code Playgroud)
但是,在这种情况下,符号等于"\ u2202".那不是我想要的.
如果我知道它的Unicode编号,我该如何构造符号(但仅在运行时---我不能像第一个例子那样硬编码)?
我知道非标准的%uxxxx方案,但这似乎不是明智的选择,因为该方案已被W3C拒绝.
一些有趣的例子:
心中的人物.如果我在浏览器中输入:
http://www.google.com/search?q=?
Run Code Online (Sandbox Code Playgroud)
然后复制并粘贴它,我看到这个URL
http://www.google.com/search?q=%E2%99%A5
Run Code Online (Sandbox Code Playgroud)
这使得它看起来像Firefox(或Safari)正在这样做.
urllib.quote_plus(x.encode("latin-1"))
'%E2%99%A5'
Run Code Online (Sandbox Code Playgroud)
这是有道理的,除了不能用Latin-1编码的东西,比如三点字符.
…
Run Code Online (Sandbox Code Playgroud)
如果我输入URL
http://www.google.com/search?q=…
Run Code Online (Sandbox Code Playgroud)
进入我的浏览器然后复制粘贴,我明白了
http://www.google.com/search?q=%E2%80%A6
Run Code Online (Sandbox Code Playgroud)
背部.这似乎是做的结果
urllib.quote_plus(x.encode("utf-8"))
Run Code Online (Sandbox Code Playgroud)
这是有道理的,因为...不能用Latin-1编码.
但后来我不清楚浏览器是如何用UTF-8或Latin-1解码的.
因为这似乎含糊不清:
In [67]: u"…".encode('utf-8').decode('latin-1')
Out[67]: u'\xc3\xa2\xc2\x80\xc2\xa6'
Run Code Online (Sandbox Code Playgroud)
有效,所以我不知道浏览器是如何用UTF-8或Latin-1解码的.
使用我需要处理的特殊字符做什么是正确的?
unicode ×10
python ×3
string ×3
html ×2
utf-8 ×2
.net ×1
bidi ×1
c# ×1
character ×1
java ×1
javascript ×1
nameerror ×1
python-2.7 ×1
python-2.x ×1
python-3.x ×1
terminology ×1
urlencode ×1