标签: unicode

什么是HTML字符代码8203?

字符代码(HTML)是​什么?我在我的一个jQuery脚本中发现了它,并想知道它是什么..

谢谢.

编辑:

这是它所在的脚本(它被添加到最后,在Firebug中找到它)

<script src="http://code.jquery.com/jquery-latest.js" type="text/javascript"></script>
<script type="text/javascript">
var $jnyh = jQuery.noConflict();


$jnyh(function() {
    $jnyh("#title-nyh").click(function() {
      $jnyh(".show-hide-nyh").slideDown("slow");
    }, function() {        
      if(!$jnyh(this).data('pinned'))
        $jnyh(".show-hide-nyh").slideUp("slow");
    });
    $jnyh("#title-nyh").click(function() {
    $jnyh(this).parent().toggleClass("title-btm-brdr");
       $jnyh(this).toggleClass("chev-up-result");
      var pin = $jnyh(this).data('pinned');
      $jnyh(this).data('pinned', !pin);
      if(pin) $jnyh(".show-hide-nyh").slideUp("slow");      
    });
});?&#8203;
</script>
Run Code Online (Sandbox Code Playgroud)

html unicode character-codes

121
推荐指数
3
解决办法
10万
查看次数

NameError:未定义全局名称'unicode' - 在Python 3中

我正在尝试使用名为bidi的Python包.在这个包中的模块(algorithm.py)中,有一些行给出了错误,尽管它是包的一部分.

以下是这些行:

# utf-8 ? we need unicode
if isinstance(unicode_or_str, unicode):
    text = unicode_or_str
    decoded = False
else:
    text = unicode_or_str.decode(encoding)
    decoded = True
Run Code Online (Sandbox Code Playgroud)

这是错误信息:

Traceback (most recent call last):
  File "<pyshell#25>", line 1, in <module>
    bidi_text = get_display(reshaped_text)
  File "C:\Python33\lib\site-packages\python_bidi-0.3.4-py3.3.egg\bidi\algorithm.py",   line 602, in get_display
    if isinstance(unicode_or_str, unicode):
NameError: global name 'unicode' is not defined
Run Code Online (Sandbox Code Playgroud)

我应该如何重写这部分代码,以便它在Python3中工作?如果有人使用Python 3的bidi包,请告诉我他们是否发现了类似的问题.我感谢您的帮助.

python unicode bidi nameerror python-3.x

120
推荐指数
3
解决办法
16万
查看次数

将Unicode字符插入JavaScript

我需要在我的html页面上插入Omega(Ω).我正在使用其HTML转义代码来执行此操作,因此我可以编写&#937;并获取Ω.当我将它放入HTML元素时,这一切都很好; 但是,当我尝试将它放入我的JS时,例如var Omega = &#937;,它将该代码解析为JS并且整个事情都不起作用.有谁知道如何去做?

html javascript unicode

118
推荐指数
4
解决办法
13万
查看次数

角色,代码点,字形和字形之间有什么区别?

试图理解现代Unicode的微妙之处让我头疼.特别是,代码点,字符,字形和字形之间的区别 - 在最简单的情况下,当使用ASCII字符处理英文文本时,所有这些概念彼此之间都存在一对一的关系 - 这给我带来了麻烦.

看看这些术语如何在像Matthias Bynens的JavaScript这样的文档中使用有一个unicode问题或Wikipedia关于Han统一的文章,我收集到这些概念不是一回事,并且将它们混淆是危险的,但我有点像努力去理解每个术语的含义.

Unicode Consortium提供了一个词汇表来解释这些东西,但它充满了"定义",如下所示:

抽象字符.用于组织,控制或表示文本数据的信息单元....

...

性格....(2)抽象字符的同义词.(3)Unicode字符编码的基本编码单位....

...

雕文.(1)表示一个或多个字形图像的抽象形式.(2)字形图像的同义词.在显示Unicode字符数据时,可以选择一个或多个字形来描绘特定字符.

...

Grapheme.(1)在特定书写系统的背景下最低限度的独特写作单位....

这些定义中的大多数都具有非常学术和正式的声音质量,但缺乏任何意义的质量,或者将定义问题推迟到另一个词汇表条目或标准部分.

因此,我寻求那些比我学得更多的人的神秘智慧.这些概念中的每一个究竟是如何彼此不同的,在什么情况下它们之间不会有一对一的关系?

string unicode terminology

116
推荐指数
2
解决办法
2万
查看次数

Python - 'ascii'编解码器无法解码字节

我真的很困惑.我试着编码,但错误说can't decode....

>>> "??".encode("utf8")
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)

我知道如何避免字符串上带有"u"前缀的错误.我只是想知道为什么在调用编码时错误是"无法解码".什么是Python在幕后做什么?

python unicode python-2.x python-2.7 python-unicode

113
推荐指数
4
解决办法
28万
查看次数

如何在C#中比较'μ'和'μ'

我陷入了一个令人惊讶的问题.

我在我的应用程序中加载了一个文本文件,并且我有一些逻辑比较了μ的值.

我意识到,即使文本相同,比较值也是错误的.

 Console.WriteLine("?".Equals("µ")); // returns false
 Console.WriteLine("µ".Equals("µ")); // return true
Run Code Online (Sandbox Code Playgroud)

在后面的行中,字符μ被复制粘贴.

任何想法都会有所帮助.

.net c# string unicode string-comparison

111
推荐指数
0
解决办法
4739
查看次数

u'\ ufeff'在Python字符串中

我得到了以下模式的错误:

UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)

不知道是什么u'\ufeff',它在网络抓取时显示出来.我该如何纠正这种情况?该.replace()字符串的方法不能进行这项工作.

python unicode utf-8

109
推荐指数
3
解决办法
13万
查看次数

角色中间的大子弹的Unicode字符是什么?

我想要类似的东西

0x2022  8226    BULLET  •
Run Code Online (Sandbox Code Playgroud)

但更大.

我甚至无法在http://www.ssec.wisc.edu/~tomw/java/unicode.html上找到它们.

我应该搜索什么?点?子弹?

unicode

108
推荐指数
4
解决办法
15万
查看次数

从其编号创建Unicode字符

我想在Java中显示Unicode字符.如果我这样做,它的工作正常:

String symbol = "\u2202";

符号等于"∂".这就是我想要的.

问题是我知道Unicode编号,需要从中创建Unicode符号.我试过(对我而言)显而易见的事情:

int c = 2202;
String symbol =  "\\u" + c;
Run Code Online (Sandbox Code Playgroud)

但是,在这种情况下,符号等于"\ u2202".那不是我想要的.

如果我知道它的Unicode编号,我该如何构造符号(但仅在运行时---我不能像第一个例子那样硬编码)?

java string unicode character

107
推荐指数
6
解决办法
24万
查看次数

对Unicode字符进行URL编码的正确方法是什么?

我知道非标准的%uxxxx方案,但这似乎不是明智的选择,因为该方案已被W3C拒绝.

一些有趣的例子:

心中的人物.如果我在浏览器中输入:

http://www.google.com/search?q=?
Run Code Online (Sandbox Code Playgroud)

然后复制并粘贴它,我看到这个URL

http://www.google.com/search?q=%E2%99%A5
Run Code Online (Sandbox Code Playgroud)

这使得它看起来像Firefox(或Safari)正在这样做.

urllib.quote_plus(x.encode("latin-1"))
'%E2%99%A5'
Run Code Online (Sandbox Code Playgroud)

这是有道理的,除了不能用Latin-1编码的东西,比如三点字符.

Run Code Online (Sandbox Code Playgroud)

如果我输入URL

http://www.google.com/search?q=…
Run Code Online (Sandbox Code Playgroud)

进入我的浏览器然后复制粘贴,我明白了

http://www.google.com/search?q=%E2%80%A6
Run Code Online (Sandbox Code Playgroud)

背部.这似乎是做的结果

urllib.quote_plus(x.encode("utf-8"))
Run Code Online (Sandbox Code Playgroud)

这是有道理的,因为...不能用Latin-1编码.

但后来我不清楚浏览器是如何用UTF-8或Latin-1解码的.

因为这似乎含糊不清:

In [67]: u"…".encode('utf-8').decode('latin-1')
Out[67]: u'\xc3\xa2\xc2\x80\xc2\xa6'
Run Code Online (Sandbox Code Playgroud)

有效,所以我不知道浏览器是如何用UTF-8或Latin-1解码的.

使用我需要处理的特殊字符做什么是正确的?

unicode urlencode web-standards utf-8 character-encoding

106
推荐指数
4
解决办法
10万
查看次数