嗨,我有一些不会验证的XML.我把这个问题缩小到了这个范围:
<script type="text/javascript">document.getelementbyid("oxm-1f4a4485-5a1d-45f9-a989-9c65a0b9ceb6").src="http://bid.website.net/display?l=h4siaaaaaaaaad2nmq6cqbrenycw7qjyolfccxmregvcoae0u0sly_agtvaewwn4bg_havwbnebpvmzkkzra_kzzdvoloq4u-hjnp7sii0rxcbzz5vl5kxsrds6wtsfbxmcr9chysuhqbecuckb8cvx4m-pbcxugtdrll6d3dqtihnqukth2yvdkptr67cuzfvlxjlinkul9634lpal_h4mwhso8aabzhw1cdcwjxl6xivgv8agrjxjc_gaaaa==&p=h4siaaaaaaaaabxkmq7cmaxaurcqjjrrsfqqsrm7x3fsrwyvosda8qnj_3ojfgb49o45pblq7e80syzjhopggso9wyzpcpntzkxk1ldtbbi7otmxfj9da1wpjcf10vtxdj9e5_utyj19k2lfssepld5agnqaaaa=&url=http%3a%2f%2flocalhost%2fproject-debug%2fproject.html";</script>
Run Code Online (Sandbox Code Playgroud)
我把它放在一个XML验证器中,它吐出来:
此页面包含以下错误:第16行第1行的错误:EntityRef:expecting';'
任何关于失踪';'的想法 应该去?还有其他问题吗?
我有一些希伯来网站,其中包含如下字符引用: נוף
如果我将文件保存为.html并以UTF-8编码查看,我只能查看这些字母.
如果我尝试将其作为常规文本文件打开,则UTF-8编码不会显示正确的输出.
我注意到如果我打开文本编辑器并以UTF-8编写希伯来语,在这个例子中每个字符占用两个字节而不是4个字节行(ו)
如果这是UTF-16或任何其他类型的UTF字母表示的任何想法?
如果可能,如何将其转换为普通字母?
使用最新的PHP版本.
数字字符引用指定文档字符集中字符的代码位置.
因此,如果文档字符集编码是UTF-8,则数字引用应指定Unicode代码点.
&符号后面必须跟一个U + 0023 NUMBER SIGN字符(#),后面必须跟一个U + 0078 LATIN SMALL LETTER X字符(x)或U + 0058 LATIN CAPITAL LETTER X字符(X),然后必须跟随一个或多个数字,范围为U + 0030 DIGIT ZERO(0)至U + 0039 DIGIT NINE(9),U + 0061 LATIN SMALL LETTER A至U + 0066 LATIN SMALL LETTER F和U + 0041 LATIN CAPITAL LETTER A到U + 0046 LATIN CAPITAL LETTER F,表示一个基数为16的整数,对应于根据下面定义允许的Unicode代码点.然后必须在数字后跟一个U + 003B SEMICOLON字符(;).
没有提到文档字符集,它只是说数字值标识Unicode代码点.
但似乎所有现代浏览器(我都没有测试过较旧的浏览器)对待 通过 好像他们正在引用Windows-1252
例如, 显示€,但U + 0080不是代码点€,U + 20AC是.U + 0080的Unicode代码点定义为PAD
€ 也(正确)显示€. …
抱歉我无法登录声明ID有服务器问题(我通常是Arthur Gibbs)
当有奇怪的字符时,我数据库中的数据当前会输出...
这只是一个例子
我得到了De√ilscrat™
什么:我想要什么:De?ilscrat™
似乎其他人系统正在将一些字符翻译成字符代码.
所以我想知道的是:
是否有一个函数可以扩展字符串中的charecter代码?
转动FUNCTION(De√ilscrat™) >>> De?ilscrat™.