标签: utf8-decode

PHP中的Unicode未知" "字符检测

在PHP中有没有办法检测以下字符?

我目前正在使用一些不同的算法修复一些UTF-8编码问题,并且需要能够检测?字符串中是否存在.我该怎么办strpos

简单地将角色粘贴到我的代码库中似乎不起作用.

if (strpos($names['decode'], '?') !== false || strpos($names['decode'], '?') !== false)
Run Code Online (Sandbox Code Playgroud)

php unicode utf-8 utf8-decode

7
推荐指数
1
解决办法
6341
查看次数

Python将JSON文件保存为UTF-8

我正在尝试将一些UTF-8字符输出到JSON文件.

当我保存文件时,它们的编写方式如下:

{"some_key":"Enviar invitaci\u00f3n privada"}

以上内容有效且有效.当我加载文件并打印'some_key'时,它会在终端显示"Enviartunitaciónprivada".

反正有没有用"some_key"作为编码版本编写JSON文件,像这样?

{"some_key":"Enviartinvitaciónprivada"}

python json utf-8 utf8-decode

7
推荐指数
2
解决办法
7132
查看次数

Ruby:检查东亚宽度(Unicode)

使用Ruby,我必须以列式格式输出字符串到终端.像这样的东西:

| row 1     | a string here     | etc
| row 2     | another string    | etc
Run Code Online (Sandbox Code Playgroud)

我可以使用String#ljust和%s对拉丁文UTF8字符做得很好.

但是当字符是韩文,中文等时出现问题.当有英文行穿插包含韩文等的行时,列不会对齐.

我怎样才能在这里获得列对齐?有没有办法输出相当于固定宽度字体的亚洲字符?如何在Vim中显示和编辑文档?

ruby vim fonts asianfonts utf8-decode

6
推荐指数
1
解决办法
766
查看次数

MySQL将UTF-8更改为ASCII-8BIT

我有这种情况.

电影名称:

$ title = "La leyenda de Osaín"
Run Code Online (Sandbox Code Playgroud)

使用此编码:

$ title.encoding.name
>> UTF-8
Run Code Online (Sandbox Code Playgroud)

然后我将其保存到数据库中.

$ movie = Movie.create!(:title => title)
Run Code Online (Sandbox Code Playgroud)

然后我试着看电影.

$ Movie.find(movie.id).title.encoding.name
>> "ASCII-8BIT"

$ Movie.find(movie.id).title
>> "La leyenda de Osa\xC3\xADn"
Run Code Online (Sandbox Code Playgroud)

所有其他电影的作品不包含像í和的特殊字符û.

这是我的database.yaml文件:

development:
  adapter: mysql
  database: development
  username: linus
  password: my_password
  socket: /tmp/mysql.sock
  encoding: UTF8
Run Code Online (Sandbox Code Playgroud)

我在使用时获得了正确的数据forced_encoding.

$ Movie.find(movie.id).title.force_encoding("UTF-8")
>> "La leyenda de Osaín"
Run Code Online (Sandbox Code Playgroud)

我正在使用Rails 3.0.5.rc1和MySQL 14.14.

谁知道问题可能是什么?

mysql ruby-on-rails utf8-decode

6
推荐指数
1
解决办法
2083
查看次数

Java将字符流转换为人类"可读"字符串

我有一堆字符看起来像这样:

Комуникационна кабелна система
Run Code Online (Sandbox Code Playgroud)

有时我会像这样混合:

Généralités
Run Code Online (Sandbox Code Playgroud)

第一个转换为:

Комуникационнакабелнасистема

第二个:

Généralités

我可以使用浏览器看到这个并将它们放入正文中.

但是如何让java输出"真正的"字符呢?上面的编码叫什么?

我尝试了几件事,最后这件事(这不起作用):

import java.nio.charset.*;
import java.nio.ByteBuffer;
import java.nio.CharBuffer;

List<String> lst = new ArrayList<String>(); lst.add("&#1050;"); lst.add("&#1086;");
for ( String s : lst ) {

    Charset utf8charset = Charset.forName("UTF-8");
    Charset iso88591charset = Charset.forName("ISO-8859-1");

    ByteBuffer inputBuffer = ByteBuffer.wrap( s.getBytes() );

    // decode UTF-8
    CharBuffer data = utf8charset.decode(inputBuffer);

    // encode ISO-8559-1
    ByteBuffer outputBuffer = iso88591charset.encode(data);
    byte[] outputData = outputBuffer.array();

    System.out.println ( new String(outputData) )
}
Run Code Online (Sandbox Code Playgroud)

java groovy encoding character-encoding utf8-decode

6
推荐指数
1
解决办法
1259
查看次数

Python在Java中编码了utf-8 string\xc4\x91

如何从Python创建正确的Java字符串创建字符串'Oslobo\xc4\x91enja'?怎么解码呢?我已经尝试过,我认为一切,到处都是,我已经被这个问题困住了2天.请帮忙!

这是Python的Web服务方法,它返回JSON,Google Gson的Java客户端从中解析它.

def list_of_suggestions(entry):
   input = entry.encode('utf-8')
   """Returns list of suggestions from auto-complete search"""
   json_result = { 'suggestions': [] }
   resp = urllib2.urlopen('https://maps.googleapis.com/maps/api/place/autocomplete/json?input=' + urllib2.quote(input) + '&location=45.268605,19.852924&radius=3000&components=country:rs&sensor=false&key=blahblahblahblah')
   # make json object from response
   json_resp = json.loads(resp.read())

   if json_resp['status'] == u'OK':
     for pred in json_resp['predictions']:
        if pred['description'].find('Novi Sad') != -1 or pred['description'].find(u'???? ???') != -1:
           obj = {}
           obj['name'] = pred['description'].encode('utf-8').encode('string-escape')
           obj['reference'] = pred['reference'].encode('utf-8').encode('string-escape')
           json_result['suggestions'].append(obj)

   return str(json_result)
Run Code Online (Sandbox Code Playgroud)

这是Java客户端的解决方案

private String python2JavaStr(String pythonStr) throws UnsupportedEncodingException {
    int charValue;
    byte[] bytes = …
Run Code Online (Sandbox Code Playgroud)

python java string utf-8 utf8-decode

6
推荐指数
1
解决办法
2448
查看次数

如何用PHP替换具有相似外观的ASCII字符的UTF-8字符?

我有一个关于Unicode的问题.我需要PHP中的函数来转换字符串:

Xinchàotấctảcácbạn.Mìnhkhôngbiếttiếnganh.

至:

Xin chao tat ca cac ban.Minh khong biet tieng anh.

有谁能够帮我?

php utf8-decode

6
推荐指数
1
解决办法
3081
查看次数

如何在jquery中解析utf-8 json

我在php文件中编码了波斯语名称.在编码之前,它显示正确,编码后转换为utf-8字符.我在Java Script(jQuery)中通过Ajax接收它.

sample.php:

json_encode('??? ???????? ');

//after encode: "\u06a9\u0627\u0638\u0645\u06a9\u06cc"

Js:
JSON.parse(response)
// it is still in this form: \u06a9\u0627\u0638\u0645 \u06a9\u06cc
Run Code Online (Sandbox Code Playgroud)

我如何解析这个json,以便我能以原始形式获得它?

javascript php jquery json utf8-decode

6
推荐指数
1
解决办法
1637
查看次数

如何为URL编码西里尔字符然后解码它们?

我在一个页面上有一个表单:

<form method="POST" accept-charset="UTF-8" action="index.cgi" name="TestForm">
Run Code Online (Sandbox Code Playgroud)

其中一个输入字段"search_string"可用于发送西里尔字符,如果发生这种情况,则URL字符串如下所示:

search_string=%41F%2F%424+%41F%41E%414%416%410%420%41A%410+%418%417+%421%412%418%41D
Run Code Online (Sandbox Code Playgroud)

如何将此解码回到我发布到的页面上的原始字符串?

perl utf-8 character-encoding utf8-decode

5
推荐指数
2
解决办法
2762
查看次数

从字节流中读取utf-8字符

给定一个字节流(生成器,文件等),我如何读取单个utf-8编码字符?

  • 此操作必须使用流中该字符的字节.
  • 此操作不得使用超过第一个字符的流的任何字节.
  • 此操作应在任何Unicode字符上成功.

我可以通过滚动我自己的utf-8解码功能来解决这个问题,但我宁愿不重新发明轮子,因为我确信这个功能必须已经在其他地方用来解析utf-8字符串.

utf-8 utf8-decode python-3.x

5
推荐指数
1
解决办法
372
查看次数