相关疑难解决方法(0)

如何替换java字符串中的unicode字符

我的项目中有一个问题是用Java字符串中的另一个unicode字符替换unicode字符.在搜索并尝试不同的代码后,我没有得到解决方案,我想用波斯语替换波斯语中的另一个角色,使用不同的unicode号码.我非常感谢任何帮助.

谢谢

java

use*_*814

lucky-day

7
推荐指数

1
解决办法

1万
查看次数

从Windows和Linux读取文件会产生不同的结果(字符编码？)

目前我正在尝试以mime格式读取文件,其中包含一些png的二进制字符串数据.

在Windows中,读取文件为我提供了正确的二进制字符串,这意味着我只需复制字符串并将扩展名更改为png即可看到图片.

在Windows中读取文件后的示例如下:

    --fh-mms-multipart-next-part-1308191573195-0-53229
     Content-Type: image/png;name=app_icon.png
     Content-ID: "<app_icon>"
     content-location: app_icon.png

    ‰PNG

Run Code Online (Sandbox Code Playgroud)

等...等...

在Linux中读取文件后的示例如下:

    --fh-mms-multipart-next-part-1308191573195-0-53229
     Content-Type: image/png;name=app_icon.png
     Content-ID: "<app_icon>"
     content-location: app_icon.png

     ï¿½PNG

Run Code Online (Sandbox Code Playgroud)

等...等...

我无法将Linux版本转换成图片,因为它变成了一些时髦的符号,并且有很多颠倒的"？" 和"1/2"符号.

任何人都可以告诉我发生了什么,也许可以提供解决方案？已经玩了一周以上的代码了.

java linux windows png character-encoding

Mau*_*ice

2011 06-16

6
推荐指数

2
解决办法

1万
查看次数

用空格替换Unicode字符"ï¿½"

我正在从.csv文件中大量上传信息,我需要将此字符替换为ascii"ï¿½"以获取正常空间"".

对于C/C++/JAVA,字符"ï¿½"对应于"\ uFFFD",它似乎称为REPLACEMENT CHARACTER.其他如C#官方文档中的空格类型如U + FEFF,205F,200B,180E,202F.

我正在尝试以这种方式替换

public string Errors="";

public void test(){

    string textFromCsvCell= "";
    string validCharacters="^[0-9A-Za-z().:%-/ ]+$";
    textFromCsvCell="This is my text from csv file"; //ALl spaces aren't normal space " "
    string cleaned = textFromCsvCell.Replace("\uFFFD", "\"")     
      if (Regex.IsMatch(cleaned, validCharacters ))
        //All code for insert
      else
         Errors=cleaned;
         //print Errors
}

Run Code Online (Sandbox Code Playgroud)

测试方法给我看这个文字:

"这是来自csv文件的myï¿½texto"

我尝试了一些解决方案

尝试解决方案1:使用修剪

 Regex.Replace(value.Trim(), @"[^\S\r\n]+", " ");

Run Code Online (Sandbox Code Playgroud)

尝试解决方案2:使用替换

  System.Text.RegularExpressions.Regex.Replace(str,@"\s+"," ");

Run Code Online (Sandbox Code Playgroud)

尝试解决方案3:使用修剪

  String.Trim(new char[]{'\uFEFF','\u200B'});

Run Code Online (Sandbox Code Playgroud)

尝试解决方案4:将[\ S\r \n]添加到validCharacters

  string validCharacters="^[\S\r\n0-9A-Za-z().:%-/ ]+$";

Run Code Online (Sandbox Code Playgroud)

什么都行不通

有人有想法吗？我怎样才能更换它？我非常感谢你的帮助,谢谢

资料来源:

http://www.fileformat.info/info/unicode/char/0fffd/index.htm

尝试用一个空格替换所有空白区域

从C#中的字符串剥离字节顺序标记

C#Regex - 删除额外的空格但保留新行 …

c# regex validation trim

Die*_*mos

2017 05-23

6
推荐指数

1
解决办法

5945
查看次数

如何从PHP字符串中删除“ï¿½”？

可能重复：
如何在字符串中替换ï¿½

我正在从来自数据库的XML表中读取数据。在原始输出中，我遇到了这个字符“ï¿½”，它是UTF-8字符串，表示“？”。搜索“？”时，使用str_replace进行简单的搜索并删除并不能解决问题。或“ï¿½”。还有其他方法可以从字符串中删除此字符吗？

更新：

作为参考，该函数正在为我清理字符串。

    function db_utf8_convert($str)
{
    $convmap = array(0x80, 0x10ffff, 0, 0xffffff);
    return preg_replace('/\x{EF}\x{BF}\x{BD}/u', '', mb_encode_numericentity($str, $convmap, "UTF-8"));
}

Run Code Online (Sandbox Code Playgroud)

php string byte-order-mark utf-8

lab*_*ago

2017 05-23

5
推荐指数

1
解决办法

2万
查看次数