标签: iconv

使用Ruby将UTF8转换为ANSI

我有一个Ruby脚本,可以在Linux机器上远程生成UTF8 CSV文件,然后通过SFTP将文件传输到Windows机器.

然后我需要用Excel打开这个文件,但Excel没有得到UTF8,所以我总是需要在文本编辑器中打开文件,该编辑器能够将UTF8转换为ANSI.

我很乐意使用Ruby以编程方式执行此操作并避免手动转换步骤.最简单的方法是什么?

PS:我尝试过使用iconv但没有成功.

ruby ansi utf-8 iconv

14
推荐指数
4
解决办法
2万
查看次数

在java中是否有一个与// TRANSLIT等效的iconv?

有没有办法在java中的字符集之间实现字符的音译?类似于unix命令(或类似的php函数)的东西:

iconv -f UTF-8 -t ASCII//TRANSLIT < some_doc.txt  > new_doc.txt
Run Code Online (Sandbox Code Playgroud)

最好是在字符串上操作,与文件没有任何关系

我知道您可以使用String构造函数更改编码,但这不能处理不在生成的字符集中的字符的音译.

java iconv

14
推荐指数
3
解决办法
7942
查看次数

强制设置编码从未知到UTF-8或R中的任何编码?

我正在从旧的专有数据库中读取数据.不幸的是,我最终(仅限一些字符串)Encoding(mychar_vector)返回"unknown".不幸的是我在封闭源c hli(宿主语言界面)周围使用了一个包装器,所以我可能做的不多 - 如果是这样的话我很高兴在这里被证明是错的......

但是,查看字符串向量除了一些替换,我必须使用字符串看看(请参阅我的相关问题)gsub看起来不错.我很想重新控制编码.有没有办法强制将编码设置为UTF-8?我试过了

Encoding(mychar_vector) <- "UTF-8"
# or
mychar_vector <- enc2utf8(mychar_vector)
Run Code Online (Sandbox Code Playgroud)

但这一切都没有成功."unknown"检查后立即得到回报.也进行了调查,iconv但显然没有办法从"未知"转换为UTF-8,因为没有映射.

有没有办法告诉R,只涉及UTF-8字符,因此编码可以设置为UTF-8.请注意,向量的某些元素已经是UTF-8.

encoding r iconv

13
推荐指数
2
解决办法
2396
查看次数

调用未定义的函数Symfony\Polyfill\Mbstring\iconv_strlen()

我的项目在localhost上工作正常,但没有在线工作,这是错误:

Fatal error: Call to undefined function Symfony\Polyfill\Mbstring\iconv_strlen() in /home/stram/public_html/vendor/symfony/polyfill-mbstring/Mbstring.php on line 338
Run Code Online (Sandbox Code Playgroud)

我用谷歌搜索它,我发现我需要安装PHP扩展iconv.我正在使用VPS的问题,当我进入可用的PHP扩展列表时,我没有找到这个扩展!

在此输入图像描述
在此输入图像描述
在此输入图像描述

Thnx提前.

php vps iconv symfony

13
推荐指数
3
解决办法
2万
查看次数

12
推荐指数
1
解决办法
3555
查看次数

在Ruby 1.9.X中等效的Iconv.conv("UTF-8 // IGNORE",...)?

我正在从远程源读取数据,偶尔会在另一个编码中获取一些字符.它们并不重要.

我想获得一个"最佳猜测"utf-8字符串,并忽略无效数据.

主要目标是获取我可以使用的字符串,而不是遇到如下错误:

  • 编码:: UndefinedConversionError:"\ xFF"从ASCII-8BIT到UTF-8:
  • utf-8中的字节序列无效

ruby encoding utf-8 iconv

12
推荐指数
1
解决办法
9241
查看次数

哪些因素会影响成功的iconv()TRANSLIT转换?

我试图确定哪些环境因素或其他因素对iconv()使用该TRANSLIT选项的调用结果有影响.

在通过Apache和CLI运行时,以下代码在本地对我有不同的结果.

<?php
    setlocale(LC_ALL, 'en_GB.UTF-8');
    header('Content-type: text/html; charset=utf-8'); // for web     

    $utf8_string = "Pádraig's naïve café";

    echo iconv('UTF-8', 'ASCII//IGNORE//TRANSLIT', $utf8_string);
?>
Run Code Online (Sandbox Code Playgroud)

预期结果: Padraig's naive cafe

Web浏览器中的结果: (empty string)

CLI的结果: P'adraig's na"ive cafe

在某些系统上,我确实得到了预期的结果,但我无法确定原因.

哪些因素会影响转换,我应该采取哪些步骤来增加获得良好结果的机会?

php iconv

11
推荐指数
1
解决办法
2840
查看次数

iconv:从CP1252转换为UTF-8

我正在尝试将CP1252编码的字符串Çàïèñêèýêñïåäèòîðà转换为UTF-8.我试过这个命令:

iconv -c -f=WINDOWS-1252 -t=UTF-8 test.txt
Run Code Online (Sandbox Code Playgroud)

没有运气,得到一些奇怪的结果:

ÊÀÃÃÃÃÃÃÃÃÃÃÃ,,​​,,

我尝试在这里输入相同的字符串(Çàïèñêèýêñïåäèòîðà),他们可以毫无问题地转换它:http: //www.artlebedev.ru/tools/decoder/

出了什么问题?

iconv

11
推荐指数
4
解决办法
2万
查看次数

将\ u转义的Unicode字符串转换为ASCII

阅读所有关于后iconvEncoding,我仍然感到困惑.

我正在抓取网页的来源我有一个如下所示的字符串:( 'pretty\u003D\u003Ebig'在R控制台中显示'pretty\\\u003D\\\u003Ebig').我想将其转换为ASCII字符串,应该是'pretty=>big'.

更简单,如果我设置

x <- 'pretty\\u003D\\u003Ebig'
Run Code Online (Sandbox Code Playgroud)

如何进行转换x以获得收益pretty=>big

有什么建议?

unicode text-processing r unicode-string iconv

11
推荐指数
2
解决办法
1万
查看次数

在shell中将ANSI转换为UTF-8

我正在制作解析器(1 csv到3 csv)脚本,我遇到了问题.我是法国人所以用我的语言我有这样的信件:é è à ....

一位客户给我发了一个csv文件,Linux认为它是"unknown-8bit"(我想是ansi).

在我的脚本中,我正在编写3个新的csv文件.但是ViM将它们创建为ISO latin1,因为它与条目中的内容很接近,但是我é,è,à...已经破了.我需要UTF-8.

所以我尝试将第一个ANSI csv转换为UTF-8:

iconv -f "windows-1252" -t "UTF-8" import.csv -o import.csv
Run Code Online (Sandbox Code Playgroud)

问题是它破坏了我的CSV.它现在只有一排.但我的特殊角色还可以.有没有办法将ANSI转换为UTF-8并保留我的行?

csv bash shell utf-8 iconv

11
推荐指数
1
解决办法
5万
查看次数

标签 统计

iconv ×10

php ×3

utf-8 ×3

encoding ×2

r ×2

ruby ×2

ansi ×1

bash ×1

character-encoding ×1

csv ×1

java ×1

mamp ×1

shell ×1

symfony ×1

text-processing ×1

unicode ×1

unicode-string ×1

vps ×1