我有一个Ruby脚本,可以在Linux机器上远程生成UTF8 CSV文件,然后通过SFTP将文件传输到Windows机器.
然后我需要用Excel打开这个文件,但Excel没有得到UTF8,所以我总是需要在文本编辑器中打开文件,该编辑器能够将UTF8转换为ANSI.
我很乐意使用Ruby以编程方式执行此操作并避免手动转换步骤.最简单的方法是什么?
PS:我尝试过使用iconv但没有成功.
有没有办法在java中的字符集之间实现字符的音译?类似于unix命令(或类似的php函数)的东西:
iconv -f UTF-8 -t ASCII//TRANSLIT < some_doc.txt > new_doc.txt
Run Code Online (Sandbox Code Playgroud)
最好是在字符串上操作,与文件没有任何关系
我知道您可以使用String构造函数更改编码,但这不能处理不在生成的字符集中的字符的音译.
我正在从旧的专有数据库中读取数据.不幸的是,我最终(仅限一些字符串)Encoding(mychar_vector)返回"unknown".不幸的是我在封闭源c hli(宿主语言界面)周围使用了一个包装器,所以我可能做的不多 - 如果是这样的话我很高兴在这里被证明是错的......
但是,查看字符串向量除了一些替换,我必须使用字符串看看(请参阅我的相关问题)gsub看起来不错.我很想重新控制编码.有没有办法强制将编码设置为UTF-8?我试过了
Encoding(mychar_vector) <- "UTF-8"
# or
mychar_vector <- enc2utf8(mychar_vector)
Run Code Online (Sandbox Code Playgroud)
但这一切都没有成功."unknown"检查后立即得到回报.也进行了调查,iconv但显然没有办法从"未知"转换为UTF-8,因为没有映射.
有没有办法告诉R,只涉及UTF-8字符,因此编码可以设置为UTF-8.请注意,向量的某些元素已经是UTF-8.
我的项目在localhost上工作正常,但没有在线工作,这是错误:
Fatal error: Call to undefined function Symfony\Polyfill\Mbstring\iconv_strlen() in /home/stram/public_html/vendor/symfony/polyfill-mbstring/Mbstring.php on line 338
Run Code Online (Sandbox Code Playgroud)
我用谷歌搜索它,我发现我需要安装PHP扩展iconv.我正在使用VPS的问题,当我进入可用的PHP扩展列表时,我没有找到这个扩展!



Thnx提前.
运行MAMP时有没有人遇到过iconv_strlen函数的问题?
我正在从远程源读取数据,偶尔会在另一个编码中获取一些字符.它们并不重要.
我想获得一个"最佳猜测"utf-8字符串,并忽略无效数据.
主要目标是获取我可以使用的字符串,而不是遇到如下错误:
我试图确定哪些环境因素或其他因素对iconv()使用该TRANSLIT选项的调用结果有影响.
在通过Apache和CLI运行时,以下代码在本地对我有不同的结果.
<?php
setlocale(LC_ALL, 'en_GB.UTF-8');
header('Content-type: text/html; charset=utf-8'); // for web
$utf8_string = "Pádraig's naïve café";
echo iconv('UTF-8', 'ASCII//IGNORE//TRANSLIT', $utf8_string);
?>
Run Code Online (Sandbox Code Playgroud)
预期结果: Padraig's naive cafe
Web浏览器中的结果: (empty string)
CLI的结果: P'adraig's na"ive cafe
在某些系统上,我确实得到了预期的结果,但我无法确定原因.
哪些因素会影响转换,我应该采取哪些步骤来增加获得良好结果的机会?
我正在尝试将CP1252编码的字符串Çàïèñêèýêñïåäèòîðà转换为UTF-8.我试过这个命令:
iconv -c -f=WINDOWS-1252 -t=UTF-8 test.txt
Run Code Online (Sandbox Code Playgroud)
没有运气,得到一些奇怪的结果:
ÊÀÃÃÃÃÃÃÃÃÃÃÃ,,,,
我尝试在这里输入相同的字符串(Çàïèñêèýêñïåäèòîðà),他们可以毫无问题地转换它:http: //www.artlebedev.ru/tools/decoder/
出了什么问题?
阅读所有关于后iconv和Encoding,我仍然感到困惑.
我正在抓取网页的来源我有一个如下所示的字符串:( 'pretty\u003D\u003Ebig'在R控制台中显示'pretty\\\u003D\\\u003Ebig').我想将其转换为ASCII字符串,应该是'pretty=>big'.
更简单,如果我设置
x <- 'pretty\\u003D\\u003Ebig'
Run Code Online (Sandbox Code Playgroud)
如何进行转换x以获得收益pretty=>big?
有什么建议?
我正在制作解析器(1 csv到3 csv)脚本,我遇到了问题.我是法国人所以用我的语言我有这样的信件:é è à ....
一位客户给我发了一个csv文件,Linux认为它是"unknown-8bit"(我想是ansi).
在我的脚本中,我正在编写3个新的csv文件.但是ViM将它们创建为ISO latin1,因为它与条目中的内容很接近,但是我é,è,à...已经破了.我需要UTF-8.
所以我尝试将第一个ANSI csv转换为UTF-8:
iconv -f "windows-1252" -t "UTF-8" import.csv -o import.csv
Run Code Online (Sandbox Code Playgroud)
问题是它破坏了我的CSV.它现在只有一排.但我的特殊角色还可以.有没有办法将ANSI转换为UTF-8并保留我的行?