aaa*_*aaa 2 java crontab character-encoding jsoup
我有一个用Java编写的网络浏览软件,它通过任何给定的网站,并收集数据.到现在为止还挺好.我使用JSoup API轻松,但这是无关紧要的.我的问题在于编码.
当我在服务器上运行Jar文件时(使用java -jar Crawler.jar),它可以完美地捕获数据 - 包括国际重音,如á,é等,等等.但是......当我通过crontab计划它时,它只会搞砸每个非基本角色!这可能是什么问题?我真的很茫然,答案真的会拯救我的皮肤.
编辑 - 一位朋友建议我使用以下代码检查在Cron上运行的语言环境:
*/1 * * * * locale > /home/user/locale.ouput
Run Code Online (Sandbox Code Playgroud)
我做了,似乎crontab使用的是POSIX语言环境,而不是系统设置,它是UTF-8.我将看看如何将其更改为UTF-8.任何提示将不胜感激!
每次将字节转换为字符或从字符转换字节时,都会显式设置字符 例如,在String构造函数中,String.getBytes(),InputStreamReader构造函数等.
如果这还不够,请尝试在启动Java之前将LANG环境变量设置为crontab中的其他值.例如,你可以使用
LANG=en_US.UTF-8
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1913 次 |
| 最近记录: |