小编Rol*_*eim的帖子

ggplot轴标签中的utf-8

在非标准字符集[俄语]中,我很难让ggplot正确显示轴标签.当使用这样的字符串时,ggplot标记轴,例如

\ U + 0441 U + 043D U + 0433

当我将名称保存为单独的变量并将其作为标签使用时,Ggplot会正确编码 geom_text()

转换数据帧的格式也没有多大帮助: db$variable=sapply(db$variable,function(row) iconv(row,to='UTF-8'))导致加扰字符,可能是因为数据已在数据帧中编码为UTF-8

我可以通过使用自定义轴来完成这项工作,scale_x_discrete( labels=names)但这有点笨拙,特别是当数据缺少值时.有没有办法让ggplot首先正确显示这些字符?

编辑

看起来有点头疼

Sys.setlocale("LC_CTYPE","russian")
Run Code Online (Sandbox Code Playgroud)

将解决问题.我仍然不明白为什么R/ggplot在什么情况下会接受UTF8代码是不一致的.在上面的示例中,问题仅限于轴标签.这是因为对于轴标签而言,字符串是从数据表中提取的,如果相同的行存储在字符串或矩阵中,它会以某种方式处理不同的编码?

r ggplot2

20
推荐指数
1
解决办法
3096
查看次数

awk从列表中选择输入文件

基本的Awk问题,但我似乎无法在任何地方找到答案:

我有一个50000 txt文件的文件夹,我想从中运行一个子集上的AWK搜索.我已将我想要限制搜索的文件名保存在单独的文档中.这将极大地加速搜索,目前看起来像这样:

awk -F "searchTerm" '{print NF-1}' data/output/*>> output.txt
Run Code Online (Sandbox Code Playgroud)

非常感谢

awk

5
推荐指数
1
解决办法
3343
查看次数

标签 统计

awk ×1

ggplot2 ×1

r ×1