fai*_*nty 3 r abbreviation dataframe
我正在使用一个名称非常长且超过 25 个字符的数据框。我试图用所有这些组织的名称制作一个条形图(用绘图),但名称被切断,因为它们太长了。我已经尝试过如下的边缘:
plot_ly(x = number, y = org_name, type = 'bar') %>%
layout(margin = list(l = 150))
Run Code Online (Sandbox Code Playgroud)
它可以工作,但条形图看起来不太好,所以我尝试做的替代方案是缩写任何长度超过 25 个字符的组织名称。然而,我很难做到这一点。我尝试缩写它的一种方法是创建一个名为 abbrv 的新列,使用 substring 获取组织名称的前 25 个字符,然后执行“...”,然后将其放入该列中。对于不大于 25 的组织名称,我只需在 abbrv 列中添加 NA,如下所示:
for(i in dataframe.name$org_name){
if(nchar(i) > 25){
dataframe.name$abbrv <- paste0(substring(i, 0, 25), "...")
}
else{
dataframe.name$abbrv <- "NA"
}
Run Code Online (Sandbox Code Playgroud)
这种方式唯一的问题是现在我有了 abbrv 列(如果它有效),如果组织名称大于 25 个字符,我将如何确保以绘图方式显示 abbrv 列,如果不大于 25 个字符,则显示正常组织名称。
无论如何,我对此已经谈得够多了,但这是我尝试做的一种方法,但它不太有效,因为 abbrv 列为该列中的所有行都设置了“NA”,无论组织的名称有多长。我尝试做的另一种方法是使用替换功能,例如:
for(i in dataframe.name$org_name){
if(nchar(i) > 25){
dataframe.name[i].replace(
to_replace=i,
value= abbreviate(i)
)
}
Run Code Online (Sandbox Code Playgroud)
但我也遇到了该错误。此时,我什至不知道该怎么做以及如何缩写数据框中的长名称?我真的很迷失和困惑,不知道该怎么做以及如何准确地缩写长名字。如果有人能帮助我,那就太好了!谢谢。
*******编辑*******
所以现在我正在使用这段代码:
for(i in 1:nrow(dfname)){
if(nchar(dfname$orgname[i]) > 25){
dfname$abbrv.column <- substring(dfname$orgname[i], 0, 25)
}
else{
dfname$abbrv.column <- dfname$orgname
}
}
Run Code Online (Sandbox Code Playgroud)
但这不太有效,因为所有条目都是相同的组织名称
dataframe.name$abbr是数据框中所有缩写的向量,而不仅仅是单个名称。
dataframe.name$abbr这就是所有条目都被设置为NA;的原因。数据框中的姓氏不超过 25 个字符,因此 中的所有条目都dataframe.name$abbr被分配NA。
@brettljausn 有一个不错的建议:完全去掉NAs,只在字符数超过 25 的地方截断。
像这样的事情应该是一种享受:
dataframe.name$abbrv <- substring( dataframe.name$org_name, 0, 25 )
Run Code Online (Sandbox Code Playgroud)
abbreviate我会尝试先使用:
dataframe.name$abbrv <- abbreviate( dataframe.name$org_name )
Run Code Online (Sandbox Code Playgroud)