我想使用fread函数加载所有数据集,因为我认为最好使用一种类型的导入函数,因此我坚持使用fread。
我的文件很少是xlsx格式的,因此我将它们保存为csv格式,然后使用fread函数尝试加载数据集。
但是我注意到,当我将xlsx文件转换为csv时,新创建的csv文件中正在创建一个空的或不完整的行。
有什么办法可以解决这个问题?我可以使用fread函数以某种方式加载xlsx文件,而不是将其转换为csv文件,然后使用fread函数加载吗?
我有一个泰坦尼克号 xlsx 文件,其中有很多空白或空单元格,我将文件保存为 csv,所有空白均按原样保存。
当我导入 csv 文件时,我在数据集中看到很多空字符串/空白,其中一列是Boat
我可以直接使用 readxl 包的函数,例如 read_xls 或 read_xlsx,它将用 NA 替换空字符串
但我想知道是否有办法在加载到数据帧中的 R 后替换空字符串。
我尝试了这种方法,但它抛出了错误,我不太明白。我可以在下面的代码中在“NA”中指定 NA,然后它将替换为 NA,但这将是字符串(NA)而不缺少值 NA,两者都会不同。
titanic %>% mutate(boat = if_else(boat=="", NA ,boat))
Error in mutate_impl(.data, dots) :
Evaluation error: `false` must be type logical, not character.
Run Code Online (Sandbox Code Playgroud) 我有以下示例数据:
1. animated_brand_300x250
2. animated_brand_300x600
3. customaffin_greenliving_solarhome_anim_outage_offer
Run Code Online (Sandbox Code Playgroud)
如何从 Microsoft Excel 中的最后一个下划线中提取字符串?
我想在第一个下划线之前和最后一个下划线之后提取值。
第一个下划线:
=LEFT(B6,SEARCH(“_”,B6)-1)
Run Code Online (Sandbox Code Playgroud)
将返回animated并customaffin作为输出。
如何返回最后一个下划线后的字符串?