我有一个带有许多缺失值的.csv数据集,并且当我读取表格时,我希望R以同样的方式("正确"方式)识别它们.我一直在使用:
import = read.csv("/Users/dataset.csv",
header =T, na.strings=c(""))
Run Code Online (Sandbox Code Playgroud)
这个脚本用一些东西填充所有空单元格,但它不是一致的.当我查看数据时head(import)
,会填充<NA>
一些丢失的单元格,并填充一些丢失的单元格NA
.我担心R在开始分析数据集时会采用不同的方式来识别缺失值,因此我希望将导入统一读入这些缺失值.
最后,我的csv文件中的一些缺失值仅用句点表示.我还想在导入到R时用正确的缺失值表示法表示这些句点.
jor*_*ran 18
该<NA>
VS NA
只是意味着你的一些列的是性格和一些数字,这就是全部.绝对没有错.
正如上面提到的那样,如果csv中的某些缺失值由单个句点表示.
,那么您可以指定一个值的向量,该值应该被视为NA
s via:
na.strings=c("",".","NA")
Run Code Online (Sandbox Code Playgroud)
作为一个论据read.csv
.