在.csv中读取时用NA替换缺失值的最佳方法是什么？

Question

我有一个带有许多缺失值的.csv数据集,并且当我读取表格时,我希望R以同样的方式("正确"方式)识别它们.我一直在使用:

import = read.csv("/Users/dataset.csv", 
                  header =T, na.strings=c(""))

这个脚本用一些东西填充所有空单元格,但它不是一致的.当我查看数据时head(import),会填充<NA>一些丢失的单元格,并填充一些丢失的单元格NA.我担心R在开始分析数据集时会采用不同的方式来识别缺失值,因此我希望将导入统一读入这些缺失值.

最后,我的csv文件中的一些缺失值仅用句点表示.我还想在导入到R时用正确的缺失值表示法表示这些句点.

Answer 1

该<NA>VS NA只是意味着你的一些列的是性格和一些数字,这就是全部.绝对没有错.

正如上面提到的那样,如果csv中的某些缺失值由单个句点表示.,那么您可以指定一个值的向量,该值应该被视为NAs via:

na.strings=c("",".","NA")

作为一个论据read.csv.