R包查找错误输入的数据

scr*_*Owl 2 statistics r data-mining outliers

我正在处理一个在数据中有一些明显错误的数据集(即,1岁以下且信用卡余额为50,000美元的孩子).我不能一行一行地设置为> 100k行.有没有正式的工作如何在数据集中搜索这些类型的明显问题,甚至更好的R中的任何包?或者我应该开始做直方图?

Spa*_*man 5

今年的UseR2011会议上有一个会议.我记得很清楚,因为我主持了:)

http://www.warwick.ac.uk/statsdept/user-2011/schedule/thursday.html

'deducorrect'和'editrules'包可能对你有帮助,而那个会话中的其他一些讨论也可能有一些指示.

数据管理,MS.01,主席:Barry Rowlingson

Susan Ranney这是一个男孩!用R [幻灯片]分析数百万的出生记录

Joanne Demmler使用常规收集的健康数据的大型数据库的挑战:结合SQL和R [幻灯片]

约翰布莱恩特人口统计学:人口数据的类和方法

Mark van der Loo使用deducorrect和editrules包修正违反线性限制的数据