我希望能够在R中逐行扫描csv文件,并排除包含单词"target"的行.
问题是数据来自不同的地方,而"目标"这个词可能出现在数据框的许多不同的列中.
所以我需要一个函数中的一行来查找这个字符串,如果它不存在,那么将该行附加到一个新的数据框(然后我将写为新的csv).
任何和所有帮助感激地收到了.
Andrie的评论可能就是大多数用户会这样做的方式,但是如果你想在阅读阶段做到这一点,你可以试试这个:
在csv中读取并使用readLines任何具有文本目标空白的行:
temp = gsub(".*target.*", "", readLines("test.csv"))
Run Code Online (Sandbox Code Playgroud)使用read.table转换temp到data.frame.由于有文本的所有行的目标现在是空的,默认情况下,blank.lines.skip=TRUE在read.table应该正确地在你的数据作为其余阅读data.frame.
read.table(text=temp, sep=",", header=TRUE)
Run Code Online (Sandbox Code Playgroud)