从CSV文件中读取的数据帧中删除级别 - R.

nam*_*ked 5 string r dataframe

我试图加载从棒球统计链接.当我从文件中读取它时使用

data <- read.csv("MLB2011.csv")
Run Code Online (Sandbox Code Playgroud)

它似乎是将所有字段作为因子值读取.我尝试通过以下方式删除这些因子值:

read.csv("MLB2011.xls", as.is= FALSE)
Run Code Online (Sandbox Code Playgroud)

..但看起来这些值仍被视为因素.如何将它们作为简单的字符值而不是因素加载?

mne*_*nel 11

您没有阅读csv文件,它是一个Excel电子表格(.xls格式).它包含两个工作表bat2011pitch2011

您可以使用该XLConnect库来阅读此内容

library(XLConnect)
# load the work book (connect to the file)
wb <- loadWorkbook("MLB2011.xls")


# read in the data from the bat2011 sheet
bat2011 <- readWorksheet(wb, sheet = 'bat2011')
Run Code Online (Sandbox Code Playgroud)

readWorksheet有一个参数colType,您可以用它来指定列类型.


编辑

如果您已将工作表保存为csv文件,那么

as.is = TRUEstringsAsFactors = FALSE将是正确的参数值

  • 对不起,这是错误的传达.但在执行read.csv()之前,我已将excel表转换为csv.我匆匆写了这个问题 (2认同)