以下是脚本
> library(sqldf)
> turnover = read.csv("turnover.csv")
> names(turnover)
[1] "Report.Date" "PersID" "Status" "DOB"
[5] "Age" "Tenure" "Current.Hire.Date" "Term.Date"
[9] "Gender" "Function" "Grade" "Job.Category"
[13] "City" "State" "Retiree" "Race"
> turnover_hiredate = sqldf("select Status, Current.Hire.Date from turnover")
Run Code Online (Sandbox Code Playgroud)
我收到错误消息:没有这样的列:Current.Hire.Date.但是这个变量被列为第7个变量.
我做错了什么?
mpa*_*nco 10
无需更改列名称.
从RSQLite 1.0.0开始,列名称中的sqldf 0.4-9点不再转换为下划线.https://code.google.com/p/sqldf/
我们只需要在单引号之间编写SQL语句,并且列名称可以互换地包括双引号或反引号/反引号之间的点.
两个例子:
require(sqldf)
# 1
turnover <- data.frame(Status = c("A", "B", "C"),
Current.Hire.Date = c("4/10/10", "13/11/10", "1/7/13"))
sqldf('select Status, "Current.Hire.Date" from turnover')
#2. Double quotes and backticks interchangeably
sqldf('select Species, avg("Sepal.Length") `Sepal.Length`,
avg("Sepal.Width") `Sepal.Width` from iris group by Species')
Run Code Online (Sandbox Code Playgroud)
实现解决方案的另一种方法
#3 Using square brackets
sqldf('select Species, avg([Sepal.Length]) `Sepal.Length`,
avg([Sepal.Width]) `Sepal.Width` from iris group by Species')
Run Code Online (Sandbox Code Playgroud)
sqldf(...)不喜欢.列名中的(句点),因此您需要将其更改为其他名称.试试这个:
library(sqldf)
turnover = read.csv("turnover.csv")
colnames(turnover) <- gsub("\\.","_",colnames(turnover))
turnover_hiredate = sqldf("select Status, Current_Hire_Date from turnover")
Run Code Online (Sandbox Code Playgroud)
原因是在SQL中使用句点来表示表列,例如turnover.Status.