我是否可以仅使用R中的dplyr语法运行SQL更新语句

Rom*_*ain 10 r rstudio rpostgresql dplyr r-dbi

我需要在某些PostgreSQL数据库表的其他列上更新条件值conditionnaly .我设法在R中编写一个SQL语句并dbExecuteDBI包中执行它.

library(dplyr)
library(DBI)

# Establish connection with database
con <- dbConnect(RPostgreSQL::PostgreSQL(), dbname = "myDb",
                 host="localhost", port= 5432, user="me",password = myPwd)

# Write SQL update statement
request <- paste("UPDATE table_to_update",
                 "SET var_to_change = 'new value' ",
                 "WHERE filter_var = 'filter' ")

# Back-end execution
con %>% dbExecute(request)
Run Code Online (Sandbox Code Playgroud)

是否可以仅使用dplyr语法执行此操作?出于好奇,我试过了

con %>% tbl("table_to_update") %>%
   mutate(var_to_change = if (filter_var == 'filter') 'new value' else var_to_change)
Run Code Online (Sandbox Code Playgroud)

它在R中工作但显然在db中没有任何作用,因为它使用了一个select语句.copy_to只允许appendoverwite选项,所以我看不到如何使用它,除非删除然后附加过滤后的观察...

krl*_*mlr 5

当前的 dplyr 0.7.1(带有 dbplyr 1.1.0)不支持这一点,因为它假定所有数据源都是不可变的。发行UPDATE通孔dbExecute()似乎是最好的选择。

要替换表中较大的块,您还可以:

  1. 通过 将数据框写入数据库中的临时表copy_to()
  2. 开始交易。
  3. 发出一个 DELETE FROM ... WHERE id IN (SELECT id FROM <temporary table>)
  4. 发出 INSERT INTO ... SELECT * FROM <temporary table>
  5. 提交交易

根据您的架构,您可能可以执行单个INSERT INTO ... ON CONFLICT DO UPDATE而不是DELETE然后INSERT

  • 使用“REPLACE INTO”代替“INSERT INTO”怎么样?这样,我们可以忽略从表中删除相关行的第三步。 (2认同)