我有一个 R 脚本,它接受一些用户输入,并从网页等中抓取一些数据。然后它执行一些小的操作并将文本插入到 MS SQL Server 上的表中。文本块最多 10,000 个字符,可能更多(使用 VARCHAR(MAX) 列)。
如果我使用 MySQL 或其他东西,我会使用 Hadley 的新软件包来清理输入,但我只能使用 Microsoft。所以我用来 gsub
拉出单引号和撇号,但它非常慢。是否有一个包可以快速完成此操作,并且是否有更好的做法从 SQL 输入中删除所有顽皮的字符/字符串,以便我可以避免Little Bobby Tables问题?我在其他语言中找到了一些公式,但在 R 中没有一个是干净且快速的。