小编jfe*_*aum的帖子

如何在 dbplyr 中使用自定义 SQL 函数?

我想计算数据库中的 Jaro-Winkler 字符串距离。如果我将数据带入 R(使用collect),我可以轻松使用包stringdist中的函数stringdist

但我的数据非常大,我想在将数据拉入 R之前先过滤 Jaro-Winkler 距离。

有 Jaro-Winkler 的 SQL 代码(https://androidaddicted.wordpress.com/2010/06/01/jaro-winkler-sql-code/和T-SQL的版本),但我想我不知道如何最好让 SQL 代码与dbplyr. 我很高兴尝试将该stringdist函数映射到 Jaro-Winklersql代码,但我不知道从哪里开始。但即使是更简单的事情,比如直接从 R 对远程数据执行 SQL 代码也会很棒。

我曾希望文档中的SQL 翻译dbplyr可能有所帮助,但我不这么认为。

r stringdist dbplyr

6
推荐指数
1
解决办法
2369
查看次数

从交互式地图中抓取数据

我想抓取这张地图下面的选民登记数据:

http://www.bostonglobe.com/metro/2012/08/28/registration-figures-show-massachusetts-voters-continue-abandon-two-major-political-parties/p0zW7Snj9R07DK913P36kM/igraphic.html?p1=Article_Graphicle

当您将鼠标悬停在每个城镇上时,下面框中的总数和按党派数字都会发生变化。我想按党记录每个城镇的名称和注册人数。关于如何做到这一点的任何建议都会非常有帮助。我过去做过一些抓取,但没有像这样的任何交互式内容,而且我对各种 python 包的最初几次尝试都没有奏效。

(不幸的是,底部的来源链接没有用,因为它只是链接到国务卿的主页,原始数据报告不再可用)

python svg web-scraping

5
推荐指数
1
解决办法
6054
查看次数

删除esttab中的多余列标题(Stata)

我正在estout准备LaTeX的回归表。似乎在存储非线性模型时,输出中有额外的一行我似乎无法关闭或删除。作为MWE,请考虑:

sysuse auto, clear
eststo clear 
eststo: poisson mpg rep78 
esttab, tex nomti nodepvars
Run Code Online (Sandbox Code Playgroud)

这将在模型编号之后,最左边的列中带有“ mpg”(因变量)的系数之前,在一行中产生输出,而在其他列中为空白。这不是模型标题,并且nomtinodepvars选项不会将其删除。

奇怪的是,当回归为OLS时,此行不会显示。但是,以下行的确在带有OLS和Poisson的以下示例中出现,现在包含“ main”:

sysuse auto, clear
eststo clear
eststo: reg mpg rep78
eststo: poisson mpg rep78
esttab, tex nomti nodepvars
Run Code Online (Sandbox Code Playgroud)

我经历过的选项esttabestout我无法找到任何似乎关闭该行(我甚至不能确定它可能会起到什么样的目的)。任何想法如何摆脱这一行?

stata

2
推荐指数
1
解决办法
1902
查看次数

标签 统计

dbplyr ×1

python ×1

r ×1

stata ×1

stringdist ×1

svg ×1

web-scraping ×1