小编ger*_*sht的帖子

使用RVest使用“加载更多”按钮发布抓取页面

我想获取此页面上列出的atm的链接:https : //coinatmradar.com/city/345/bitcoin-atm-birmingham-uk/

我需要对页面底部的“加载更多”按钮做些什么?

我一直在使用选择器工具,可以下载chrome来选择CSS路径。

我写了下面的代码块,它似乎只检索前十个链接。

library(rvest)

base <- "https://coinatmradar.com/city/345/bitcoin-atm-birmingham-uk/"
base_read <- read_html(base)
atm_urls <- html_nodes(base_read, ".place > a")
all_urls_final <- html_attr(atm_urls, "href" )
print(all_urls_final)
Run Code Online (Sandbox Code Playgroud)

我希望能够检索到该区域中列出的atm的所有链接,但是我的R代码尚未这样做。

任何帮助都会很棒。抱歉,这是一个非常简单的问题。

screen-scraping r web-scraping rvest

5
推荐指数
1
解决办法
430
查看次数

将带有字符和数字的数据排序为 R 中的数字

我有一个包含数字和文本的结果数据列表。

示例数据:

df$col_1 
Neg 
Negative 
32 
16 
64 
8 
128 
4 
not done 
Pos 
Missing 
?Pos 
~2 
? 240
Run Code Online (Sandbox Code Playgroud)

我所做的是创建一个新列并尝试重新编码数据。

 df$col <- NA df$col [ which (df$col_1=="Positive" )] <- 1 
 df$col [ which (df$col_1=="2" )] <- 1 
 df$col [ which (df$col_1=="Negative" )] <- 1
Run Code Online (Sandbox Code Playgroud)

不是像上面那样对每个可能的组合进行编码,我想做的是能够创建一个包含负数、正数和 NA 值的列表。

我试过这个

list <- c ("2","4","8","16","32")
df$col [ which (df$col_1=="list" )] <- 1  
Run Code Online (Sandbox Code Playgroud)

但这不起作用。

除非有问号,否则每个数字都应被视为正数。所以我想知道我是否可以将所有数字转换为数字?

对于所有的杂文,除了正面和负面之外,我想放NA。

df$col_1        df$col
Neg             0
Negative        0
32              1 
16              1
64              1
8               1
128             1
4               1 …
Run Code Online (Sandbox Code Playgroud)

r

4
推荐指数
1
解决办法
158
查看次数

标签 统计

r ×2

rvest ×1

screen-scraping ×1

web-scraping ×1