小编All*_*len的帖子

使用'rvest'来提取链接

我试图从Yelp中删除数据.一步是从每个餐馆提取链接.例如,我搜索纽约的餐馆并获得一些结果.然后我想提取Yelp在第1页上推荐的所有10家餐厅的链接.这是我尝试过的:

library(rvest)     
page=read_html("http://www.yelp.com/search?find_loc=New+York,+NY,+USA")
page %>% html_nodes(".biz-name span") %>% html_attr('href')

Run Code Online (Sandbox Code Playgroud)

但代码总是返回'NA'.任何人都可以帮助我吗？谢谢!

r web-scraping yelp rvest

All*_*len

lucky-day

11
推荐指数

2
解决办法

1万
查看次数

Python Web抓取问题

我正在使用Python从雅虎财务中攫取AAPL的股票价格.但该计划总是回归[].如果有人能指出该计划无效的原因,我将不胜感激.这是我的代码:

import urllib
import re
htmlfile=urllib.urlopen("https://ca.finance.yahoo.com/q?s=AAPL&ql=0")
htmltext=htmlfile.read()
regex='<span id=\"yfs_l84_aapl\" class="">(.+?)</span>'
pattern=re.compile(regex)
price=re.findall(pattern,htmltext)
print price

Run Code Online (Sandbox Code Playgroud)

原始来源是这样的:

<span id="yfs_l84_aapl" class>112.31</span>

Run Code Online (Sandbox Code Playgroud)

在这里,我只想要价格112.31.我复制并粘贴代码并找到'class'更改为'class =""'.我也试过代码

regex='<span id=\"yfs_l84_aapl\" class="">(.+?)</span>'

Run Code Online (Sandbox Code Playgroud)

但它也不起作用.

python

All*_*len

2015 09-09

9
推荐指数

1
解决办法

464
查看次数

Python根据另一个数组中的索引创建一个数组

我有一个像这样的数组：

X= [[1,2,3],
    [3,2,1],
    [2,1,3]]

Run Code Online (Sandbox Code Playgroud)

现在我想创建另一个数组 Y。在 X 中的元素等于 2 的位置，Y 中的元素应取值 1，否则它们应取值 0。在此示例中，Y 应等于

Y=[[0,1,0],
   [0,1,0],
   [1,0,0]]

Run Code Online (Sandbox Code Playgroud)

python arrays

All*_*len

2018 12-11

1
推荐指数

1
解决办法

4022
查看次数

标签统计

python ×2

arrays ×1

r ×1

rvest ×1

web-scraping ×1

yelp ×1

使用'rvest'来提取链接

Python Web抓取问题

Python根据另一个数组中的索引创建一个数组

标签 统计

小编All_len的帖子

标签统计