小编All*_*len的帖子

使用'rvest'来提取链接

我试图从Yelp中删除数据.一步是从每个餐馆提取链接.例如,我搜索纽约的餐馆并获得一些结果.然后我想提取Yelp在第1页上推荐的所有10家餐厅的链接.这是我尝试过的:

library(rvest)     
page=read_html("http://www.yelp.com/search?find_loc=New+York,+NY,+USA")
page %>% html_nodes(".biz-name span") %>% html_attr('href')
Run Code Online (Sandbox Code Playgroud)

但代码总是返回'NA'.任何人都可以帮助我吗?谢谢!

r web-scraping yelp rvest

11
推荐指数
2
解决办法
1万
查看次数

Python Web抓取问题

我正在使用Python从雅虎财务中攫取AAPL的股票价格.但该计划总是回归[].如果有人能指出该计划无效的原因,我将不胜感激.这是我的代码:

import urllib
import re
htmlfile=urllib.urlopen("https://ca.finance.yahoo.com/q?s=AAPL&ql=0")
htmltext=htmlfile.read()
regex='<span id=\"yfs_l84_aapl\" class="">(.+?)</span>'
pattern=re.compile(regex)
price=re.findall(pattern,htmltext)
print price
Run Code Online (Sandbox Code Playgroud)

原始来源是这样的:

<span id="yfs_l84_aapl" class>112.31</span>
Run Code Online (Sandbox Code Playgroud)

在这里,我只想要价格112.31.我复制并粘贴代码并找到'class'更改为'class =""'.我也试过代码

regex='<span id=\"yfs_l84_aapl\" class="">(.+?)</span>'
Run Code Online (Sandbox Code Playgroud)

但它也不起作用.

python

9
推荐指数
1
解决办法
464
查看次数

Python根据另一个数组中的索引创建一个数组

我有一个像这样的数组:

X= [[1,2,3],
    [3,2,1],
    [2,1,3]]
Run Code Online (Sandbox Code Playgroud)

现在我想创建另一个数组 Y。在 X 中的元素等于 2 的位置,Y 中的元素应取值 1,否则它们应取值 0。在此示例中,Y 应等于

Y=[[0,1,0],
   [0,1,0],
   [1,0,0]]
Run Code Online (Sandbox Code Playgroud)

python arrays

1
推荐指数
1
解决办法
4022
查看次数

标签 统计

python ×2

arrays ×1

r ×1

rvest ×1

web-scraping ×1

yelp ×1