使用python(和一般授权)通过API访问LinkedIn数据

Jab*_*ber 1 python linkedin oauth-2.0 python-3.x linkedin-api

我正在尝试通过API访问LinkedIn数据(我没有应用程序,我只想访问公司数据-或查看可以访问的内容)。关于此主题,这里还有其他问题,但是大多数问题已过时(使用LinkedIn当前授权流程之前的packagaes)。

我遵循了有关授权的LinkedIn文档:https : //developer.linkedin.com/docs/oauth2

我创建了一个应用程序(因为我没有网站,所以使用了无用的网站网址)。这给了我一个客户ID和客户机密。

我使用了来自LinkedIn(https://github.com/linkedin/api-get-started/blob/master/python/tutorial.py)的(过时的)东西:

import oauth2 as oauth
import urllib.parse as urlparse

consumer_key    =   'my client id e.g. sjd6ffdf6262d'
consumer_secret =   'my customer secret e.g. d77373hhfh'

request_token_url = 'https://api.linkedin.com/uas/oauth/requestToken'
access_token_url =  'https://api.linkedin.com/uas/oauth/accessToken'
authorize_url =     'https://api.linkedin.com/uas/oauth/authorize'

consumer = oauth.Consumer(consumer_key, consumer_secret)
client = oauth.Client(consumer)

resp,content = client.request(request_token_url, "POST")

request_token = dict(urlparse.parse_qsl(content))

clean_request_token = {}
for key in request_token.keys():
    clean_request_token[key.decode('ascii')] = request_token[key].decode('ascii')
request_token = clean_request_token

print ("Go to the following link in your browser:")
print ("%s?oauth_token=%s" % (authorize_url, request_token['oauth_token']
Run Code Online (Sandbox Code Playgroud)

该链接将我带到我“授予许可”的网站,然后显示了个人识别码。使用此引脚(此处称为oauth_verifier):

oauth_verifier = 12345
token = oauth.Token(request_token['oauth_token'],
request_token['oauth_token_secret'])
token.set_verifier(oauth_verifier)
client = oauth.Client(consumer, token)
content = client.request(access_token_url,"POST")

access_token = dict(urlparse.parse_qsl(content[1]))

clean_access_token = {}
for key in access_token.keys():
    clean_access_token[key.decode('ascii')] = access_token[key].decode('ascii')
access_token = clean_request_token

token = oauth.Token(key=access_token['oauth_token'],secret=access_token['oauth_token_secret'])

client = oauth.Client(consumer, token)

response = client.request("http://api.linkedin.com/v1/companies/barclays")
Run Code Online (Sandbox Code Playgroud)

由于“ OAuth请求中使用的令牌已被撤消”,因此该响应具有401代码。

潜在的问题是:

  • 我真的不了解API如何工作,如何与python一起工作,授权如何工作或如何知道我需要的api网址。

在相关情况下,我具有网络抓取(使用请求和漂亮的汤进行解析)的经验,但是没有使用API​​的经验。

Jab*_*ber 5

我最终解决了这个问题,以防万一有人来此发布。在花时间之前,我还发现免费提供的API现在仅允许您访问自己的个人资料或公司页面。因此,您可以编写一个允许用户发布到自己页面的应用程序,但不能编写任何东西来获取数据。看这里:

LinkedIn API无法查看_any_公司资料

无论如何,要使有限的API正常工作,您需要:

  • 创建一个LinkedIn帐户,创建一个应用程序并将重定向URL添加到您的应用程序页面(我使用http:// localhost:8000)。该文档说明了如何设置应用程序:https : //developer.linkedin.com/docs/oauth2
  • 按照上述链接中的步骤进行操作,但是在python中,您请求获取“访问代码”。

    html = requests.get("https://www.linkedin.com/oauth/v2/authorization", params = {'response_type':'code','client_id':client_id, 'redirect_uri':'http://localhost:8000', 'state':'somestring'})

  • 打印html.url以获得巨大的链接-单击它。系统将要求您登录并允许访问,然后将您重定向到您的重定向URL。那里什么也没有,但是url末尾会有一个很长的“访问代码”。拿出并发送到Post请求的LinkedIn上:

    token = requests.post('https://www.linkedin.com/oauth/v2/accessToken', data = {'grant_type':'authorization_code','code':access_code, 'redirect_uri':'http://localhost:8000', 'client_id':client_id,'client_secret':client_secret})

  • token.content将包含一个“ access_token”。这是访问API所需要的。例如,访问您自己的个人资料:

    headers = {'x-li-format': 'json', 'Content-Type': 'application/json'} params = {'oauth2_access_token': access_token}

    html = requests.get("https://api.linkedin.com/v1/people/~",headers=headers,params = params)

希望这对从头开始的人很有用,信息大部分都在那儿,但是有许多假定的步骤(例如如何在请求中使用访问令牌)。