相关疑难解决方法(0)

证书验证失败：无法获取本地颁发者证书

我正在尝试使用python从网络获取数据。我为此导入了urllib.request包，但是在执行时出现错误：

certificate verify failed: unable to get local issuer certificate (_ssl.c:1045)

Run Code Online (Sandbox Code Playgroud)

我在Mac OS High Sierra上使用Python 3.7。
我正在尝试从以下位置获取CSV文件：https : //s3.amazonaws.com/assets.datacamp.com/production/course_1606/datasets/winequality-red.csv

当我将网址更改为“ http”时-我可以获取数据。但是，我相信，这避免了检查SSL证书。

所以我检查了互联网，找到了一个解决方案：运行 /Applications/Python\ 3.7/Install\ Certificates.command

这解决了我的问题。但是我对SSL之类的东西一无所知。您能否帮助我了解它实际上解决了我的问题。

如果可能，请向我推荐任何有用的资源，以了解有关安全性和证书的信息。我是新来的。

谢谢！

注意：我确实通过链接-openssl，python请求错误：“证书验证失败”

我的问题与链接中的问题不同，因为我想知道在安装certifi软件包或运行Install\ Certificates.command该错误时实际发生了什么。我对证券知之甚少。

python ssl openssl python-3.x

Bis*_*aul

2018 10-15

29
推荐指数

14
解决办法

3万
查看次数

使用pandas将文本数据从请求对象转换为数据帧

使用请求我正在创建一个.csv格式的对象.然后我怎么能用pandas将该对象写入DataFrame？

以文本格式获取请求对象:

import requests
import pandas as pd
url = r'http://test.url' 
r = requests.get(url)
r.text  #this will return the data as text in csv format

Run Code Online (Sandbox Code Playgroud)

我试过(不起作用):

pd.read_csv(r.text)
pd.DataFrame.from_csv(r.text)

Run Code Online (Sandbox Code Playgroud)

python csv dataframe pandas python-requests

spa*_*row

2016 08-30

10
推荐指数

3
解决办法

2万
查看次数

Pandas：如何从 Google Drive public 读取 CSV 文件？

我搜索了有关从 URL 读取 csv 的类似问题，但找不到从 google drive csv 文件读取 csv 文件的方法。

我的尝试：

import pandas as pd

url = 'https://drive.google.com/file/d/0B6GhBwm5vaB2ekdlZW5WZnppb28/view?usp=sharing'
dfs = pd.read_html(url)

Run Code Online (Sandbox Code Playgroud)

我们如何在 Pandas 中读取这个文件？

通过pandas访问远程URL时处理HTTP身份验证

Pandas具有非常方便的能力,可以从URL中读取csv和其他格式.但是,当数据受到简单的http身份验证保护时,Pandas无法提示用户输入身份验证详细信息(userid,password).解决此限制的最佳方法是什么？

我目前正在做的是:

response = requests.get('http://my.data.url/metrics/crawler/counts', auth=HTTPBasicAuth('userid', 'password'), stream=True)
pd.read_csv(response.raw)

Run Code Online (Sandbox Code Playgroud)

有没有更好的办法？

python pandas

fcc*_*lho

lucky-day

7
推荐指数

2
解决办法

1806
查看次数

如何为 Pandas pd.read_csv 设置代理

我有一个 python 脚本，它通过 https 从服务器加载一个 csv 文件。我支持公司代理，因此我需要向脚本提供该信息。

让

proxy_dict = {"https://user:password@10.10.1.1:8080"}

Run Code Online (Sandbox Code Playgroud)

所有值都更改为正确的地方。

使用

print(requests.get(my_url, proxies=proxy_dict).text[:1000]

Run Code Online (Sandbox Code Playgroud)

按预期工作。

我想使用没有代理参数的pandas.read_csv。

如何为熊猫设置代理？无论是作为变量，还是作为内核，或系统范围内，只要仅影响 Python 即可。

在 Windows 7 x64 上运行 Anaconda 3.6.3 x64。

谢谢！

python proxy pandas python-requests

zui*_*iqo

lucky-day

7
推荐指数

1
解决办法

5495
查看次数

将 Kaggle csv 从下载网址导入到 pandas DataFrame

我一直在尝试不同的方法将Kaggle上的SpaceX 任务csv 文件直接导入 pandas DataFrame，但没有成功。

我需要发送登录请求。这是我到目前为止所拥有的：

import requests
import pandas as pd
from io import StringIO

# Link to the Kaggle data set & name of zip file
login_url = 'http://www.kaggle.com/account/login?ReturnUrl=/spacex/spacex-missions/downloads/database.csv'

# Kaggle Username and Password
kaggle_info = {'UserName': "user", 'Password': "pwd"}

# Login to Kaggle and retrieve the data.
r = requests.post(login_url, data=kaggle_info, stream=True)
df = pd.read_csv(StringIO(r.text))

Run Code Online (Sandbox Code Playgroud)

r 正在返回页面的 html 内容。 df = pd.read_csv(url)给出 CParser 错误： CParserError: Error tokenizing data. C error: Expected 1 …

csv pandas python-requests kaggle

Had*_*ien

lucky-day

5
推荐指数

1
解决办法

6580
查看次数

如何使用Pandas从GitHub读取CSV文件

我试图使用pandas在Python上使用Python读取github上的CSV文件，>我在网上浏览了所有内容，并且尝试了一些在此网站上找到的解决方案，但它们不起作用。我究竟做错了什么？

我已经试过了：

import pandas as pd

url = 'https://github.com/lukes/ISO-3166-Countries-with-Regional-Codes/blob/master/all/all.csv'
df = pd.read_csv(url,index_col=0)
#df = pd.read_csv(url)

print(df.head(5))

Run Code Online (Sandbox Code Playgroud)

python csv pandas

tag*_*aga

lucky-day

3
推荐指数

3
解决办法

1293
查看次数

python:如何从下载按钮隐藏链接的网页下载数据？

假设我想在这里下载数据:http://www.dce.com.cn/publicweb/quotesdata/memberDealPosiQuotes.html

当点击下面显示的按钮时,我得到了一个.csv文件:

我想使用python自动执行此操作,我可以在其中指定日期等.

我在这里发现可以使用pandas pd.read_csv从网页上读取数据,但首先需要获得正确的网址.但在我的情况下,我不知道网址是什么.

此外,我还想自己指定日期和合同等.

在询问之前,我实际上尝试了开发工具,我仍然看不到网址,而且我不知道如何使其编程.

html javascript python csv pandas

an *_*use

2017 09-13

2
推荐指数

1
解决办法

683
查看次数

Pandas read_csv from URL and include request header

As of Pandas 0.19.2, the function read_csv() can be passed a URL. See, for example, from this answer:

import pandas as pd

url="https://raw.githubusercontent.com/cs109/2014_data/master/countries.csv"
c=pd.read_csv(url)

Run Code Online (Sandbox Code Playgroud)

The URL I'd like to use is: https://moz.com/top500/domains/csv

With the above code, this URL returns an error:

urllib2.HTTPError: HTTP Error 403: Forbidden

Run Code Online (Sandbox Code Playgroud)

based on this post, I can get a valid response by passing a request header:

import urllib2,cookielib

site= "https://moz.com/top500/domains/csv"
hdr = {'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11', …

Run Code Online (Sandbox Code Playgroud)

python http-headers pandas python-requests

phi*_*hem

2019 04-17

2
推荐指数

2
解决办法

8436
查看次数