小编Anj*_*ngi的帖子

将SQL Server表缓慢加载到pandas DataFrame中

当使用pyodbc从SQL Server数据库加载超过1000万条记录时,Pandas变得非常慢,主要是函数pandas.read_sql(query,pyodbc_conn).以下代码最多需要40-45分钟才能从SQL表中加载10-15百万条记录:Table1

是否有更好更快的方法将SQL表读入pandas Dataframe？

import pyodbc
import pandas

server = <server_ip> 
database = <db_name> 
username = <db_user> 
password = <password> 
port='1443'
conn = pyodbc.connect('DRIVER={SQL Server};SERVER='+server+';PORT='+port+';DATABASE='+database+';UID='+username+';PWD='+ password)
cursor = conn.cursor()

data = pandas.read_sql("select * from Table1", conn) #Takes about 40-45 minutes to complete

Run Code Online (Sandbox Code Playgroud)

python sql-server pyodbc pandas

Anj*_*ngi

2018 11-20

6
推荐指数

1
解决办法

844
查看次数

将 pyodbc.rows 列表转换为 pandas Dataframe 需要很长时间

有没有更快的方法将 pyodbc.rows 对象转换为 pandas Dataframe？将超过 1000 万个 pyodbc.rows 对象的列表转换为 pandas 数据框大约需要 30-40 分钟。

import pyodbc
import pandas

server = <server_ip> 
database = <db_name> 
username = <db_user> 
password = <password> 
port='1443'

conn = pyodbc.connect('DRIVER={SQL Server};SERVER='+server+';PORT='+port+';DATABASE='+database+';UID='+username+';PWD='+ password)

#takes upto 12 minutes
rows = cursor.execute("select top 10000000 * from [LSLTGT].[MBR_DIM] ").fetchall() 

#Read cursor data into Pandas dataframe.....Takes forever!
df = pandas.DataFrame([tuple(t) for t in rows])

Run Code Online (Sandbox Code Playgroud)

python pyodbc pandas

Anj*_*ngi

lucky-day

5
推荐指数

2
解决办法

4009
查看次数

curl for get-pip.py does not work: Syntax Error

When I try to run:

[root@pex appliance_ui]# curl https://bootstrap.pypa.io./get-pip.py | python

Run Code Online (Sandbox Code Playgroud)

It returns:

% Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100 1603k  100 1603k    0     0  7006k      0 --:--:-- --:--:-- --:--:-- 13.2M
Traceback (most recent call last):
  File "<stdin>", line 20649, in <module>
  File "<stdin>", line 197, in main
  File "<stdin>", line 82, in bootstrap
  File "/tmp/tmpH39pcu/pip.zip/pip/_internal/__init__.py", line 42, in <module>
  File "/tmp/tmpH39pcu/pip.zip/pip/_internal/cmdoptions.py", line 16, in <module>
  File "/tmp/tmpH39pcu/pip.zip/pip/_internal/index.py", …

Run Code Online (Sandbox Code Playgroud)

curl pip python-2.6 centos6 python-3.5

Anj*_*ngi

lucky-day

4
推荐指数

1
解决办法

7148
查看次数