我上传了一个文件到Google电子表格(用于制作一个公开可访问的示例IPython Notebook,带有数据)我正在使用该文件的原生形式可以读入Pandas Dataframe.所以现在我使用下面的代码来阅读电子表格,工作正常,但只是作为字符串,我没有任何运气试图让它回到数据帧(你可以得到数据)
import requests
r = requests.get('https://docs.google.com/spreadsheet/ccc?key=0Ak1ecr7i0wotdGJmTURJRnZLYlV3M2daNTRubTdwTXc&output=csv')
data = r.content
Run Code Online (Sandbox Code Playgroud)
数据最终看起来像:(第1行标题)
',City,region,Res_Comm,mkt_type,Quradate,National_exp,Alabama_exp,Sales_exp,Inventory_exp,Price_exp,Credit_exp\n0,Dothan,South_Central-Montgomery-Auburn-Wiregrass-Dothan,Residential,Rural,1/15/2010,2,2,3,2,3,3\n10,Foley,South_Mobile-Baldwin,Residential,Suburban_Urban,1/15/2010,4,4,4,4,4,3\n12,Birmingham,North_Central-Birmingham-Tuscaloosa-Anniston,Commercial,Suburban_Urban,1/15/2010,2,2,3,2,2,3\n
Run Code Online (Sandbox Code Playgroud)
引入磁盘驻留文件的本机pandas代码如下所示:
df = pd.io.parsers.read_csv('/home/tom/Dropbox/Projects/annonallanswerswithmaster1012013.csv',index_col=0,parse_dates=['Quradate'])
Run Code Online (Sandbox Code Playgroud)
一个"干净"的解决方案将有助于许多人提供一种简单的方法来共享数据集供熊猫使用!我尝试了一堆替代方案但没有成功,我很确定我再次错过了一些明显的东西.
只是一个更新说明新的Google电子表格有不同的网址格式只是在上面的例子和/或下面的答案中使用它来代替URL,你应该没问题就是一个例子:
https://docs.google.com/spreadsheets/d/177_dFZ0i-duGxLiyg6tnwNDKruAYE-_Dd8vAQziipJQ/export?format=csv&id
Run Code Online (Sandbox Code Playgroud)
从@Max Ghenis看下面的解决方案,它只使用了pd.read_csv,不需要StringIO或请求......
我很久以前就安装了 python,并且在这几个月里工作得很好,我可以从命令提示符安装库..使用 shell 从 vba 运行 python 程序,直到有一天..它开始失败,我可以从空闲状态运行 python 脚本,但不能从空闲状态运行 python 脚本命令提示符或 vba。我已尝试检查我的许可但没有成功。
我有一个元组如下:
t=(1,2,3,4,5,6)
Run Code Online (Sandbox Code Playgroud)
我想把它转换成一个列表,虽然有一个直接的方式
l=list(t)
Run Code Online (Sandbox Code Playgroud)
我想知道下面的效率是否更低,如果是这样的话?
l=[*t]
Run Code Online (Sandbox Code Playgroud)
这更像是要理解解压缩并将其打包回列表中是否有任何开销list(tuple).
我会尝试对两者进行基准测试并在此处发布结果,但如果有人能够提出一些见解,那就太棒了.