小编use*_*289的帖子

将Pandas数据框显示为表格

因为我每次输入数据帧的名称时都安装了更新版本的pandas,例如

df[0:5]
Run Code Online (Sandbox Code Playgroud)

要查看前几行,它会为我提供列的摘要,其中的值的数量以及数据类型.

如何才能看到表格视图?(我正在使用iPython btw).

提前致谢!

python pandas

16
推荐指数
2
解决办法
5万
查看次数

在python/pandas中按月对每日数据进行分组,然后进行规范化

我在熊猫中有下表DataFrame:

    q_string    q_visits    q_date
0   nucleus         1790        2012-10-02 00:00:00
1   neuron          364         2012-10-02 00:00:00
2   current         280         2012-10-02 00:00:00
3   molecular       259         2012-10-02 00:00:00
4   stem            201         2012-10-02 00:00:00
Run Code Online (Sandbox Code Playgroud)

该表包含来自服务器日志的查询量,按天计算.我想做两件事:

  1. 我想按月对查询的查询总数进行分组,例如,如果'分子'出现在2012-10-02的第1000卷,2012-10-03的第500卷,那么它应该在新表1500(卷)中有一个条目,日期为2012 - 10 - 31(月末结束时代表月份 - 转换后的表格中的所有日期都将是月末,代表它们所关联的整个月份).
  2. 我想添加第5列,其中包含月份标准化q_visits.即,术语的每月查询量除以所有术语中该月的总查询量.

这样做的最佳方式是什么?

python pandas

13
推荐指数
1
解决办法
2万
查看次数

如何将pandas/dataframe转换为XML?

有一个简单的方法来获取pandas/df表:

field_1 field_2 field_3 field_4
cat     15,263  2.52    00:03:00
dog     1,652   3.71    00:03:47
test     312    3.27    00:03:41
book     300    3.46    00:02:40
Run Code Online (Sandbox Code Playgroud)

并将其转换为XML:

<item>
  <field name="field_1">cat</field>
  <field name="field_2">15263</field>
  <field name="filed_3">2.52</field>

...

<item>
      <field name="field_1">dog</field>

and so on...
Run Code Online (Sandbox Code Playgroud)

在此先感谢您的帮助.

python xml pandas

12
推荐指数
4
解决办法
2万
查看次数

使用Python并行进行多个API调用(IPython)

我在我的本地机器(Mac)上使用Python(IPython和Canopy)和RESTful内容API.

我有一个由3000个唯一ID组成的数组,用于从API中提取数据,并且一次只能使用一个ID调用API.

我希望能以某种方式同时制作3组1000个电话以加快速度.

这样做的最佳方式是什么?

在此先感谢您的帮助!

python api parallel-processing

8
推荐指数
1
解决办法
1万
查看次数

从Linux命令行加水印视频

有谁知道如何使用一个简单的工具从Linux命令行水印视频?

当前版本不支持ffmpeg中的水印,并且需要自定义编译.

最大.

linux video watermark ffmpeg video-watermarking

7
推荐指数
1
解决办法
2604
查看次数

在它们的索引中结合两个大熊猫系列

我在熊猫中有两个系列.

系列1:

id        count_1
1            3
3           19
4           15
5            5
6            2
Run Code Online (Sandbox Code Playgroud)

和系列2:

id        count_2
1           3
3           1
4           1
5           2
6           1
Run Code Online (Sandbox Code Playgroud)

如何将ID组合在一起以形成下面的表格?

id        count_1    count_2
1            3        3
3           19        1
4           15        1
5            5        2
6            2        1
Run Code Online (Sandbox Code Playgroud)

python series pandas

7
推荐指数
1
解决办法
2万
查看次数

Python中的大型矩阵乘法 - 最佳选择是什么?

我有两个布尔稀疏的方形矩阵c.从12BM数据生成80,000 x 80,000(当我使用GB数据时,可能会有更大数量级的矩阵).

我想将它们相乘(它产生一个三角形矩阵 - 但是我没有得到这个,因为我不限制点积产生三角矩阵).

我想知道它们的最佳乘法方式是什么(内存方式和速度方式) - 我将在m2.4xlarge AWS实例上进行计算,该实例具有> 60GB的RAM.出于速度原因,我宁愿将计算结果保留在RAM中.

我很欣赏SciPy有稀疏矩阵,h5py也是如此,但两者都没有经验.

什么是最好的选择?

提前致谢

更新:布尔矩阵的稀疏度<0.6%

python numpy sparse-matrix pytables h5py

7
推荐指数
1
解决办法
3582
查看次数

将pandas中的CSV文件导入pandas数据帧

我有一个从SQL转储中获取的CSV文件,如下所示(前面几行使用来自终端的head file.csv):

??AANAT,AANAT1576,4
AANAT,AANAT1704,1
AAP,AAP-D-12-00691,8
AAP,AAP-D-12-00834,3
Run Code Online (Sandbox Code Playgroud)

当我使用pd.read_csv('file.csv')命令时,我收到错误"ValueError:No columns to to file from file".

有关如何将CSV文件导入表格并避免错误的任何想法?

解决问题(遵循Ed的评论)

我试过header = None,skiprows = 1以避免?? (从终端使用head命令时出现).

提取的文件路径是http://goo.gl/jyYlIK

python csv pandas

7
推荐指数
1
解决办法
1万
查看次数

具有恢复能力的文件上传(最好在Ruby on Rails中)

所有人都认为这是一个相当困难的话题.我正在建立一个网站,要求用户上传大(多GB).允许用户在网站上传文件并允许文件上传失败的最佳方式是什么?在rails中写这个的方法是什么?

任何想法都非常感激.

最大.

scripting file-upload ruby-on-rails file

6
推荐指数
1
解决办法
1801
查看次数

如何将numpy矩阵转换为布尔矩阵?

我在numpy中有一个焦虑矩阵,它有0和非0值.有没有办法轻松将其转换为布尔矩阵?

谢谢.

python numpy

6
推荐指数
3
解决办法
8279
查看次数