小编Phi*_*oud的帖子

保存pandas.Series直方图图到文件

在ipython Notebook中,首先创建一个pandas Series对象,然后通过调用实例方法.hist(),浏览器显示该图.

我想知道如何将这个数字保存到文件(我的意思是不是通过右键单击并另存为,但脚本中需要的命令).

python histogram pandas

Gea*_*ric

2013 09-25

58
推荐指数

3
解决办法

7万
查看次数

什么是Spark DataFrame方法`toPandas`实际上在做什么？

我是Spark-DataFrame API的初学者.

我使用此代码将csv tab分隔为Spark Dataframe

lines = sc.textFile('tail5.csv')
parts = lines.map(lambda l : l.strip().split('\t'))
fnames = *some name list*
schemaData = StructType([StructField(fname, StringType(), True) for fname in fnames])
ddf = sqlContext.createDataFrame(parts,schemaData)

Run Code Online (Sandbox Code Playgroud)

假设我使用Spark从新文件创建DataFrame,并使用内置方法toPandas()将其转换为pandas,

它是否将Pandas对象存储到本地内存？
Pandas低级计算是否由Spark处理？
它是否暴露了所有pandas数据帧功能？(我想是的)
我可以将它转换为潘达斯,只是完成它,没有那么多的触摸DataFrame API？

python pandas apache-spark pyspark

Nap*_*Jon

2015 03-25

44
推荐指数

2
解决办法

5万
查看次数

消除给定百分位数的所有数据

我有一个DataFrame叫做data列的大熊猫ms.我想消除data.ms高于95%百分位数的所有行.现在,我这样做:

limit = data.ms.describe(90)['95%']
valid_data = data[data['ms'] < limit]

Run Code Online (Sandbox Code Playgroud)

哪个有效,但我想把它推广到任何百分位数.最好的方法是什么？

python filtering percentile pandas

Roy*_*ith

2013 09-03

32
推荐指数

3
解决办法

3万
查看次数

对'this-> template [somename]'的调用是做什么的？

我已经搜索过这个问题但我找不到任何相关内容.有没有更好的方法在Google中查询这样的内容,或者任何人都可以提供链接或链接或相当详细的解释？谢谢!

编辑:这是一个例子

template< typename T, size_t N>
struct Vector {
public:
   Vector() {
       this->template operator=(0);
   }

   // ...       

   template< typename U >
   typename boost::enable_if< boost::is_convertible< U, T >, Vector& >::type operator=(Vector< U, N > const & other) {
       typename Vector< U, N >::ConstIterator j = other.begin();
       for (Iterator i = begin(); i != end(); ++i, ++j)
           (*i) = (*j);
       return *this;
   } 
};

Run Code Online (Sandbox Code Playgroud)

此示例来自Google Code上的ndarray项目,而不是我自己的代码.

c++ templates

Phi*_*oud

2011 04-04

23
推荐指数

1
解决办法

6724
查看次数

元组解包类似于Python,但在Common Lisp中

有没有办法将列表的值分配给Common Lisp中的符号列表,类似于在Python中将元组值赋值给变量的方式？

x, y, z = (1, 2, 3)

Run Code Online (Sandbox Code Playgroud)

就像是

(setq '(n p) '(1 2))

Run Code Online (Sandbox Code Playgroud)

凡n与p现在等于1和2分别.以上就是我在脑海中思考它的方式,但它不起作用.我尝试使用apply如下:

(apply setq '('(n p) '(1 2)))

Run Code Online (Sandbox Code Playgroud)

我是Lisp的新手,所以如果这是显而易见的事情,请尽量不要过于苛刻,请指出我正确的方向!谢谢.

PS:我在Scheme中看过这样做的帖子和Common Lisp中关于元组扩展的类似帖子,但是这些在回答我的问题时并不是很有帮助1)因为我没有使用Scheme,2)因为排名最高的答案就是这个词apply.

lisp python list common-lisp iterable-unpacking

Phi*_*oud

2011 05-16

12
推荐指数

3
解决办法

1476
查看次数

将参数传递给模板而不覆盖数据上下文

我想将一个新参数传递给模板,同时保留它的原始数据上下文.

原始数据上下文:{message:"hello"} {{> myTemplate withIcon=True}}
使用{withIcon:True}覆盖数据上下文

我的解决方案是将这样的数据包装起来.

<code>
{{> myTemplate originalData=this withIcon=True}}
</code>

Run Code Online (Sandbox Code Playgroud)

有更好的解决方案吗？

meteor

Vin*_*ent

2015 01-19

10
推荐指数

2
解决办法

952
查看次数

如何创建每个离散值条形图的条形图/直方图？

我正在尝试创建一个直方图,该直方图将显示离散星级(1-5)中每个值的评级数量.每个值应该有一个条形,在x轴上,每个条形下面(中心)显示的唯一数字是[1,2,3,4,5].

我尝试将容器数量设置为5或其范围设置为0-7,但这会创建跨越值的条形(如提供的图像中所示)

在此输入图像描述

这是我尝试过的代码(pandas和numpy):

df.stars.hist()

Run Code Online (Sandbox Code Playgroud)

和

hist, bins = np.histogram(x1, bins=5)
ax.bar(bins[:-1], hist.astype(np.float32) / hist.sum(), width=(bins[1]-bins[0]), color="blue")

Run Code Online (Sandbox Code Playgroud)

python matplotlib pandas

d13*_*337

2013 08-23

6
推荐指数

1
解决办法

5690
查看次数

如何在pandas DataFrames中对多索引列进行切片？

我有一个DataFrame16行和14671872列的对象.我不能为我的生活弄清楚如何在任何合理的时间内在具有24GB RAM的四核戴尔T410上切割此阵列.

我只想用数组的转置,因为这是多快,后来我将有一个MultiIndex在列,而我还没有发现大熊猫展示了如何使用任何文件MultiIndexS作为列.

我想在Github跟踪器上打开一个问题,但我想在我做之前发布这里,以防万一我错过了一些非常明显的东西.

python pandas

Phi*_*oud

lucky-day

3
推荐指数

1
解决办法

5885
查看次数

Python MySQLdb 转义字符：查询在 MySQL 中有效但在 python MySQLdb 中无效

我正在尝试通过 Python 的 MySQLdb 库将数据从 Pandas（从 CSV 导入）传递到 MySQL 数据库。当文字反斜杠开始发挥作用时，我遇到了麻烦。我从原始输入中转义了单个反斜杠，因此 Python 知道它们是文字反斜杠，而不是对后续字符的转义。但是当我尝试执行 INSERT 查询时，MySQLdb 说存在语法错误。但这是令人困惑和令人沮丧的部分：如果我将确切的字符串复制/粘贴到 MySQL 中，它可以毫无问题地执行。

我试图使数据和结构尽可能接近实际数据，但对其进行了更改以保留隐私。请注意，在第一行的 SourceSystemID 列的末尾和第二行的 MiddleInitial 列有两个类似的违规值。

In [39]: test
Out[39]: 

  ehrSystemID SourceSystemID LastName FirstName MiddleInitial  Sex  
0   fakePlace           ABC\      NaN       NaN           NaN  NaN   
1   fakePlace            XYZ    Smith      John             \    M   
          npi  deaNumber LicenseNumber ProvSpecialty  dob  
0  1234567890  AB1234567       !123456      Internal  NaN  
1         NaN        NaN       B123456      Internal  NaN

Run Code Online (Sandbox Code Playgroud)

这些行的值转换为字符串以附加到 INSERT 语句的末尾（请注意，所有 MySQL 列都将是 varchar，因此所有值都用单引号括起来）

In [40]: testVals
Out[40]: "('fakePlace', 'ABC\\', '', '', '', '', '1234567890', …

Run Code Online (Sandbox Code Playgroud)

python mysql sql mysql-python pandas

TCA*_*n07

2013 08-30

2
推荐指数

1
解决办法

2147
查看次数

使用secondary_y轴绘制分组数据

我想绘制12个图表（每月一个图表），包括列'A'和'B'左侧y轴，以及'C'右侧的列。

下面的代码在左侧绘制了所有内容。

import pandas as pd
index=pd.date_range('2011-1-1 00:00:00', '2011-12-31 23:50:00', freq='1h')
df=pd.DataFrame(np.random.rand(len(index),3),columns=['A','B','C'],index=index)

df2 = df.groupby(lambda x: x.month)
for key, group in df2:
    group.plot()

Run Code Online (Sandbox Code Playgroud)

如何分离柱和使用这样的：group.plot({'A','B':style='g'},{'C':secondary_y=True})？

python plot matplotlib pandas

Mic*_*hal

2014 03-17

2
推荐指数

1
解决办法

832
查看次数

Meteor中的Template.created和Template.onCreated有什么区别？

Template.templatename.onCreated在文档中被提及(连同.onRendered和.onDestroyed方法).

但是,当我打电话给这些时,没有任如果我打电话Template.templatename.created,例如,这是有效的.

有什么想法吗？我在文档中误读了什么吗？这是对其他东西的引用吗？

编辑:我刚刚在源代码中找到了这个:

https://github.com/meteor/meteor/blob/master/packages/blaze/template.js#L65

在第180行,这些被标记为在1.1中被弃用,但我仍然没有得到任何来自onCreated的爱....

有谁知道我做错了什么？

Template.channels_admin.onCreated = function () {
    // .... doesn't run
};

Run Code Online (Sandbox Code Playgroud)

javascript templates meteor meteor-blaze

big*_*olf

2015 06-04

2
推荐指数

1
解决办法

2114
查看次数

如何重新采样产生几何平均值的时间序列？

我是Python新手,在使用pandas重新采样某些数据时,我遇到了一个棘手的问题.

当我想重新采样时间序列数据时,应用算术平均函数非常简单.

例如:

假设ts是以分钟频率的时间序列数据(在pandas,它被封装在具有a的pandas.Series对象中DatetimeIndex).

要获得每组5分钟时段的算术平均值,它只是:

ts.resample('5min', how='mean')

Run Code Online (Sandbox Code Playgroud)

但是,我如何以这种方式计算几何平均数？是否有像上面这样的简单解决方案,例如:

ts.resample('5min', how='gmean')

Run Code Online (Sandbox Code Playgroud)

python mean pandas

use*_*528

2013 10-08

0
推荐指数

1
解决办法

1841
查看次数

标签统计

python ×9

pandas ×8

matplotlib ×2

meteor ×2

templates ×2

apache-spark ×1

c++ ×1

common-lisp ×1

filtering ×1

histogram ×1

iterable-unpacking ×1

javascript ×1

lisp ×1

list ×1

mean ×1

meteor-blaze ×1

mysql ×1

mysql-python ×1

percentile ×1

plot ×1

pyspark ×1

sql ×1

标签 统计

小编Phi_oud的帖子

标签统计