小编Eli*_*eph的帖子

为什么我要在pandas中复制一个数据框

从父数据帧中选择子数据帧时,我注意到一些程序员使用该.copy()方法复制数据帧.

他们为什么要复制数据框?如果我不复制会怎么样?

python pandas chained-assignment

137
推荐指数
5
解决办法
11万
查看次数

Scikit中的随机状态(伪随机数)学习

我想在scikit中实现一个机器学习算法,但是我不明白这个参数random_state是做什么的?我为什么要用它?

我也无法理解什么是伪随机数.

python scikit-learn

122
推荐指数
4
解决办法
12万
查看次数

如何将列表转换为pandas数据帧

我有以下代码:

rows =[]
for dt in new_info:
    x =  dt['state']
    est = dt['estimates']

    col_R = [val['choice'] for val in est if val['party'] == 'Rep']
    col_D = [val['choice'] for val in est if val['party'] == 'Dem']

    incumb = [val['party'] for val in est if val['incumbent'] == True ]

    rows.append((x, col_R, col_D, incumb))
Run Code Online (Sandbox Code Playgroud)

现在我想将我的行列表转换为pandas数据框.我的行列表的结构如下所示,我的列表有32个条目.

在此输入图像描述

当我将其转换为pandas数据帧时,我将数据帧中的条目作为列表获取.:

pd.DataFrame(rows, columns=["State", "R", "D", "incumbent"])  
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

但我希望我的数据框架像这样

在此输入图像描述

新的info变量看起来像这样 在此输入图像描述

python pandas

14
推荐指数
2
解决办法
9万
查看次数

np.random.binomial中n和size参数之间的差异(n,p,size = 1000)

我无法理解np.random.binomial中n和size参数之间的区别.

N = 1200
p =0.53
q = 1000

np.random.binomial(N, p, size = q) 
np.random.binomial(1, p, size = q)
np.random.binomial(N,p, size= q)
Run Code Online (Sandbox Code Playgroud)

N是试验次数,但是上述公式中的大小是多少.也善意解释三个版本的二项式的vabove.

statistics numpy

9
推荐指数
2
解决办法
7735
查看次数

如何将 pandas 中的数据框组合在一起?

list_1  =[1, 2, 3, 4 ]

def fun(list_1):
    for each value in list1:
        # perform some operation and create a new data frame(pandas) for each value in the list
        # so in total I should get 4 data frames.

        yield new_data_frame
Run Code Online (Sandbox Code Playgroud)

当我调用 fun(list_1) 时,我得到 4 个数据帧,一个接一个:

data_frame_1

data_frame_2

data_frame_3

data_frame_4
Run Code Online (Sandbox Code Playgroud)

我的问题是,如果我需要垂直组合 pandas 数据框怎么办?

data_frame_1
+
data_frame_2
+
data_frame_3
+
data_frame_4
Run Code Online (Sandbox Code Playgroud)

python python-2.7 pandas

6
推荐指数
1
解决办法
2万
查看次数

有人可以解释一下np.log的作用吗?

我知道这是一个简单的问题,但我无法得到np.log究竟做了什么?我看到了我无法理解背后逻辑的文档np.log.np.log([9000000])我得到的输出为16.01273514.我无法理解为什么我得到这个数字,我知道对数的含义.

python numpy scipy

2
推荐指数
1
解决办法
4379
查看次数

我应该在我的功能中改变什么

list_1  =[1, 2, 3, 4 ]

def fun(list_1):
    for each value in list1:
        # perform some operation and create a new data frame(pandas) for each value in the list
        # so in total I should get 4 data frames.
        print each_value

        return new_data_frame
Run Code Online (Sandbox Code Playgroud)

当我运行时,fun(list_1)我应该得到4个数据帧:

1
data_frame_1

2
data_frame_2

3
data_frame_3

4
data_frame_4
Run Code Online (Sandbox Code Playgroud)

但我只获得了第一个值的输出.

1
data_frame_1
Run Code Online (Sandbox Code Playgroud)

那我该怎么改变我的功能呢.

python python-2.7 pandas

1
推荐指数
1
解决办法
69
查看次数

比较python中的括号

from collections import Counter
x = '((()))'

print Counter(x)

Counter({')': 3, '(': 3})
Run Code Online (Sandbox Code Playgroud)

我需要比较我的字符串的开括号和括号是否相等.我用反击来做这件事.但是我应该如何比较计数器变量的两个值?

python python-2.7

0
推荐指数
1
解决办法
438
查看次数