小编Mar*_*ana的帖子

在 python 中更新字典列表的值

我有一个如下所示的 CSV 文件：

Martin;Sailor;-0.24
Joseph_4;Sailor;-0.12
Alex;Teacher;-0.23
Maria;Teacher;-0.57

Run Code Online (Sandbox Code Playgroud)

我的目标是为每个工作创建一个包含字典的列表。

例如：

list_of_jobs = [{'Job' : Sailor, 'People' : ['Martin', 'Joseph']}
                 {'Job' : Teacher, 'People' : ['Alex', 'Maria']}
]

Run Code Online (Sandbox Code Playgroud)

我确实创建了字典，但我不知道如何更新 list_of_jobs['People']

有谁能够帮助我？

python dictionary list

Mar*_*ana

2017 03-28

9
推荐指数

2
解决办法

3万
查看次数

将数组列表转换为pandas数据框

我有一个要转换为DataFrame的numpy数组的列表。每个数组应该是数据框的一行。

使用pd.DataFrame（）不起作用。它始终会给出错误：ValueError：必须通过二维输入。

有一个更好的方法吗？

这是我当前的代码：

list_arrays = array([[0, 0, 0, 1, 0, 0, 0, 0, 00]], dtype=uint8), array([[0, 0, 3, 2, 0, 0, 0, 0, 00]], dtype=uint8)]

d = pd.DataFrame(list_of_arrays)

ValueError: Must pass 2-d input

Run Code Online (Sandbox Code Playgroud)

python numpy dataframe python-3.x pandas

Mar*_*ana

2018 03-29

6
推荐指数

2
解决办法

9756
查看次数

熊猫读csv正在改变列

我正在尝试创建一个包含4个空列的csv文件的数据框.当我在LibreOffice或Excel上打开它时,它正确识别空列.然而,打开并pd.read_csv()最终将列的值移动一个.

我怎么解决这个问题？这似乎是熊猫read_csv()方法的一个问题.

我的代码非常标准:

import pandas as pd
df = pd.DataFrame.read_csv('csv_file.csv', sep=',')
df.head()

Run Code Online (Sandbox Code Playgroud)

我改变了标题并使用了这个:

df = pd.DataFrame.read_csv('csv_file.csv', sep=',', index_col=False).

Run Code Online (Sandbox Code Playgroud)

这解决了这个问题,但是我之前的标题中是什么导致了这个问题？

python csv pandas

Mar*_*ana

2018 11-25

5
推荐指数

2
解决办法

3027
查看次数

比较两列并在熊猫中获取唯一值

我有一个数据框，其中一些值位于两个不同的列中

Ligand_hit,Ligand_miss
M00001,M00005
M00002,M00001
M00003,M00007
M00004,M00003

Run Code Online (Sandbox Code Playgroud)

我想创建一个新列，其中包含不在“Ligand_hit”中的“Ligand_miss”中的所有值。所需的输出类似于：

Ligand_hit,Ligand_miss,Unique
M00001,M00005,M00005
M00002,M00001,M00007
M00003,M00007,NaN
M00004,M00003,NaN

Run Code Online (Sandbox Code Playgroud)

我尝试使用“pandas.isin”，但它只输出布尔值。有没有一种简单的方法可以获得所需的结果？

python csv pandas

Mar*_*ana

lucky-day

2
推荐指数

1
解决办法

6811
查看次数

加载并预测新数据sklearn

我训练了Logistic模型,交叉验证并使用joblib模块将其保存到文件中.现在我想加载这个模型并用它预测新数据.这是正确的方法吗？特别是标准化.我也应该在我的新数据上使用scaler.fit()吗？在我接下来的教程中,scaler.fit仅用于训练集,所以我在这里有点迷失.

这是我的代码:

#Loading the saved model with joblib
model = joblib.load('model.pkl')

# New data to predict
pr = pd.read_csv('set_to_predict.csv')
pred_cols = list(pr.columns.values)[:-1]

# Standardize new data
scaler = StandardScaler()
X_pred = scaler.fit(pr[pred_cols]).transform(pr[pred_cols])

pred = pd.Series(model.predict(X_pred))
print pred

Run Code Online (Sandbox Code Playgroud)

python machine-learning scikit-learn logistic-regression joblib

Mar*_*ana

lucky-day

2
推荐指数

1
解决办法

7044
查看次数