我有一个如下所示的 CSV 文件:
Martin;Sailor;-0.24
Joseph_4;Sailor;-0.12
Alex;Teacher;-0.23
Maria;Teacher;-0.57
Run Code Online (Sandbox Code Playgroud)
我的目标是为每个工作创建一个包含字典的列表。
例如:
list_of_jobs = [{'Job' : Sailor, 'People' : ['Martin', 'Joseph']}
{'Job' : Teacher, 'People' : ['Alex', 'Maria']}
]
Run Code Online (Sandbox Code Playgroud)
我确实创建了字典,但我不知道如何更新 list_of_jobs['People']
有谁能够帮助我?
我有一个要转换为DataFrame的numpy数组的列表。每个数组应该是数据框的一行。
使用pd.DataFrame()不起作用。它始终会给出错误:ValueError:必须通过二维输入。
有一个更好的方法吗?
这是我当前的代码:
list_arrays = array([[0, 0, 0, 1, 0, 0, 0, 0, 00]], dtype=uint8), array([[0, 0, 3, 2, 0, 0, 0, 0, 00]], dtype=uint8)]
d = pd.DataFrame(list_of_arrays)
ValueError: Must pass 2-d input
Run Code Online (Sandbox Code Playgroud) 我正在尝试创建一个包含4个空列的csv文件的数据框.当我在LibreOffice或Excel上打开它时,它正确识别空列.然而,打开并pd.read_csv()最终将列的值移动一个.
我怎么解决这个问题?这似乎是熊猫read_csv()方法的一个问题.
我的代码非常标准:
import pandas as pd
df = pd.DataFrame.read_csv('csv_file.csv', sep=',')
df.head()
Run Code Online (Sandbox Code Playgroud)
我改变了标题并使用了这个:
df = pd.DataFrame.read_csv('csv_file.csv', sep=',', index_col=False).
Run Code Online (Sandbox Code Playgroud)
这解决了这个问题,但是我之前的标题中是什么导致了这个问题?
我有一个数据框,其中一些值位于两个不同的列中
Ligand_hit,Ligand_miss
M00001,M00005
M00002,M00001
M00003,M00007
M00004,M00003
Run Code Online (Sandbox Code Playgroud)
我想创建一个新列,其中包含不在“Ligand_hit”中的“Ligand_miss”中的所有值。所需的输出类似于:
Ligand_hit,Ligand_miss,Unique
M00001,M00005,M00005
M00002,M00001,M00007
M00003,M00007,NaN
M00004,M00003,NaN
Run Code Online (Sandbox Code Playgroud)
我尝试使用“pandas.isin”,但它只输出布尔值。有没有一种简单的方法可以获得所需的结果?
我训练了Logistic模型,交叉验证并使用joblib模块将其保存到文件中.现在我想加载这个模型并用它预测新数据.这是正确的方法吗?特别是标准化.我也应该在我的新数据上使用scaler.fit()吗?在我接下来的教程中,scaler.fit仅用于训练集,所以我在这里有点迷失.
这是我的代码:
#Loading the saved model with joblib
model = joblib.load('model.pkl')
# New data to predict
pr = pd.read_csv('set_to_predict.csv')
pred_cols = list(pr.columns.values)[:-1]
# Standardize new data
scaler = StandardScaler()
X_pred = scaler.fit(pr[pred_cols]).transform(pr[pred_cols])
pred = pd.Series(model.predict(X_pred))
print pred
Run Code Online (Sandbox Code Playgroud) python machine-learning scikit-learn logistic-regression joblib
python ×5
pandas ×3
csv ×2
dataframe ×1
dictionary ×1
joblib ×1
list ×1
numpy ×1
python-3.x ×1
scikit-learn ×1