小编Har*_*nna的帖子

将列表插入符合列条件的单元格

考虑 df

   A  B  C
0  3  2  1
1  4  2  3
2  1  4  1
3  2  2  3
Run Code Online (Sandbox Code Playgroud)

我想补充另一列"D",使得d包含基于各种条件不同的列表"A""B""C"

   A  B  C  D
0  3  2  1  [1,0]
1  4  2  3  [1,0]
2  1  4  1  [0,2]
3  2  2  3  [2,0]
Run Code Online (Sandbox Code Playgroud)

我的代码段如下所示:

df['D'] = 0
df['D'] = df['D'].astype(object)

df.loc[(df['A'] > 1) & (df['B'] > 1), "D"] = [1,0]
df.loc[(df['A'] == 1) , "D"] = [0,2]
df.loc[(df['A'] == 2) …
Run Code Online (Sandbox Code Playgroud)

python pandas

5
推荐指数
1
解决办法
1209
查看次数

Create new column by sampling bits of other columns

Consider the dataframe containing N columns as shown below. Each entry is an 8-bit integer.

|---------------------|------------------|---------------------|
|      Column 1       |     Column 2     |      Column N       |
|---------------------|------------------|---------------------|
|          4          |         8        |          13         |
|---------------------|------------------|---------------------|
|          0          |         32       |          16         |
|---------------------|------------------|---------------------|
Run Code Online (Sandbox Code Playgroud)

I'd like to create a new column with 8-bit entries in each row by randomly sampling each bit of data from the remaining columns. So, the resulting dataframe would look like:

|---------------------|------------------|---------------------|---------------|
|      Column 1       |     Column …
Run Code Online (Sandbox Code Playgroud)

python pandas

5
推荐指数
1
解决办法
44
查看次数

如何使用scikit-learn仅删除多项式回归中的交互项?

我正在使用scikit-learn 运行多项式回归。我有大量变量(准确地说是23个),我试图使用2级多项式回归进行回归。

interact_only = True,仅保留交互项,例如X 1 * Y 1,X 2 * Y 2等等。

我只需要其他术语,即X 1,X 1 2,Y 1,Y 1 2,依此类推。

有功能可以得到这个吗?

machine-learning python-2.7 scikit-learn non-linear-regression

3
推荐指数
1
解决办法
1309
查看次数

通过随机采样其他列数据来创建新列

我想通过从其余列中随机采样数据来创建新列。

考虑具有“ N”列的数据框,如下所示:

|---------------------|------------------|---------------------|
|      Column 1       |     Column 2     |      Column N       |
|---------------------|------------------|---------------------|
|          0.37       |         0.8      |          0.0        |
|---------------------|------------------|---------------------|
|          0.0        |         0.0      |          0.8        |
|---------------------|------------------|---------------------|
Run Code Online (Sandbox Code Playgroud)

结果数据框应如下所示

|---------------------|------------------|---------------------|---------------|
|      Column 1       |     Column 2     |      Column N       |     Sampled   |
|---------------------|------------------|---------------------|---------------|
|          0.37       |         0.8      |          0.0        |       0.8     |
|---------------------|------------------|---------------------|---------------|
|          0.0        |         0.0      |          B          |        B      |
|---------------------|------------------|---------------------|---------------|
|          A          |         5        |          0.8        |        A      |
|---------------------|------------------|---------------------|---------------|
Run Code Online (Sandbox Code Playgroud)

通过随机选择“ N”列的相应条目之一来创建“已采样”列的条目。例如,从第2列中选择“ 0.8”,从第N列中选择“ B”,依此类推。 …

python pandas

1
推荐指数
2
解决办法
207
查看次数