小编gor*_*jan的帖子

将二进制列中的值替换为另一列中的值

我有一个如下所示的数据框:

df = pd.DataFrame({"value": [4, 5, 3], "item1": [0, 1, 0], "item2": [1, 0, 0], "item3": [0, 0, 1]})
df

  value item1   item2   item3
0   4   0      1         0
1   5   1      0         0
2   3   0      0         1
Run Code Online (Sandbox Code Playgroud)

基本上我想要做的是将一个热编码元素的值替换为"value"列中的值,然后删除"value"列.结果数据框应如下所示:

df_out = pd.DataFrame({"item1": [0, 5, 0], "item2": [4, 0, 0], "item3": [0, 0, 3]})

   item1    item2   item3
0   0        4      0
1   5        0      0
2   0        0      3
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

10
推荐指数
1
解决办法
345
查看次数

在 Linux 发行版上以非 root 用户身份安装 VSCode?

以非 root 用户身份在 Linux 发行版(例如 Fedora)上安装 VSCode 的实际方法是什么?换句话说,我想在不使用sudo权限的情况下安装VSCode?有没有办法访问git clone仓库并使用它?

欢迎大家指点!

visual-studio-code

7
推荐指数
2
解决办法
2万
查看次数

Tensorflow:使用raw_rnn复制dynamic_rnn行为

我试图复制tf.nn.dynamic_rnn使用低级API 的行为tf.nn.raw_rnn.为了做到这一点,我使用相同的数据补丁,设置随机种子并使用相同的hparams来创建细胞和递归神经网络.但是,从两个实现生成的输出彼此不相等.以下是数据和代码.

datalengths:

X = np.array([[[1.1, 2.2, 3.3], [4.4, 5.5, 6.6], [0.0, 0.0, 0.0]], [[1.1, 2.2, 3.3], [4.4, 5.5, 6.6], [7.7, 8.8, 9.9]], [[1.1, 2.2, 3.3], [0.0, 0.0, 0.0], [0.0, 0.0, 0.0]]], dtype=np.float32)
X_len = np.array([2, 3, 1], dtype=np.int32)
Run Code Online (Sandbox Code Playgroud)

tf.nn.dynamic_rnn实施:

tf.reset_default_graph()
tf.set_random_seed(42)

inputs = tf.placeholder(shape=(3, None, 3), dtype=tf.float32)
lengths = tf.placeholder(shape=(None,), dtype=tf.int32)

lstm_cell = tf.nn.rnn_cell.LSTMCell(5)
outputs, state = tf.nn.dynamic_rnn(inputs=inputs, sequence_length=lengths, cell=lstm_cell, dtype=tf.float32, initial_state=lstm_cell.zero_state(3, dtype=tf.float32), time_major=True)
outputs_reshaped = tf.transpose(outputs, perm=[1, 0, …
Run Code Online (Sandbox Code Playgroud)

python deep-learning lstm tensorflow recurrent-neural-network

5
推荐指数
1
解决办法
211
查看次数

tf.data.Dataset.repeat() 与 iterator.initializer 之间的区别

Tensorflow 具有tf.data.Dataset.repeat(x)迭代数据x的次数。它还具有iterator.initializerwhich 当iterator.get_next()耗尽时,iterator.initializer可用于重新启动迭代。我的问题是使用tf.data.Dataset.repeat(x)技术与使用技术时有区别iterator.initializer吗?

python repeat tensorflow

3
推荐指数
1
解决办法
1307
查看次数

pandas groupby 中连续日期之间的差异

我有一个数据框如下:

df_raw_dates = pd.DataFrame({"id": [102, 102, 102, 103, 103, 103, 104], "val": [9,2,4,7,6,3,2], "dates": [pd.Timestamp(2002, 1, 1), pd.Timestamp(2002, 3, 3), pd.Timestamp(2003, 4, 4), pd.Timestamp(2003, 8, 9), pd.Timestamp(2005, 2, 3), pd.Timestamp(2005, 2, 8), pd.Timestamp(2005, 2, 3)]})

    id  val      dates
0  102    9 2002-01-01
1  102    2 2002-03-03
2  102    4 2003-04-04
3  103    7 2003-08-09
4  103    6 2005-02-03
5  103    3 2005-02-08
6  104    2 2005-02-03
Run Code Online (Sandbox Code Playgroud)

我想要实现的目标是让该列具有一个表示每个 id 连续日期之间的差异的dates列,其中该列中每个日期的第一个条目将是。话虽如此,生成的数据框应该是:diff_datesiddiff_dates0

df_processed_dates = pd.DataFrame({"id": [102, 102, …
Run Code Online (Sandbox Code Playgroud)

python datetime group-by dataframe pandas

2
推荐指数
1
解决办法
2990
查看次数