小编evi*_*ive的帖子

R 有 sphinx 域吗？

我想用 sphinx 记录 R 代码。正如我从这个页面理解的那样https://www.sphinx-doc.org/en/2.0/usage/restructedtext/domains.html#more-domains如果已经为 R 定义了一个域，但我找不到，那将是最简单的任何。因此我的问题是：R 是否有 sphinx 域？

r python-sphinx

evi*_*ive

2019 12-13

10
推荐指数

0
解决办法

616
查看次数

如何将元组列表转换为字典

我有一个元组列表,如下所示:

lst_of_tpls = [(1, 'test2', 3, 4),(11, 'test12', 13, 14),(21, 'test22', 23,24)]

Run Code Online (Sandbox Code Playgroud)

我想将它转换为字典,使它看起来像这样:

mykeys = ['ones', 'text', 'threes', 'fours']
mydict = {'ones': [1,11,21], 'text':['test2','test12','test22'], 
          'threes': [3,13,23], 'fours':[4,14,24]}

Run Code Online (Sandbox Code Playgroud)

我试图列举lst_of_tpls这样的:

mydict = dict.fromkeys(mykeys, [])
for count, (ones, text, threes, fours) in enumerate(lst_of_tpls):
    mydict['ones'].append(ones)

Run Code Online (Sandbox Code Playgroud)

但是这使得我希望在'ones'中看到的值也在其他"类别"中:

{'ones': [1, 11, 21], 'text': [1, 11, 21], 'threes': [1, 11, 21], 'fours': [1, 11, 21]}

Run Code Online (Sandbox Code Playgroud)

另外,我想保持mykeys灵活性.

python

evi*_*ive

2018 11-14

3
推荐指数

1
解决办法

76
查看次数

如何将摩根伯爵指纹计算为 numpy.array？

我想使用 rdkit 生成计数摩根指纹并将其输入 scikit Learn 模型（Python 中）。但是，我不知道如何将指纹生成为 numpy 数组。当我使用

from rdkit import Chem
from rdkit.Chem import AllChem
m = Chem.MolFromSmiles('c1cccnc1C')
fp = AllChem.GetMorganFingerprint(m, 2, useCounts=True)

Run Code Online (Sandbox Code Playgroud)

我得到一个需要转换的 UIntSparseIntVect 。我发现的唯一的东西是cDataStructs（参见： http: //rdkit.org/docs/source/rdkit.DataStructs.cDataStructs.html），但这目前不支持UIntSparseIntVect。

c++ python numpy scikit-learn rdkit

evi*_*ive

2022 02-24

3
推荐指数

1
解决办法

5929
查看次数

如何向 Pandas 数据框添加唯一标识符列？

我有一个带有长字符串列的熊猫数据框。我想添加一个唯一标识符。我需要保留所有行，但重复的字符串应该获得相同的 ID。

我想稍后在合并中使用这个新的唯一标识符。

让我们创建一个 df：

df = pd.DataFrame({
     'longstrings': ['aaaaaaaa', 'asdfasdf', 'bbbbbbbbb', 'asdfasdf', 'aaaaaaaa'], 
     'somevalue': [1, 2, 3, 4, 5]})

Run Code Online (Sandbox Code Playgroud)

期望的输出：

  longstrings  somevalue  unique_ID
0    aaaaaaaa          1          0
1    asdfasdf          2          1
2   bbbbbbbbb          3          2
3    asdfasdf          4          1
4    aaaaaaaa          5          0

Run Code Online (Sandbox Code Playgroud)

我曾尝试使用 groupby：

grouped = df.groupby('longstrings')
grouped.transform(lambda ???)

Run Code Online (Sandbox Code Playgroud)

我只是不知道如何获得一个好的 lambda 函数。是否grouped有某种指标？

我还考虑过在我的字符串上使用哈希函数。但是，这不会创建方便的小数字。另外，哈希冲突的可能性有多大？我的字符串有时非常相似。

python-3.x pandas pandas-groupby

evi*_*ive

lucky-day

1
推荐指数

1
解决办法

4685
查看次数

标签统计

python ×2

c++ ×1

numpy ×1

pandas ×1

pandas-groupby ×1

python-3.x ×1

python-sphinx ×1

r ×1

rdkit ×1

scikit-learn ×1

R 有 sphinx 域吗？

如何将元组列表转换为字典

如何将摩根伯爵指纹计算为 numpy.array？

如何向 Pandas 数据框添加唯一标识符列？

标签 统计

小编evi_ive的帖子

标签统计