小编evi*_*ive的帖子

R 有 sphinx 域吗?

我想用 sphinx 记录 R 代码。正如我从这个页面理解的那样https://www.sphinx-doc.org/en/2.0/usage/restructedtext/domains.html#more-domains如果已经为 R 定义了一个域,但我找不到,那将是最简单的任何。因此我的问题是:R 是否有 sphinx 域?

r python-sphinx

10
推荐指数
0
解决办法
616
查看次数

如何将元组列表转换为字典

我有一个元组列表,如下所示:

lst_of_tpls = [(1, 'test2', 3, 4),(11, 'test12', 13, 14),(21, 'test22', 23,24)]
Run Code Online (Sandbox Code Playgroud)

我想将它转换为字典,使它看起来像这样:

mykeys = ['ones', 'text', 'threes', 'fours']
mydict = {'ones': [1,11,21], 'text':['test2','test12','test22'], 
          'threes': [3,13,23], 'fours':[4,14,24]}
Run Code Online (Sandbox Code Playgroud)

我试图列举lst_of_tpls这样的:

mydict = dict.fromkeys(mykeys, [])
for count, (ones, text, threes, fours) in enumerate(lst_of_tpls):
    mydict['ones'].append(ones)
Run Code Online (Sandbox Code Playgroud)

但是这使得我希望在'ones'中看到的值也在其他"类别"中:

{'ones': [1, 11, 21], 'text': [1, 11, 21], 'threes': [1, 11, 21], 'fours': [1, 11, 21]}
Run Code Online (Sandbox Code Playgroud)

另外,我想保持mykeys灵活性.

python

3
推荐指数
1
解决办法
76
查看次数

如何将摩根伯爵指纹计算为 numpy.array?

我想使用 rdkit 生成计数摩根指纹并将其输入 scikit Learn 模型(Python 中)。但是,我不知道如何将指纹生成为 numpy 数组。当我使用

from rdkit import Chem
from rdkit.Chem import AllChem
m = Chem.MolFromSmiles('c1cccnc1C')
fp = AllChem.GetMorganFingerprint(m, 2, useCounts=True)
Run Code Online (Sandbox Code Playgroud)

我得到一个需要转换的 UIntSparseIntVect 。我发现的唯一的东西是cDataStructs(参见: http: //rdkit.org/docs/source/rdkit.DataStructs.cDataStructs.html),但这目前不支持UIntSparseIntVect。

c++ python numpy scikit-learn rdkit

3
推荐指数
1
解决办法
5929
查看次数

如何向 Pandas 数据框添加唯一标识符列?

我有一个带有长字符串列的熊猫数据框。我想添加一个唯一标识符。我需要保留所有行,但重复的字符串应该获得相同的 ID。

我想稍后在合并中使用这个新的唯一标识符。

让我们创建一个 df:

df = pd.DataFrame({
     'longstrings': ['aaaaaaaa', 'asdfasdf', 'bbbbbbbbb', 'asdfasdf', 'aaaaaaaa'], 
     'somevalue': [1, 2, 3, 4, 5]})
Run Code Online (Sandbox Code Playgroud)

期望的输出:

  longstrings  somevalue  unique_ID
0    aaaaaaaa          1          0
1    asdfasdf          2          1
2   bbbbbbbbb          3          2
3    asdfasdf          4          1
4    aaaaaaaa          5          0
Run Code Online (Sandbox Code Playgroud)

我曾尝试使用 groupby:

grouped = df.groupby('longstrings')
grouped.transform(lambda ???)
Run Code Online (Sandbox Code Playgroud)

我只是不知道如何获得一个好的 lambda 函数。是否grouped有某种指标?

我还考虑过在我的字符串上使用哈希函数。但是,这不会创建方便的小数字。另外,哈希冲突的可能性有多大?我的字符串有时非常相似。

python-3.x pandas pandas-groupby

1
推荐指数
1
解决办法
4685
查看次数