我正在构建一个用于实现PageRank算法的转换矩阵.我怎么能使用numpy来确保列加起来一个.
例如:
1 1 1
1 1 1
1 1 1
Run Code Online (Sandbox Code Playgroud)
应该归一化为
.33 .33 .33
.33 .33 .33
.33 .33 .33
Run Code Online (Sandbox Code Playgroud) 我正在接收以下格式的数据:
tail head
P01106 Q09472
P01106 Q13309
P62136 Q13616
P11831 P18146
P13569 P20823
P20823 P01100
...
Run Code Online (Sandbox Code Playgroud)
有没有一种很好的方法将此数据格式化为带有numpy数组的图形?我希望使用此图计算PageRank。
到目前为止,我有
import numpy as np
data = np.genfromtxt('wnt_edges.txt', skip_header=1, dtype=str)
Run Code Online (Sandbox Code Playgroud)
我当时在考虑使用Python中的“表示图形(数据结构)”中的图形数据结构,但在这种情况下似乎没有任何意义,因为我将进行矩阵乘法。
我有一个看起来像这样的 sqlalchemy 查询。
首先,我按时间戳对 Pomo 模型进行分组,然后按 Pomo 的创建日期分组。
db.session.query(Pomo.timestamp, sa.func.count(Pomo.id))\
.group_by(sa.func.date(Pomo.timestamp)).all()
Run Code Online (Sandbox Code Playgroud)
这将返回如下所示的数据
[(datetime.datetime(2018, 3, 2, 0, 0), 1),
(datetime.datetime(2018, 3, 7, 0, 0), 1),
(datetime.datetime(2018, 3, 8, 0, 0), 6)]
Run Code Online (Sandbox Code Playgroud)
如何填写日期以便输出类似于
[(datetime.datetime(2018, 3, 2, 0, 0), 1),
(datetime.datetime(2018, 3, 3, 0, 0), 0),
(datetime.datetime(2018, 3, 4, 0, 0), 0),
(datetime.datetime(2018, 3, 5, 0, 0), 0),
(datetime.datetime(2018, 3, 6, 0, 0), 0),
(datetime.datetime(2018, 3, 7, 0, 0), 1),
(datetime.datetime(2018, 3, 8, 0, 0), 6)]
Run Code Online (Sandbox Code Playgroud) 我试图将一系列字典转换为数据帧
0 {'neg': 0.0, 'neu': 0.462, 'pos': 0.538}
1 {'neg': 0.0, 'neu': 0.609, 'pos': 0.391}
2 {'neg': 0.043, 'neu': 0.772, 'pos': 0.185}
3 {'neg': 0.035, 'neu': 0.765, 'pos': 0.2}
4 {'neg': 0.0, 'neu': 0.655, 'pos': 0.345}
5 {'neg': 0.0, 'neu': 0.631, 'pos': 0.369}
Run Code Online (Sandbox Code Playgroud)
我希望生成的DataFrame让每个键都是它自己的列.
neg neu pos
0.0. 0.462 0.538
0.0 0.609 0.391
.. .. ..
Run Code Online (Sandbox Code Playgroud)
我怎么能用熊猫来做到这一点?
python ×4
numpy ×2
arrays ×1
dictionary ×1
matrix ×1
pagerank ×1
pandas ×1
sql ×1
sqlalchemy ×1