我有一个数据框,pandas其中包含在维基百科文章中计算的指标.nation文章所涉及的两个分类变量,以及lang取自哪种语言维基百科.对于单个指标,我想看看国家和语言变量的相关程度,我相信这是使用Cramer的统计数据完成的.
index qid subj nation lang metric value
5 Q3488399 economy cdi fr informativeness 0.787117
6 Q3488399 economy cdi fr referencerate 0.000945
7 Q3488399 economy cdi fr completeness 43.200000
8 Q3488399 economy cdi fr numheadings 11.000000
9 Q3488399 economy cdi fr articlelength 3176.000000
10 Q7195441 economy cdi en informativeness 0.626570
11 Q7195441 economy cdi en referencerate 0.008610
12 Q7195441 economy cdi en completeness 6.400000
13 Q7195441 economy cdi en numheadings 7.000000
14 Q7195441 economy …Run Code Online (Sandbox Code Playgroud) 考虑这个时间序列,维基百科类别中的累计编辑数.
In [555]:
cum_edits.head()
Out[555]:
2001-08-31 23:37:28 1
2001-09-01 05:09:28 2
2001-09-18 10:01:17 3
2001-10-27 06:52:45 4
2001-10-27 07:01:45 5
Name: edits, dtype: int64
In [565]:
cum_edits.tail()
Out[565]:
2014-01-29 16:05:15 53254
2014-01-29 16:07:09 53255
2014-01-29 16:11:43 53256
2014-01-29 18:09:44 53257
2014-01-29 18:12:09 53258
Name: edits, dtype: int64
Run Code Online (Sandbox Code Playgroud)
我要像这样绘制图形:
In [567]:
cum_edits.plot()
Out[567]:
<matplotlib.axes.AxesSubplot at 0x1359c810>
Run Code Online (Sandbox Code Playgroud)

我希望在每次total_edits/n ; e.g. n=10编辑后也绘制垂直线.我很容易计算出来.
In [568]:
dates
Out[568]:
[Timestamp('2006-06-04 04:46:22', tz=None),
Timestamp('2007-01-28 23:53:02', tz=None),
Timestamp('2007-09-16 10:52:02', tz=None),
Timestamp('2008-04-28 21:20:40', tz=None),
Timestamp('2009-04-12 22:07:13', tz=None), …Run Code Online (Sandbox Code Playgroud) React-leaflet 很好地提供了将内容放入Popup标记中的能力。
例如在我的例子中:
<Marker position={[item.lat, item.lng]} key={item.machineid}>
<Popup maxWidth={720}>
<ItemGrid machineid={item.machineid}
username={this.props.username}/>
</Popup>
</Marker>
Run Code Online (Sandbox Code Playgroud)
但是,如果此内容太大,则可能会很笨拙,尤其是在移动设备上。我想在单击标记时激活(引导程序)模态界面。有没有办法在反应传单中做到这一点?
我试图对杜威十进制分类进行一些图形分析,这样我就可以在两本书之间做一个距离.DDC有几个关系:"层次结构","看也","类别 - 其他",这里我用不同的颜色代表它们.由于这些关系不对称,您会注意到我们有一个有向图.下面是所有顶点距离394.1最多4个边的图的图片.

分类A和B之间的距离度量应该是A和B之间的最短路径.然而,颜色没有固有的加权值或偏好.但是用户会提供一个.所以给出一个权重字典,例如:
weights_dict_test = {'notational_hiearchy':1,
'see_reference':0.5,
'class_elsewhere':2}
Run Code Online (Sandbox Code Playgroud)
我想返回加权最短路径.我认为如果我可以预处理两个节点之间的所有简单路径,然后在给定权重dict的情况下找到最短的路径,那就不会有问题了.但是,因为该图包含> 50,000个节点.计算nx.all_simple_paths(G, a, b)24小时后计算没有返回.是否有任何并行发现的建议all_simple_paths.或者一种计算最短路径的技术weights_dict,但不涉及计算all_simple_paths?
python ×3
pandas ×2
graph-theory ×1
leaflet ×1
matplotlib ×1
networkx ×1
optimization ×1
reactjs ×1
statistics ×1