小编not*_*ing的帖子

使用pandas,计算Cramér的系数矩阵

我有一个数据框,pandas其中包含在维基百科文章中计算的指标.nation文章所涉及的两个分类变量,以及lang取自哪种语言维基百科.对于单个指标,我想看看国家和语言变量的相关程度,我相信这是使用Cramer的统计数据完成的.

index   qid     subj    nation  lang    metric          value
5   Q3488399    economy     cdi     fr  informativeness 0.787117
6   Q3488399    economy     cdi     fr  referencerate   0.000945
7   Q3488399    economy     cdi     fr  completeness    43.200000
8   Q3488399    economy     cdi     fr  numheadings     11.000000
9   Q3488399    economy     cdi     fr  articlelength   3176.000000
10  Q7195441    economy     cdi     en  informativeness 0.626570
11  Q7195441    economy     cdi     en  referencerate   0.008610
12  Q7195441    economy     cdi     en  completeness    6.400000
13  Q7195441    economy     cdi     en  numheadings     7.000000
14  Q7195441    economy …
Run Code Online (Sandbox Code Playgroud)

python statistics pandas

22
推荐指数
4
解决办法
1万
查看次数

大熊猫绘制时间序列图,在选定日期显示垂直线

考虑这个时间序列,维基百科类别中的累计编辑数.

In [555]:
cum_edits.head()
Out[555]:
2001-08-31 23:37:28    1
2001-09-01 05:09:28    2
2001-09-18 10:01:17    3
2001-10-27 06:52:45    4
2001-10-27 07:01:45    5
Name: edits, dtype: int64
In [565]:
cum_edits.tail()
Out[565]:
2014-01-29 16:05:15    53254
2014-01-29 16:07:09    53255
2014-01-29 16:11:43    53256
2014-01-29 18:09:44    53257
2014-01-29 18:12:09    53258
Name: edits, dtype: int64
Run Code Online (Sandbox Code Playgroud)

我要像这样绘制图形:

In [567]:

cum_edits.plot()

Out[567]:

<matplotlib.axes.AxesSubplot at 0x1359c810>
Run Code Online (Sandbox Code Playgroud)

累积编辑

我希望在每次total_edits/n ; e.g. n=10编辑后也绘制垂直线.我很容易计算出来.

In [568]:

dates

Out[568]:

[Timestamp('2006-06-04 04:46:22', tz=None),
 Timestamp('2007-01-28 23:53:02', tz=None),
 Timestamp('2007-09-16 10:52:02', tz=None),
 Timestamp('2008-04-28 21:20:40', tz=None),
 Timestamp('2009-04-12 22:07:13', tz=None), …
Run Code Online (Sandbox Code Playgroud)

python matplotlib pandas

18
推荐指数
1
解决办法
1万
查看次数

反应传单标记点击的任意功能

React-leaflet 很好地提供了将内容放入Popup标记中的能力。

例如在我的例子中:

            <Marker position={[item.lat, item.lng]} key={item.machineid}>
              <Popup maxWidth={720}>
                <ItemGrid machineid={item.machineid}
                          username={this.props.username}/>
              </Popup>
            </Marker>
Run Code Online (Sandbox Code Playgroud)

但是,如果此内容太大,则可能会很笨拙,尤其是在移动设备上。我想在单击标记时激活(引导程序)模态界面。有没有办法在反应传单中做到这一点?

leaflet reactjs react-leaflet

7
推荐指数
2
解决办法
9335
查看次数

在网络x中有效地枚举DiGraph的所有简单路径

我试图对杜威十进制分类进行一些图形分析,这样我就可以在两本书之间做一个距离.DDC有几个关系:"层次结构","看也","类别 - 其他",这里我用不同的颜色代表它们.由于这些关系不对称,您会注意到我们有一个有向图.下面是所有顶点距离394.1最多4个边的图的图片.

示例图

分类A和B之间的距离度量应该是A和B之间的最短路径.然而,颜色没有固有的加权值或偏好.但是用户会提供一个.所以给出一个权重字典,例如:

weights_dict_test = {'notational_hiearchy':1,
                'see_reference':0.5, 
                'class_elsewhere':2}
Run Code Online (Sandbox Code Playgroud)

我想返回加权最短路径.我认为如果我可以预处理两个节点之间的所有简单路径,然后在给定权重dict的情况下找到最短的路径,那就不会有问题了.但是,因为该图包含> 50,000个节点.计算nx.all_simple_paths(G, a, b)24小时后计算没有返回.是否有任何并行发现的建议all_simple_paths.或者一种计算最短路径的技术weights_dict,但不涉及计算all_simple_paths

python optimization graph-theory shortest-path networkx

5
推荐指数
1
解决办法
1557
查看次数