小编dfr*_*kow的帖子

使用PANDAS中的value_counts()出现零次/频率

我有一个表格,其中包含以下格式在每个日期销售的日期和各种汽车(这些只是许多列中的两个):

DATE       CAR
2012/01/01 BMW
2012/01/01 Mercedes Benz
2012/01/01 BMW
2012/01/02 Volvo
2012/01/02 BMW
2012/01/03 Mercedes Benz
...
2012/09/01 BMW
2012/09/02 Volvo
Run Code Online (Sandbox Code Playgroud)

我执行以下操作以查找每天销售的BMW汽车数量

df[df.CAR=='BMW']['DATE'].value_counts()
Run Code Online (Sandbox Code Playgroud)

结果是这样的:

2012/07/04 15
2012/07/08 8
...
2012/01/02 1
Run Code Online (Sandbox Code Playgroud)

但有些日子里没有宝马车出售.结果,与上面一起,我想要宝马零出现的日子.因此,期望的结果是:

2012/07/04 15
2012/07/08 8
...
2012/01/02 1
2012/01/09 0
2012/08/11 0
Run Code Online (Sandbox Code Playgroud)

我能做些什么才能达到这样的效果?

python numpy pandas

9
推荐指数
1
解决办法
1128
查看次数

如何使用jquery隐藏父元素?

假设以下HTML:

<li class="fooli">
   <a class="foo" href="javascript:foo(this);">anchor</a>
</li>
<li class="fooli">
   <a class="foo" href="javascript:foo(this);">anchor</a>
</li>
Run Code Online (Sandbox Code Playgroud)

和以下Javascript(使用jquery 1.3.2):

function foo(anchor) {
  alert($(anchor).attr('href'));
}
Run Code Online (Sandbox Code Playgroud)

我的目标是能够隐藏点击的li,但我无法为它们分配唯一ID.因此,我想通过$(anchor).parent().hide()之类的东西来定位(即识别点击的特定锚点).

但是,上面的警告返回"undefined",所以对我来说,我甚至没有正确的jquery对象.

我怎么弄清楚$(锚)是什么对象?特别是,我如何看到它具有什么属性,它有什么类,它是什么HTML元素,等等?

html javascript jquery

8
推荐指数
2
解决办法
2万
查看次数

如何以时区感知的方式在Django表单中使用DateField?

我在Django 1.8模型中有一个DateField,类似于:

from django.db import models
birth_date = models.DateField()
Run Code Online (Sandbox Code Playgroud)

当它进入表单时,我会找回一个"天真"的对象:

birth_date = the_form.cleaned_data['birth_date']
Run Code Online (Sandbox Code Playgroud)

在调试器中打印birth_date:

ipdb> birth_date
datetime.date(2015, 6, 7)
Run Code Online (Sandbox Code Playgroud)

然后,当这个东西被保存到数据库时,我收到一个警告,正如文档所承诺的那样:

RuntimeWarning: SQLite received a naive datetime (2015-06-08 01:08:21.470719) while time zone support is active.
Run Code Online (Sandbox Code Playgroud)

我已经阅读了一些 关于此的文章,我仍然感到困惑.这个约会怎么办?

我应该将其转换为DateTime,使其能够识别时区,然后返回日期吗?我应该将模型设为DateTimeField并放弃DateFields吗?这里的最佳做法是什么?

django django-timezone

8
推荐指数
1
解决办法
2176
查看次数

单元测试 Htmx?

如何为Htmx编写单元测试?

堆栈溢出不允许我发布这么短的问题,所以这一段说我没有看到关于此的文档或库。

编辑:具体来说,我希望在 Django 中进行单元测试。

unit-testing htmx

8
推荐指数
2
解决办法
1652
查看次数

Jenkins(持续构建)可以查明导致构建失败的提交吗?

Jenkins说构建成功或失败,但它能识别导致构建失败的确切提交(和作者!)吗?

这个问题似乎表明没有.

编辑:从我与Pace的交流:

我所看到的是"包括罪犯",这是自上次构建以来的每个人.我不希望这样.我想要罪魁祸首,Jenkins正在进行二元搜索.如果Jenkins做了两次构建10次提交,我不想要10个可能的罪魁祸首,我希望它找到一个.

我还没有听说过怎么做.

jenkins

7
推荐指数
1
解决办法
4036
查看次数

如何在Presto中的bigint上运行md5()?

select md5(15)
Run Code Online (Sandbox Code Playgroud)

回报

Query failed (#20160818_193909_00287_8zejd): line 1:8:
 Unexpected parameters (bigint) for function md5. Expected: md5(varbinary)
Run Code Online (Sandbox Code Playgroud)

如何散列15并获取字符串?我想随机选择16项中的1项,例如where md5(id) like '%3'.

仅供参考我可能是0.147版本,不知道怎么说.仅供参考我找到了这个公关.md5将是跨平台的,这很好,但我会采用Presto相关的哈希函数,相对统一地传播ids.我想我可以实现自己的线性公式.看起来很尴尬.

sql md5 presto

7
推荐指数
1
解决办法
5246
查看次数

在ggplot2中更改geom_point()的默认点大小?

在某些版本中,点数geom_point变大了.它可能是2.0:"geom_point()现在使用形状19而不是16".

如何使geom_point中的默认点像以前一样小?

编辑:如何在不添加代码的情况下更改所有绘图?也就是默认值.我查看了get_theme()并没有看到关于点的任何信息.

r ggplot2

7
推荐指数
1
解决办法
2645
查看次数

使用示例生成语法的工具?

这个答案显示了一个使用解析器生成器查看文本以查找某些感兴趣模式的漂亮示例。在那个例子中,它是产品价格。

有谁知道在给定训练示例(我想要的文档 + 信息)的情况下生成语法的工具?我找到了几篇论文,但没有找到工具。我浏览了ANTLR文档,但它涉及语法;“识别器”将语法作为输入,而不是训练示例。

grammar text-mining

6
推荐指数
1
解决办法
1362
查看次数

如何在R中"命名"一个命名向量?

假设我在R中有这个命名向量:

foo=vector()
foo['a']=1
foo['b']=2
foo['c']=3
Run Code Online (Sandbox Code Playgroud)

我如何最干净地制作另一个只有'a'和'c'元素的命名向量?

如果这是一个带有"name"列和一列"value"的数据框,我可以使用

subset(df, name %in% c('a', 'b'))
Run Code Online (Sandbox Code Playgroud)

这很好,因为子集可以评估任何布尔表达式,因此它非常灵活.

r

6
推荐指数
1
解决办法
2565
查看次数

从具有多列的长到大数据

关于如何顺利地从foo到foo2(最好是使用tidyr或reshape2包)的建议?

这有点像这个问题,但不完全是我想的,因为我不想自动编号列,只需加宽多列.它也有点像这个问题,但同样,我不认为我希望列与行答案中的行值一致.或者,这个问题的有效答案是让我相信它与其他人完全一样.第二个问题"两个dcasts加合并"的解决方案现在最具吸引力,因为它对我来说是可以理解的.

FOO:

foo = data.frame(group=c('a', 'a', 'b', 'b', 'c', 'c'),
                  times=c('before', 'after', 'before', 'after', 'before', 'after'),
                  action_rate=c(0.1,0.15, 0.2, 0.18,0.3, 0.35),
                  num_users=c(100, 100, 200, 200, 300, 300))
foo <- transform(foo,
                 action_rate_c95 = 1.95 * sqrt(action_rate*(1-action_rate)/num_users))

> foo
  group  times action_rate num_users action_rate_c95
1     a before        0.10       100      0.05850000
2     a  after        0.15       100      0.06962893
3     b before        0.20       200      0.05515433
4     b  after        0.18       200      0.05297400
5     c before        0.30       300      0.05159215
6     c  after        0.35 …
Run Code Online (Sandbox Code Playgroud)

r reshape2 tidyr

6
推荐指数
3
解决办法
3169
查看次数