小编Nei*_*eil的帖子

如何在Python中提取mongoDB文档的最后一个objectID?

我想从 python 中的集合中提取文档的最后一个 objectID 并将其存储在 python 对象中。

我正在做这样的事情

db.dataset2.find().sort( {'_id': -1 } ).limit(1);
Run Code Online (Sandbox Code Playgroud)

但这给了我一个错误。

TypeError: if no direction is specified, key_or_list must be an instance of the list
Run Code Online (Sandbox Code Playgroud)

请帮忙。

python mongodb pymongo mongodb-query

1
推荐指数
1
解决办法
1627
查看次数

如何在R中获得ping响应

我有一个具有域名列的数据框.我想通过ping他们的域名来查看存在哪个域.我可以通过以下函数获得单独的ping响应.

ping <- function(x,stderr=FALSE,stdout=FALSE,...){
pingvec <- system2("ping",x,
                 stderr=FALSE,
                 stdout=FALSE,...)
if (pingvec == 0) TRUE else FALSE
}



ping("google.com")
[1] TRUE
Run Code Online (Sandbox Code Playgroud)

是否有任何R包,我可以获得整个列的ping响应,其中包含数千个域名.

r

1
推荐指数
1
解决办法
408
查看次数

在r中将多个日期格式转换为一个

我正在处理具有多种日期格式的凌乱excel文件

2016-10-17T12:38:41Z 
Mon Oct 17 08:03:08 GMT 2016
10-Sep-15
13-Oct-09
18-Oct-2016 05:42:26 UTC
Run Code Online (Sandbox Code Playgroud)

我想以yyyy-mm-dd格式转换以上所有内容.我正在使用以下代码进行转换,但很多值都是NA.

as.Date(parse_date_time(df$date,c('mdy', 'ymd_hms','a b d HMS y','d b y HMS')))
Run Code Online (Sandbox Code Playgroud)

我怎么能一起做所有这些.我已经读过类似案例的其他主题,但似乎没有什么能适用于我的案例.请帮忙

r date

1
推荐指数
1
解决办法
198
查看次数

带有多列的熊猫数据透视表

我在熊猫中有以下数据框

  date        prod    hourly_bucket      tank      trans      flag     
  01-01-2019  TP      05:00:00-06:00:00  2         Preset     Peak
  01-01-2019  TP      05:00:00-06:00:00  2         Preset     Peak
  01-01-2019  TP      05:00:00-06:00:00  2         Non Preset Peak
  02-01-2019  TP      05:00:00-06:00:00  2         Preset     Lean
  02-01-2019  TP      05:00:00-06:00:00  2         Preset     Lean
  02-01-2019  TP      05:00:00-06:00:00  2         Non Preset Lean
Run Code Online (Sandbox Code Playgroud)

我想要的数据框将是在日级别和槽级别的聚合,然后计算几个小时内的Preset,Non-Preset交易次数Lean and Peak

  date       tank   Lean_Non_Preset  Lean_Preset  Peak_Non_Preset  Peak_Preset
  01-01-2019 2      1                2            1                2
Run Code Online (Sandbox Code Playgroud)

我正在熊猫后面

 lean_peak_preset_cnt = df.pivot_table(index=['date','tank'], columns=['flag'],values=['trans'],aggfunc='count').reset_index()  
Run Code Online (Sandbox Code Playgroud)

但这没有给我所需的解决方案

python pandas

1
推荐指数
1
解决办法
2125
查看次数

如何在pandas中找到groupby总数的百分比

我在熊猫中有以下数据框

  Date        tank     hose     quantity     count      set     flow
  01-01-2018  1        1        20           100        211     12.32
  01-01-2018  1        2        20           200        111     22.32
  01-01-2018  1        3        20           200        123     42.32
  02-01-2018  1        1        10           100        211     12.32
  02-01-2018  1        2        10           200        111     22.32
  02-01-2018  1        3        10           200        123     42.32
Run Code Online (Sandbox Code Playgroud)

我想计算quantitycount分组的百分比Datetank。我想要的数据框

  Date        tank   hose   quantity   count   set   flow    perc_quant  perc_count
  01-01-2018  1        1    20         100     211   12.32   33.33       20
  01-01-2018  1        2 …
Run Code Online (Sandbox Code Playgroud)

python pandas

1
推荐指数
1
解决办法
4856
查看次数

将两个csv文件合并到pentaho勺子中的一个csv文件中

我想将多个CSV文件合并到pentaho勺子中的一个CSV文件中.例如

file1.txt有值

姓名,地址

美国广播公司,浦那

file2.txt有值

电子邮件,年龄

ABC @ gmail.com,25

现在我希望输出在一个csv文件中

姓名,地址,电子邮件,年龄

请在这件事上给予我帮助..

csv etl pentaho

0
推荐指数
1
解决办法
4718
查看次数

如何在r中的一行数据帧中查找正值和负值的计数

我在r中有一个数据帧

      Loss1.       Loss2.         Loss3
     -456.             -2345.         -1290
       345.           -342.            234
Run Code Online (Sandbox Code Playgroud)

我想计算连续出现正值和负值的次数.预期产量如下

      Loss1.      Loss2.      Loss3.   Neg_count.  Pos_count
      -456.       -2345.      -1290.        3.                  0
       345.         -342.          234.         1                  2
Run Code Online (Sandbox Code Playgroud)

我尝试使用rowums,但它给了我一些行.我怎么能在r?

r

0
推荐指数
1
解决办法
938
查看次数

比较两个数据帧列

我在r中有两个数据帧

df1

NO     QC1     QC2      QC3     Total 
123      8       8        8     24 
124      9       8        8     25
125      9       9        9     27

df2

NO     QC1     QC2      QC3     Total 
123      7       7        7      21 
124      9       10       8      27
125      10      10       10     30
Run Code Online (Sandbox Code Playgroud)

我想将上面的数据帧与总数进行比较.将保留最大总数的行.我想要的数据帧如下

NO     QC1     QC2      QC3    Total 
123     8       8        8      24 
124     9       10       8      27
125     10      10       10     30
Run Code Online (Sandbox Code Playgroud)

NO列在两个数据帧中都是唯一的.我怎么能在R?

r

0
推荐指数
1
解决办法
57
查看次数

按 dplyr 中的重复行进行分组

我在 R 中有以下数据框

   Ship_No     Number     
    1244         1
    1244         2
    1244         3
    1244         1
    1245         10
    1245         10
    1245         15
    1245         20
    1245         20
Run Code Online (Sandbox Code Playgroud)

想要找到重复的Numbergroup by ship_No。我想要的数据框是

   Ship_no      Number
    1244          1
    1245         10,20
Run Code Online (Sandbox Code Playgroud)

仅以逗号分隔重复的数字。

r

0
推荐指数
1
解决办法
5986
查看次数

如何在Python中根据条件删除列表元素

我在python中有以下二维数组

[[(0, 0, 0), 337.94174378689814],
[(0, 0, 1), 339.92776762374007],
[(0, 0, 2), 338.78632729456444],
[(0, 1, 0), 344.85997106879347],
[(0, 1, 1), 331.6819890120493],
[0, 0]]
Run Code Online (Sandbox Code Playgroud)

我想删除其中有 0 个值的元素输出是ARIMA order and corresponding AIC score我从以下代码生成的

a = [[0]*2 for x in range(27)]

for i in range(len(pdq)):
   try:
      mod =  ARIMA(train, order = pdq[i]) 
      results = mod.fit(disp=False)
      a[i][0] = pdq[i]
      a[i][1] = results.aic
      if a[i][1] == 0:
         a.remove(a[i])
   except:
       continue
Run Code Online (Sandbox Code Playgroud)

我想删除数组中同时存在的值0。我怎样才能做到if condition described above

python list

0
推荐指数
3
解决办法
2万
查看次数

如何从年和月减去月份

我想从年份和月份格式中减去给定日期的月份.

global_date = "2017-01"
Run Code Online (Sandbox Code Playgroud)

我正在使用zoo库将其转换如下:

as.yearmon(global_date) - 0.1
Run Code Online (Sandbox Code Playgroud)

但它给了我2016年11月,我希望它为'201612'

我怎么能在R?

r zoo

-1
推荐指数
1
解决办法
1541
查看次数

用于计算超出R中特定值的数据帧中的观察数量

我有一个数字框,数字列在R中.我想看看数据框每列中有多少值超过某个阈值.(例如标准值大于+ -2.5)这是我想要显示的输出

产量

假设我的数据框中的所有列都是数字的,我可以使用哪些函数或哪些函数组合来产生类似的结果?

提前致谢 :)

r summarization

-5
推荐指数
1
解决办法
642
查看次数

标签 统计

r ×7

python ×4

pandas ×2

csv ×1

date ×1

etl ×1

list ×1

mongodb ×1

mongodb-query ×1

pentaho ×1

pymongo ×1

summarization ×1

zoo ×1