小编Nei*_*eil的帖子

如何在Python中提取mongoDB文档的最后一个objectID？

我想从 python 中的集合中提取文档的最后一个 objectID 并将其存储在 python 对象中。

我正在做这样的事情

db.dataset2.find().sort( {'_id': -1 } ).limit(1);

Run Code Online (Sandbox Code Playgroud)

但这给了我一个错误。

TypeError: if no direction is specified, key_or_list must be an instance of the list

Run Code Online (Sandbox Code Playgroud)

请帮忙。

python mongodb pymongo mongodb-query

Nei*_*eil

2021 06-06

1
推荐指数

1
解决办法

1627
查看次数

如何在R中获得ping响应

我有一个具有域名列的数据框.我想通过ping他们的域名来查看存在哪个域.我可以通过以下函数获得单独的ping响应.

ping <- function(x,stderr=FALSE,stdout=FALSE,...){
pingvec <- system2("ping",x,
                 stderr=FALSE,
                 stdout=FALSE,...)
if (pingvec == 0) TRUE else FALSE
}



ping("google.com")
[1] TRUE

Run Code Online (Sandbox Code Playgroud)

是否有任何R包,我可以获得整个列的ping响应,其中包含数千个域名.

Nei*_*eil

lucky-day

1
推荐指数

1
解决办法

408
查看次数

在r中将多个日期格式转换为一个

我正在处理具有多种日期格式的凌乱excel文件

2016-10-17T12:38:41Z 
Mon Oct 17 08:03:08 GMT 2016
10-Sep-15
13-Oct-09
18-Oct-2016 05:42:26 UTC

Run Code Online (Sandbox Code Playgroud)

我想以yyyy-mm-dd格式转换以上所有内容.我正在使用以下代码进行转换,但很多值都是NA.

as.Date(parse_date_time(df$date,c('mdy', 'ymd_hms','a b d HMS y','d b y HMS')))

Run Code Online (Sandbox Code Playgroud)

我怎么能一起做所有这些.我已经读过类似案例的其他主题,但似乎没有什么能适用于我的案例.请帮忙

r date

Nei*_*eil

lucky-day

1
推荐指数

1
解决办法

198
查看次数

带有多列的熊猫数据透视表

我在熊猫中有以下数据框

  date        prod    hourly_bucket      tank      trans      flag     
  01-01-2019  TP      05:00:00-06:00:00  2         Preset     Peak
  01-01-2019  TP      05:00:00-06:00:00  2         Preset     Peak
  01-01-2019  TP      05:00:00-06:00:00  2         Non Preset Peak
  02-01-2019  TP      05:00:00-06:00:00  2         Preset     Lean
  02-01-2019  TP      05:00:00-06:00:00  2         Preset     Lean
  02-01-2019  TP      05:00:00-06:00:00  2         Non Preset Lean

Run Code Online (Sandbox Code Playgroud)

我想要的数据框将是在日级别和槽级别的聚合，然后计算几个小时内的Preset,Non-Preset交易次数Lean and Peak

  date       tank   Lean_Non_Preset  Lean_Preset  Peak_Non_Preset  Peak_Preset
  01-01-2019 2      1                2            1                2

Run Code Online (Sandbox Code Playgroud)

我正在熊猫后面

 lean_peak_preset_cnt = df.pivot_table(index=['date','tank'], columns=['flag'],values=['trans'],aggfunc='count').reset_index()

Run Code Online (Sandbox Code Playgroud)

但这没有给我所需的解决方案

python pandas

Nei*_*eil

2019 01-11

1
推荐指数

1
解决办法

2125
查看次数

如何在pandas中找到groupby总数的百分比

我在熊猫中有以下数据框

  Date        tank     hose     quantity     count      set     flow
  01-01-2018  1        1        20           100        211     12.32
  01-01-2018  1        2        20           200        111     22.32
  01-01-2018  1        3        20           200        123     42.32
  02-01-2018  1        1        10           100        211     12.32
  02-01-2018  1        2        10           200        111     22.32
  02-01-2018  1        3        10           200        123     42.32

Run Code Online (Sandbox Code Playgroud)

我想计算quantity和count分组的百分比Date和tank。我想要的数据框

  Date        tank   hose   quantity   count   set   flow    perc_quant  perc_count
  01-01-2018  1        1    20         100     211   12.32   33.33       20
  01-01-2018  1        2 …

Run Code Online (Sandbox Code Playgroud)

python pandas

Nei*_*eil

lucky-day

1
推荐指数

1
解决办法

4856
查看次数

将两个csv文件合并到pentaho勺子中的一个csv文件中

我想将多个CSV文件合并到pentaho勺子中的一个CSV文件中.例如

file1.txt有值

姓名,地址

美国广播公司,浦那

file2.txt有值

电子邮件,年龄

ABC @ gmail.com,25

现在我希望输出在一个csv文件中

姓名,地址,电子邮件,年龄

请在这件事上给予我帮助..

csv etl pentaho

Nei*_*eil

lucky-day

0
推荐指数

1
解决办法

4718
查看次数

如何在r中的一行数据帧中查找正值和负值的计数

我在r中有一个数据帧

      Loss1.       Loss2.         Loss3
     -456.             -2345.         -1290
       345.           -342.            234

Run Code Online (Sandbox Code Playgroud)

我想计算连续出现正值和负值的次数.预期产量如下

      Loss1.      Loss2.      Loss3.   Neg_count.  Pos_count
      -456.       -2345.      -1290.        3.                  0
       345.         -342.          234.         1                  2

Run Code Online (Sandbox Code Playgroud)

我尝试使用rowums,但它给了我一些行.我怎么能在r？

Nei*_*eil

2017 01-11

0
推荐指数

1
解决办法

938
查看次数

比较两个数据帧列

我在r中有两个数据帧

df1

NO     QC1     QC2      QC3     Total 
123      8       8        8     24 
124      9       8        8     25
125      9       9        9     27

df2

NO     QC1     QC2      QC3     Total 
123      7       7        7      21 
124      9       10       8      27
125      10      10       10     30

Run Code Online (Sandbox Code Playgroud)

我想将上面的数据帧与总数进行比较.将保留最大总数的行.我想要的数据帧如下

NO     QC1     QC2      QC3    Total 
123     8       8        8      24 
124     9       10       8      27
125     10      10       10     30

Run Code Online (Sandbox Code Playgroud)

NO列在两个数据帧中都是唯一的.我怎么能在R？

Nei*_*eil

2017 07-13

0
推荐指数

1
解决办法

57
查看次数

按 dplyr 中的重复行进行分组

我在 R 中有以下数据框

   Ship_No     Number     
    1244         1
    1244         2
    1244         3
    1244         1
    1245         10
    1245         10
    1245         15
    1245         20
    1245         20

Run Code Online (Sandbox Code Playgroud)

想要找到重复的Numbergroup by ship_No。我想要的数据框是

   Ship_no      Number
    1244          1
    1245         10,20

Run Code Online (Sandbox Code Playgroud)

仅以逗号分隔重复的数字。

Nei*_*eil

lucky-day

0
推荐指数

1
解决办法

5986
查看次数

如何在Python中根据条件删除列表元素

我在python中有以下二维数组

[[(0, 0, 0), 337.94174378689814],
[(0, 0, 1), 339.92776762374007],
[(0, 0, 2), 338.78632729456444],
[(0, 1, 0), 344.85997106879347],
[(0, 1, 1), 331.6819890120493],
[0, 0]]

Run Code Online (Sandbox Code Playgroud)

我想删除其中有 0 个值的元素输出是ARIMA order and corresponding AIC score我从以下代码生成的

a = [[0]*2 for x in range(27)]

for i in range(len(pdq)):
   try:
      mod =  ARIMA(train, order = pdq[i]) 
      results = mod.fit(disp=False)
      a[i][0] = pdq[i]
      a[i][1] = results.aic
      if a[i][1] == 0:
         a.remove(a[i])
   except:
       continue

Run Code Online (Sandbox Code Playgroud)

我想删除数组中同时存在的值0。我怎样才能做到if condition described above

python list

Nei*_*eil

2018 08-09

0
推荐指数

3
解决办法

2万
查看次数