我想从 python 中的集合中提取文档的最后一个 objectID 并将其存储在 python 对象中。
我正在做这样的事情
db.dataset2.find().sort( {'_id': -1 } ).limit(1);
Run Code Online (Sandbox Code Playgroud)
但这给了我一个错误。
TypeError: if no direction is specified, key_or_list must be an instance of the list
Run Code Online (Sandbox Code Playgroud)
请帮忙。
我有一个具有域名列的数据框.我想通过ping他们的域名来查看存在哪个域.我可以通过以下函数获得单独的ping响应.
ping <- function(x,stderr=FALSE,stdout=FALSE,...){
pingvec <- system2("ping",x,
stderr=FALSE,
stdout=FALSE,...)
if (pingvec == 0) TRUE else FALSE
}
ping("google.com")
[1] TRUE
Run Code Online (Sandbox Code Playgroud)
是否有任何R包,我可以获得整个列的ping响应,其中包含数千个域名.
我正在处理具有多种日期格式的凌乱excel文件
2016-10-17T12:38:41Z
Mon Oct 17 08:03:08 GMT 2016
10-Sep-15
13-Oct-09
18-Oct-2016 05:42:26 UTC
Run Code Online (Sandbox Code Playgroud)
我想以yyyy-mm-dd
格式转换以上所有内容.我正在使用以下代码进行转换,但很多值都是NA.
as.Date(parse_date_time(df$date,c('mdy', 'ymd_hms','a b d HMS y','d b y HMS')))
Run Code Online (Sandbox Code Playgroud)
我怎么能一起做所有这些.我已经读过类似案例的其他主题,但似乎没有什么能适用于我的案例.请帮忙
我在熊猫中有以下数据框
date prod hourly_bucket tank trans flag
01-01-2019 TP 05:00:00-06:00:00 2 Preset Peak
01-01-2019 TP 05:00:00-06:00:00 2 Preset Peak
01-01-2019 TP 05:00:00-06:00:00 2 Non Preset Peak
02-01-2019 TP 05:00:00-06:00:00 2 Preset Lean
02-01-2019 TP 05:00:00-06:00:00 2 Preset Lean
02-01-2019 TP 05:00:00-06:00:00 2 Non Preset Lean
Run Code Online (Sandbox Code Playgroud)
我想要的数据框将是在日级别和槽级别的聚合,然后计算几个小时内的Preset,Non-Preset
交易次数Lean and Peak
date tank Lean_Non_Preset Lean_Preset Peak_Non_Preset Peak_Preset
01-01-2019 2 1 2 1 2
Run Code Online (Sandbox Code Playgroud)
我正在熊猫后面
lean_peak_preset_cnt = df.pivot_table(index=['date','tank'], columns=['flag'],values=['trans'],aggfunc='count').reset_index()
Run Code Online (Sandbox Code Playgroud)
但这没有给我所需的解决方案
我在熊猫中有以下数据框
Date tank hose quantity count set flow
01-01-2018 1 1 20 100 211 12.32
01-01-2018 1 2 20 200 111 22.32
01-01-2018 1 3 20 200 123 42.32
02-01-2018 1 1 10 100 211 12.32
02-01-2018 1 2 10 200 111 22.32
02-01-2018 1 3 10 200 123 42.32
Run Code Online (Sandbox Code Playgroud)
我想计算quantity
和count
分组的百分比Date
和tank
。我想要的数据框
Date tank hose quantity count set flow perc_quant perc_count
01-01-2018 1 1 20 100 211 12.32 33.33 20
01-01-2018 1 2 …
Run Code Online (Sandbox Code Playgroud) 我想将多个CSV文件合并到pentaho勺子中的一个CSV文件中.例如
file1.txt有值
姓名,地址
美国广播公司,浦那
file2.txt有值
电子邮件,年龄
ABC @ gmail.com,25
现在我希望输出在一个csv文件中
姓名,地址,电子邮件,年龄
请在这件事上给予我帮助..
我在r中有一个数据帧
Loss1. Loss2. Loss3
-456. -2345. -1290
345. -342. 234
Run Code Online (Sandbox Code Playgroud)
我想计算连续出现正值和负值的次数.预期产量如下
Loss1. Loss2. Loss3. Neg_count. Pos_count
-456. -2345. -1290. 3. 0
345. -342. 234. 1 2
Run Code Online (Sandbox Code Playgroud)
我尝试使用rowums,但它给了我一些行.我怎么能在r?
我在r中有两个数据帧
df1
NO QC1 QC2 QC3 Total
123 8 8 8 24
124 9 8 8 25
125 9 9 9 27
df2
NO QC1 QC2 QC3 Total
123 7 7 7 21
124 9 10 8 27
125 10 10 10 30
Run Code Online (Sandbox Code Playgroud)
我想将上面的数据帧与总数进行比较.将保留最大总数的行.我想要的数据帧如下
NO QC1 QC2 QC3 Total
123 8 8 8 24
124 9 10 8 27
125 10 10 10 30
Run Code Online (Sandbox Code Playgroud)
NO
列在两个数据帧中都是唯一的.我怎么能在R?
我在 R 中有以下数据框
Ship_No Number
1244 1
1244 2
1244 3
1244 1
1245 10
1245 10
1245 15
1245 20
1245 20
Run Code Online (Sandbox Code Playgroud)
想要找到重复的Number
group by ship_No
。我想要的数据框是
Ship_no Number
1244 1
1245 10,20
Run Code Online (Sandbox Code Playgroud)
仅以逗号分隔重复的数字。
我在python中有以下二维数组
[[(0, 0, 0), 337.94174378689814],
[(0, 0, 1), 339.92776762374007],
[(0, 0, 2), 338.78632729456444],
[(0, 1, 0), 344.85997106879347],
[(0, 1, 1), 331.6819890120493],
[0, 0]]
Run Code Online (Sandbox Code Playgroud)
我想删除其中有 0 个值的元素输出是ARIMA order and corresponding AIC score
我从以下代码生成的
a = [[0]*2 for x in range(27)]
for i in range(len(pdq)):
try:
mod = ARIMA(train, order = pdq[i])
results = mod.fit(disp=False)
a[i][0] = pdq[i]
a[i][1] = results.aic
if a[i][1] == 0:
a.remove(a[i])
except:
continue
Run Code Online (Sandbox Code Playgroud)
我想删除数组中同时存在的值0
。我怎样才能做到if condition described above
我想从年份和月份格式中减去给定日期的月份.
global_date = "2017-01"
Run Code Online (Sandbox Code Playgroud)
我正在使用zoo
库将其转换如下:
as.yearmon(global_date) - 0.1
Run Code Online (Sandbox Code Playgroud)
但它给了我2016年11月,我希望它为'201612'
我怎么能在R?
我有一个数字框,数字列在R中.我想看看数据框每列中有多少值超过某个阈值.(例如标准值大于+ -2.5)这是我想要显示的输出
假设我的数据框中的所有列都是数字的,我可以使用哪些函数或哪些函数组合来产生类似的结果?
提前致谢 :)