“使用 awk 对数字列表中的值进行分箱”提供了使用 awk 对列中的每组 3 个点进行平均的解决方案。
如何将其扩展到保持格式的无限数量的列?例如:
2457135.564106 13.249116 13.140903 0.003615 0.003440
2457135.564604 13.250833 13.139971 0.003619 0.003438
2457135.565067 13.247932 13.135975 0.003614 0.003432
2457135.565576 13.256441 13.146996 0.003628 0.003449
2457135.566039 13.266003 13.159108 0.003644 0.003469
2457135.566514 13.271724 13.163555 0.003654 0.003476
2457135.567011 13.276248 13.166179 0.003661 0.003480
2457135.567474 13.274198 13.165396 0.003658 0.003479
2457135.567983 13.267855 13.156620 0.003647 0.003465
2457135.568446 13.263761 13.152515 0.003640 0.003458
Run Code Online (Sandbox Code Playgroud)
每 5 行取平均值,应该输出类似
2457135.564916 13.253240 13.143976 0.003622 0.003444
2457135.567324 13.270918 13.161303 0.003652 0.003472
Run Code Online (Sandbox Code Playgroud)
其中第一个结果是前 1-5 行的平均值,第二个结果是 6-10 行的平均值。
我想要扩展平均值给出不包括当前项目的结果,即项目之前的平均值。这是我要找的:
d = { 'home' : ['A', 'B', 'B', 'A', 'B', 'A', 'A'], 'away' : ['B', 'A','A', 'B', 'A', 'B', 'B'],
'aw' : [1,0,0,0,1,0,np.nan],'hw' : [0,1,0,1,0,1, np.nan]}
df2 = pd.DataFrame(d, columns=['home', 'away', 'hw', 'aw'])
df2.index = range(1,len(df2) + 1)
df2['homewin_at_home'] = df2.groupby('home')['hw'].apply(pd.expanding_mean)
print df2
Run Code Online (Sandbox Code Playgroud)
结果:
home away hw aw homewin_at_home
1 A B 0 1 0.000000
2 B A 1 0 1.000000
3 B A 0 0 0.500000
4 A B 1 0 0.500000
5 B A 0 1 0.333333 …Run Code Online (Sandbox Code Playgroud) 如何从 MySQL 中的平均值中获取最大值?以下查询返回按客户分组的表订单金额的平均值。
SELECT AVG(amount)
FROM orders
GROUP BY cust;
Run Code Online (Sandbox Code Playgroud)
我想使用带有聚合函数的单个查询从平均值中获得最大值。使用 ORDER BY ... DESC LIMIT 1 肯定有效,但我感兴趣的是仅使用聚合函数获得最大平均值。有可能吗?谢谢
我有一个清单:
l = [['a', 10, 30], ['b', 34, 89], ['c', 40, 60],['d',30,20]]
Run Code Online (Sandbox Code Playgroud)
其中每个子列表中的第一项是名称,其他两个数字是标记(sub1 和 sub2)
嵌套列表可以是动态的,即嵌套列表的数量可以根据功能变化。
我正在寻找的是找到
average of subj 1 i.e (10+34+40+30)/4 and
similarly sub2 (30+89+60+20)/4
also average marks of a: (10+30)/2
average marks of b: (34+89)/2 and so on.
Run Code Online (Sandbox Code Playgroud)
我试过:
c = 0
for i in range(0,len(list_marks1)):
c += list_marks1[i][1]
sub_1avg = float(c)/len(list_marks1)
d = 0
for i in range(0,len(list_marks1)):
d += list_marks1[i][2]
sub_2avg = float(d)/len(list_marks1)
Run Code Online (Sandbox Code Playgroud)
但这不正确。
有没有什么最佳方法可以做到这一点?由于我的嵌套列表中的主题数量也会发生变化。
我有一个包含六个引号的数组,我试图找到每个引号的平均长度。我想我需要创建一个新的字符串长度数组,然后求平均值。但我不知道如何将原始数组的计数放入新数组中。如何将第一个数组的计数放入新数组中?
我有一个方形图像,例如这个:
我想从位置(0,0)计算每个半径的图像的一维平均值。我已经编写了一些代码来做到这一点,但首先它即使对于小图像也很慢,其次我看到它背后的想法也存在一些问题。代码在这里:
import matplotlib.pyplot as plt
import numpy as np
import collections
from skimage import data
image = data.coins()
image = image[:,0:303]
print(image.shape)
projection = {}
total_count = {}
for x_i,x in enumerate(image):
for y_i,y in enumerate(x):
if round(np.sqrt(x_i**2+y_i**2),1) not in projection:
projection[round(np.sqrt(x_i**2+y_i**2),1)] = y
total_count[round(np.sqrt(x_i**2+y_i**2),1)] = 1
elif np.sqrt(round(np.sqrt(x_i**2+y_i**2),1)) in projection:
projection[round(np.sqrt(x_i**2+y_i**2),1)] += y
total_count[round(np.sqrt(x_i ** 2 + y_i ** 2), 1)] += 1
od = collections.OrderedDict(sorted(projection.items()))
x, y = [],[]
for k, v in od.items():
x.append(k)
y.append(v/total_count[k])
plt.plot(x,y) …Run Code Online (Sandbox Code Playgroud) 我想得到每个国家多年来的平均 GDP,列 2006、2007...2015 包含 GDP 数字......我的代码返回一个错误,意思是(轴 = 1)需要至少 1 个变量,和 1已分配给它......这很奇怪......我也发现我们使用平均值而不是平均值很奇怪,但找不到groupby的平均值函数
这是我的代码
Top15 = ANSWER
Top15 = Top15[['Country', '2006', '2007', '2008', '2009', '2010',
'2011', '2012', '2013', '2014', '2015']]
return Top15.groupby('Country').agg({"avg": np.mean(axis=1)})
Run Code Online (Sandbox Code Playgroud) 日期是日期时间的数据帧:
Column | Date
:-----------|----------------------:
A | 2018-08-05 17:06:01
A | 2018-08-05 17:06:02
A | 2018-08-05 17:06:03
B | 2018-08-05 17:06:07
B | 2018-08-05 17:06:09
B | 2018-08-05 17:06:11
Run Code Online (Sandbox Code Playgroud)
返回表是;
Column | Date
:-----------|----------------------:
A | 2018-08-05 17:06:02
B | 2018-08-05 17:06:09
Run Code Online (Sandbox Code Playgroud) 我正在尝试用 C++ 创建一个简单的程序。它计算用户输入的 5 个数字的平均值,但是当我运行它时它一直给我一个垃圾值。我花了 30 多分钟来解决这个问题,但我似乎无法弄清楚。
#include <iostream>
int main() {
std::cout << "hello this my program" << '\n';
int sum, avg;
int numbOne{ }, numbTwo{ }, numbThree{ }, numbFour{ }, numbFive{ };
std::cout << "enter your first number: ";
std::cin >> numbOne;
std::cout << "enter your second number: ";
std::cin >> numbTwo;
std::cout << "enter your third number: ";
std::cin >> numbThree;
std::cout << "enter your fourth number: ";
std::cin >> numbFour;
std::cout << "enter your fifth number:"; …Run Code Online (Sandbox Code Playgroud) 我正在为求平均列的正确语法而苦苦挣扎。我所拥有的 - 来自 RavenDB Studio 编辑器:
地图:
from area in docs.Level5_AdministrativeAreas
select new
{
area.NAME_4,
totalPrice = area.pricePerSquareMetre,
areaCount = 1,
priceAverage = 0
}
Run Code Online (Sandbox Code Playgroud)
降低:
from result in results
group result by new { result.NAME_4 } into g
select new
{
NAME_4 = g.Key.NAME_4,
totalPrice = g.Sum(x => x.totalPrice),
areaCount = g.Sum(x => x.areaCount),
priceAverage = totalPrice / areaCount
}
Run Code Online (Sandbox Code Playgroud)
计数和总价计算正确,但我不知道如何引用totalPrice和areaCount。
是否需要额外的选择块?我试过“g.totalPrice”和“g.priceAverage”,但它没有被识别。
感谢您的帮助 !