我试图通过一个函数传递一个简单的数组来计算平均值.
int main()
{
int n = 0; // the number of grades in the array
double *a; // the array of grades
cout << "Enter number of scores: ";
cin >> n;
a = new double[n]; // the array of grades set
// to the size of the user input
cout << "Enter scores separated by blanks: ";
for(int i=0; i<n; i++)
{
cin >> a[i];
}
computeMean(a, n);
}
double computeMean (double values[ ], int n)
{
double …
Run Code Online (Sandbox Code Playgroud) 我有一个大小为50,000 x 1的矢量模拟数据,它有NaNs和非NaNs.我想平均非NaNs,但功能nanmean返回NAN.我试过删除NANs,但我只得到一个零向量.对矢量的目视检查让我怀疑这个矢量的真实均值是NaN.
此外,我想使用此向量来计算与其他几个向量的协方差(在某些时候).我的替代方案是在Excel中执行此操作,这将是痛苦的.
有什么想法吗?
谢谢
我有一个名为IMS的数据集,由11个变量组成. 强文
我想为变量pi == 1的所有观测计算变量std.y的平均值.
谁能告诉我如何计算这个?:)
最诚挚的问候,亨里克
我是Python新手,在使用pandas
重新采样某些数据时,我遇到了一个棘手的问题.
当我想重新采样时间序列数据时,应用算术平均函数非常简单.
例如:
假设ts
是以分钟频率的时间序列数据(在pandas
,它被封装在具有a的pandas.Series
对象中DatetimeIndex
).
要获得每组5分钟时段的算术平均值,它只是:
ts.resample('5min', how='mean')
Run Code Online (Sandbox Code Playgroud)
但是,我如何以这种方式计算几何平均数?是否有像上面这样的简单解决方案,例如:
ts.resample('5min', how='gmean')
Run Code Online (Sandbox Code Playgroud) 我想根据数据框中的两个不同分组来计算平均值。示例数据集是:
> data
age Year Length
[1,] 3 2004 23.2
[2,] 3 2004 27.6
[3,] 3 2005 25.4
[4,] 3 2005 22.2
[5,] 4 2004 37.6
[6,] 4 2004 31.3
[7,] 4 2005 29.9
[8,] 4 2005 30.1
Run Code Online (Sandbox Code Playgroud)
到目前为止,我已经使用ddply函数来计算一个年龄段内的均值。为此,我创建了一个索引以对所有三年的旧数据进行排序,然后找到Year中的长度平均值。
logical3=(mydata$Age ==3)
mydata3= mydata[logical3,]
mean_values_3 <- ddply(mydata3, "Year", transform, grp.mean.values=mean(Length))
Run Code Online (Sandbox Code Playgroud)
我想通过计算方法使过程更快,更省力,而不必先按年龄排序。
有没有一种方法可以:1)根据多个组查找平均值-无需按顺序进行分组-2)如何获得将结果输出到单独的数据框中而不附加到工作组中的方法。
我需要在生日和某些其他事件(例如即将发生的事件或列表即将到期)上发送一些电子邮件,但是我不确定在MEAN堆栈中执行此操作的最佳方法。
我应该创建另一个应用程序并永久使用它来每天浏览数据库还是实现Cron Job之类的东西?
这是我迄今为止在节点上的第一个应用程序,到目前为止很喜欢它:) NPM FTW!
我正在尝试创建一个图来比较不同算法的运行时间.通过运行以下R代码,我得到以下情节,我通常对此表示满意.但是:从该图中读取值可能很困难,是否有办法为每个实例获取每个DBMS的绘制平均值?例如gplus-combined
,值CacheDBMS
大约为50,而BranchDBMS
大约为200.
ggplot(dt, aes(reorder(instance, V9), V9)) +
geom_point(aes(group=V2, colour=V2), stat='summary', fun.y='mean') +
geom_line(aes(group=V2, colour=V2), stat='summary', fun.y='mean') +
scale_y_log10() +
ylab("Mean wall time") +
xlab("") +
ggtitle("Comparison of Database Management Systems") +
theme_bw() +
theme(axis.text.x = element_text(angle=45, vjust = 1, hjust = 1)) +
guides(color=guide_legend(title="DBMS"))
Run Code Online (Sandbox Code Playgroud)
我想要每个点的y值.优选作为表格,例如
BranchDBMS gplus-combined 213.21
CacheDBMS gplus-combined 48.68
Run Code Online (Sandbox Code Playgroud)
编辑
输入数据的小片段(超出10000行).我删除了未使用的列,因此V*
不正确.但这V2
是第一列,V9
是第二列,也是instance
最后一列.
BranchDBMS; 0.163352; facebook-combined
BranchDBMS; 0.169043; facebook-combined
BranchDBMS; 0.162545; facebook-combined
BranchDBMS; 0.159489; facebook-combined
BranchDBMS; 0.168414; …
Run Code Online (Sandbox Code Playgroud) 我有一个邻接矩阵M,类似这样:
[1 2 0 2 4
2 1 2 0 -1
0 3 1 2 3
2 0 2 1 0
4 -1 3 0 1]
Run Code Online (Sandbox Code Playgroud)
我想计算下面(但不包括)对角线的所有值的平均值.最终输出应为1.5.
为了获得这些价值,我想我会用N = tril(M,-1)
.问题是我现在在矩阵N的上部和下部有零,因此mean(sum(N)./sum(N~=0))
不起作用.由于我也有负值,我不能只做值> = 0的均值.我怎样才能做到这一点?
假设我们在开头有两个对象:
a <- c(2,4,6)
b <- 8
Run Code Online (Sandbox Code Playgroud)
如果我们在每个中应用mean()函数,我们得到:
> mean(a)
[1] 4
> mean(b)
[1] 8
Run Code Online (Sandbox Code Playgroud)
......这绝对正常.
如果我创建一个合并a和b的新对象...
c <- c(2,4,6,8)
Run Code Online (Sandbox Code Playgroud)
并计算其平均值......
> mean(c)
[1] 5
Run Code Online (Sandbox Code Playgroud)
...我们得到5,这是预期值.
但是,我想同时计算两个对象的平均值.我试过这种方式:
> mean(a,b)
[1] 4
Run Code Online (Sandbox Code Playgroud)
我们可以看到,它的值与预期的正确值(5)不同.我错过了什么?
我正在尝试为所有数据帧计算每个后续2行组的平均值。我想我通过以下代码得到了这一点:
df.groupby(np.arange(len(df))//2).mean()
但是,问题在于并非所有值都是数字。在这种情况下,如果组的第二行是数字,而第一行不是数字,则不是平均值,而是与第二行相同。如果两行都是非数字的,则该值应分配为0。
为了获得更好的可视化效果,我有以下数据框:
Well Ct
0 A1 Undetermined
1 A2 Undertermined
2 A3 Undetermined
3 A4 41.2
4 B1 42
5 B2 43
Run Code Online (Sandbox Code Playgroud)
我想要获得的是:
Well Ct
0 A1-A2 0.0
1 A3-A4 41.2
2 B1/B2 42.5
Run Code Online (Sandbox Code Playgroud)
有什么办法可以解决这个问题或已经发布的其他类似问题吗?