我正在寻找一种获得一个p值的方法,该值描述了glm模型的拟合优度.以下是手册lm页中略有修改的示例:
ctl <- c(4.17,5.58,5.18,6.11,4.50,4.61,5.17,4.53,5.33,5.14)
trt <- c(4.81,4.17,4.41,3.59,5.87,3.83,6.03,4.89,4.32,4.69)
conf<- c(rnorm(mean=-1, sd=1, n=10), rnorm(mean=1, sd=1, n=10))
group <- gl(2,10,20, labels=c("Ctl","Trt"))
weight <- c(ctl, trt)
lm.D9 <- lm(weight ~ group + conf)
Run Code Online (Sandbox Code Playgroud)
有summary(lm.D9)一个得到
Call:
lm(formula = weight ~ group + conf)
Residuals:
Min 1Q Median 3Q Max
-1.17619 -0.40373 -0.05262 0.24987 1.40777
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.97416 0.25153 19.775 3.6e-13 ***
groupTrt -0.23724 0.41117 -0.577 0.572
conf -0.07044 0.13725 -0.513 0.614
---
Signif. codes: 0 …Run Code Online (Sandbox Code Playgroud) 我对p值有疑问.我一直在比较不同的线性模型,以确定一个模型是否比另一个更好,在R中具有以下功能.
anova(model1,model2)
Run Code Online (Sandbox Code Playgroud)
不幸的是,偶尔它不会计算F或p值.这是一个没有给出p值的anova摘要的例子
Analysis of Variance Table
Model 1: Influence ~ SortedSums[, Combos2[1, A]] + SortedSums[, Combos2[2,A]]
Model 2: Influence ~ SortedSums[, B]
Res.Df RSS Df Sum of Sq F Pr(>F)
1 127 3090.9
2 128 2655.2 -1 435.74
Run Code Online (Sandbox Code Playgroud)
为了对称性,这里也是一个产生p值的anova总结.
Analysis of Variance Table
Model 1: Influence ~ SortedSums[, Combos2[1, A]] + SortedSums[, Combos2[2,A]]
Model 2: Influence ~ SortedSums[, B]
Res.Df RSS Df Sum of Sq F Pr(>F)
1 127 3090.9
2 128 3157.6 -1 -66.652 2.7386 0.1004
Run Code Online (Sandbox Code Playgroud)
你知道为什么会这样吗?
作为普通的R用户,我正在学习使用python进行分析,我从卡方开始,并做了以下工作:
> chisq.test(matrix(c(10,20,30,40),nrow = 2))$p.value # test1
[1] 0.5040359
> chisq.test(matrix(c(1,2,3,4),nrow = 2))$p.value # test2
[1] 1
Warning message:
In chisq.test(matrix(c(1, 2, 3, 4), nrow = 2)) :
Chi-squared approximation may be incorrect
> chisq.test(matrix(c(1,2,3,4),nrow = 2),correct = FALSE)$p.value # test3
[1] 0.7781597
Warning message:
In chisq.test(matrix(c(1, 2, 3, 4), nrow = 2), correct = FALSE) :
Chi-squared approximation may be incorrect
Run Code Online (Sandbox Code Playgroud)
In [31]:
temp = scipy.stats.chi2_contingency(np.array([[10, 20], [30, 40]])) # test1
temp[1] # pvalue
Out[31]:
0.50403586645250464
In …Run Code Online (Sandbox Code Playgroud) 我有一个二项式检验的结果,它看起来像这样:
data: x and n
number of successes = 0, number of trials = 7, p-value = 0.01563
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
0.0000000 0.4096164
sample estimates:
probability of success
0
Run Code Online (Sandbox Code Playgroud)
我只想知道如何提取R中的p值。我尝试了grep和pmatch,但它们似乎需要表或向量。
我想指出多个条形图之间的p值,如下图所示:
但是我没有在MATLAB的条形图页面上找到与此相关的命令。
这是条形图和标准偏差图的代码:
x = 1:3;
y = [17.5, 97.5, 100];
std = [23.84848004, 10.89724736, 0];
figure
hold on
bar(x,y)
errorbar(y,std,'.')
XTickLabel={'1' ; '2'; '3' ; '4'};
XTick=2:4:15
set(gca, 'XTick',XTick);
set(gca, 'XTickLabel', XTickLabel);
Run Code Online (Sandbox Code Playgroud) Pr(>|t|)当用R执行线性回归时,使用什么公式来计算输出值?
我了解的值Pr (> | t |)是p值,但我不了解该值是如何计算的。
例如,尽管of Pr (> | t |)的x1值显示为0.021下面的输出结果,但我想知道如何计算该值
x1 <- c(10,20,30,40,50,60,70,80,90,100)
x2 <- c(20,30,60,70,100,110,140,150,180,190)
y <- c(100,120,150,180,210,220,250,280,310,330)
summary(lm(y ~ x1+x2))
Run Code Online (Sandbox Code Playgroud)
Call:
lm(formula = y ~ x1 + x2)
Residuals:
Min 1Q Median 3Q Max
-6 -2 0 2 6
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 74.0000 3.4226 21.621 1.14e-07 ***
x1 1.8000 0.6071 2.965 0.021 *
x2 0.4000 0.3071 1.303 0.234
---
Signif. codes: 0 ‘***’ …Run Code Online (Sandbox Code Playgroud) 我是新来的,我的英语不是很好,所以我会尽力解释。我正在做一个关于隐写分析的网络应用ASP.NET程序C#。我正在互联网上寻找一个函数,可以计算我的算法的卡方检验中观察到的显着性水平或 p 值,我在 Java 中找到了它:
这是mi搜索的结果:
chi[block]= chiSquareTest(expectedValues, pod);
chiSquareTest(double[] expected, long[] observed)
我的问题是,是否有任何等效函数C#返回相同的参数?
先感谢您,
安娜.
我在我的数据上运行了一个 posthoc Tukey HSD,它有十个因子水平。表格很大,我希望只在成对表格中向读者展示 p 值,将 45 行表格留给附录。
这是一个示例数据集:
set.seed(42)
x <- rnorm(100,1,2)
category <- letters[1:10]
data <- cbind.data.frame(x, category)
summary(data.aov <- aov(x~category, data = data))
data.hsd<-TukeyHSD(data.aov)
data.hsd.result<-data.frame(data.hsd$category)
data.hsd.result
Run Code Online (Sandbox Code Playgroud)
结果是一个 45 行的表。相反,我想要一个表,其中因子水平作为行和列名称,在单元格中具有 p 值,显示两者是否显着不同。Xs 或下划线或任何可能代表重复或不必要的比较。像这样的东西:
a b c d e f ... j
a X 0.97 1 0.99 0.89 0.99 ... 0.99
b X X 0.99 0.89 0.94 0.92 ... 0.97
c X X X 0.85 0.93 0.96 ... 0.98
| ... ... ... ... ... ... ... ...
i …Run Code Online (Sandbox Code Playgroud) 似乎没有可以用 javascript 计算 p 值的库,但那怎么可能呢?我确定一定有什么。
我发现的是这两个计算这些值的选项,但是您应该在网页中找到代码并适应您的需要。
http://home.ubalt.edu/ntsbarsh/Business-stat/otherapplets/pvalues.htm#rtdist http://www.njohnston.ca/2010/09/p-value-calculators-and-graphers-in-javascript /
以及一个也计算它但没有文档和废弃状态的库
https://code.google.com/archive/p/statistics-distributions-js/source/default/source
这是真理吗?不存在包含此计算的任何 stats js 库?
我有两个不同大小的 numpy 数组,我想直接在 python 中运行 t 测试来查看 p 值。
p-value ×10
r ×6
statistics ×3
chi-squared ×2
python ×2
regression ×2
anova ×1
asp.net ×1
bar-chart ×1
c# ×1
extraction ×1
glm ×1
javascript ×1
lm ×1
matlab ×1
numpy ×1
presentation ×1
t-test ×1