我有N个数据的数据集,我想测试其正常性.我知道scipy.stats有一个kstest函数, 但是没有关于如何使用它以及如何解释结果的例子.有人在这里熟悉它可以给我一些建议吗?
根据文档,使用kstest返回两个数字,KS检验统计量D和p值.如果p值大于显着性水平(比如说5%),那么我们就不能拒绝数据来自给定分布的假设.
当我通过从正态分布中绘制10000个样本并测试高斯度来进行测试运行时:
import numpy as np
from scipy.stats import kstest
mu,sigma = 0.07, 0.89
kstest(np.random.normal(mu,sigma,10000),'norm')
Run Code Online (Sandbox Code Playgroud)
我得到以下输出:
(0.04957880905196102,8.9249710700788814e-22)
p值小于5%,这意味着我们可以拒绝数据正态分布的假设.但样品来自正态分布!
有人能理解并向我解释这里的差异吗?
(正常性测试是假设μ= 0且sigma = 1?如果是这样,我如何测试我的数据是高斯分布但具有不同的mu和sigma?)
我试图在Django html模板中嵌入一个情节饼图.当图表以"在线模式"生成时(即html片段存储在绘图服务器上)但不在"离线模式"(即当html存储在本地时)时,这种方法正常工作.在后一种情况下,图表不会出现.我希望能够将html存储在我的本地服务器上并从那里嵌入图表.
这是有效的一点:
import plotly.plotly as py
import plotly.graph_objs as go
labels = [1,2,3,4]
values = [10,20,30,40]
ndata = 100
fig = {
'data': [{'labels': labels,
'values': values,
'type': 'pie',
'textposition':"none",
'textinfo':"percent",
'textfont':{'size':'12'},
'showlegend':'false'}],
'layout': {'title': 'Total:'+str(ndata),
'showlegend':'false',
'height':'200',
'width':'200',
'autosize':'false',
'margin':{'t':'50','l':'75','r':'0','b':'10'},
'separators':'.,'}
}
plotly_url = py.plot(fig, filename='myfile', auto_open=False)
pie_url = '<iframe width="200" height="200" frameborder="0" seamless="seamless" scrolling="no" src='+plotly_url+'.embed?width=200&height=200&link=false&showlegend=false></iframe>'
Run Code Online (Sandbox Code Playgroud)
请注意,pie_url在Django中的Http渲染请求中作为字符串传递.模板使用|将字符串解释为html 安全标签,即{{pie_url | safe}}.
这是不起作用的一点:
from plotly.offline import download_plotlyjs, plot
import plotly.graph_objs as go
labels = [1,2,3,4]
values …Run Code Online (Sandbox Code Playgroud) 我想提取postscript图像文件中包含的文本信息(我的轴标签的标题).这些图像是用pgplot生成的.我在Ubuntu上尝试过ps2ascii和ps2txt,但它们没有产生任何有用的结果.有谁知道另一种方法?
谢谢