我有以下数据集要运行单向方差分析测试:
substr = [2.011,1.865,2.002,2.202,1.896,2.209,2.222,2.087,1.905,2.052,1.828,1.968,1.907,1.898,1.849,2.172,1.883,2.14,2.074,2.05,2.159,2.323,2.201,1.971,1.855,2.088,1.943,2.081,1.981,2.038,2.064,1.84,2.091,1.993,2.059,1.986,1.957,1.956,1.847,2.033,1.907,1.88,1.92,2.035,1.852,1.949,1.892,1.888,2.1,1.975,2.038,1.849,1.9,1.891,2.0,1.875,1.95,1.959,2.087,1.863,1.749,1.91,1.979,1.87,1.984,2.029,2.077,1.952,2.003,1.858,2.098,1.895,1.962,2.19,1.989,2.055,2.145,2.033,2.154,1.944,2.114,2.242,1.929,1.931,1.938,2.038,2.093,1.966,1.952,1.978,1.967,1.86,2.129,2.176,1.914,2.163,2.161,2.109,2.077,2.105]
column = [1.853,1.916,2.007,2.157,2.034,2.291,2.326,2.011,2.075,1.888,2.017,2.105,2.168,2.046,2.04,2.146,2.02,2.213,2.188,2.261,2.333,2.509,2.264,1.857,2.088,1.843,2.211,2.256,2.045,1.947,1.944,2.063,2.203,1.999,1.901,2.213,1.939,2.089,1.964,2.01,1.988,1.903,2.092,2.145,2.097,1.933,1.858,2.075,1.869,2.013,2.183,2.035,2.221,2.024,2.106,2.045,2.036,1.981,2.072,2.019,1.863,1.911,1.937,2.385,1.878,2.056,2.01,1.984,1.983,2.178,1.909,1.886,2.126,2.166,2.296,2.125,1.998,2.313,2.207,2.095,2.331,2.177,2.095,2.078,2.02,2.147,1.99,1.938,2.028,2.081,2.168,2.178,2.054,2.123,2.1,2.37,2.057,2.336,2.024,2.061]
regex = [1.51,1.544,1.771,1.791,1.72,1.925,1.635,1.56,1.671,1.642,1.636,1.747,1.564,1.558,1.649,1.716,1.798,1.868,1.781,1.794,1.895,1.757,1.706,1.492,1.768,1.734,1.774,1.796,1.812,1.734,1.698,1.832,1.812,1.605,1.63,1.672,1.599,1.56,1.646,1.67,1.832,1.633,1.745,1.626,1.689,1.756,1.472,1.678,1.506,1.595,1.705,1.659,1.734,1.741,1.825,1.584,1.606,1.656,1.547,1.832,1.727,1.502,1.717,1.686,1.684,1.669,1.698,1.676,1.638,1.703,1.635,1.704,1.716,1.779,1.859,1.679,1.626,1.71,1.771,1.829,1.82,1.816,1.77,1.744,1.681,1.791,1.756,1.678,1.835,1.77,1.646,1.742,1.736,1.66,1.708,1.874,1.975,1.775,1.697,1.613]
Run Code Online (Sandbox Code Playgroud)
两个主要的方差分析假设是:
为了测试我的组是否正态分布,我可以使用scipy.stats.mstats.normaltest.
如何在 scipy 或其他 python 库中测试这三个组是否同方差?
我希望在将一串过滤条件传递给data.table时提供一些帮助.我已经尝试了解析和评估的所有方式,似乎无法弄明白
我尝试使用iris数据集重新创建一个示例:
iris <- data.table(iris)
vars <- 'setosa'
filter <- 'Species == vars & Petal.Length >= 4'
data <- iris[filter,
list(sep.len.tot = sum(Sepal.Length), sep.width.total = sum(Sepal.Width)),
by = 'Species']
Run Code Online (Sandbox Code Playgroud)
因此,过滤器字符串中包含一个变量变量(基于循环而变化).我正在尝试根据过滤字符串过滤数据.
是否有一个data.table特定的方法来评估字符串?
希望有道理!
bash 脚本发送一个curl。卷曲响应示例如下:
{"code":"2aaea70fdccd7ad11e4ee8e82ec26162","nonce":1541355854942}
Run Code Online (Sandbox Code Playgroud)
我需要获取代码“2aaea70fdccd7ad11e4ee8e82ec26162”(不带引号)并在 bash 脚本中使用它。
是否有任何简单的方法,如何确定日期时间对象中的日期是否不明确 - 这意味着特定的日期时间可以按常规时间更改的顺序在特定时区中存在两次?
\n\n这是一个不明确的日期时间对象的示例。在纽约时区,2017 年 11 月 5 日凌晨 2 点,时间拨回凌晨 1 点。
\n\nimport datetime\nimport dateutil\n\n#\xc2\xa0definition of time zone\neastern_time = dateutil.tz.gettz('America/New_York')\n\n# definition of ambiguous datetime object\ndt = datetime.datetime(2017, 11, 5, 1, 30, 0, tzinfo=eastern_time)\nRun Code Online (Sandbox Code Playgroud)\n\n我期待这样的事情。
\n\n>>> suggested_module.is_dt_ambiguous(dt)\nTrue\nRun Code Online (Sandbox Code Playgroud)\n 当我尝试导入 WordEmbeddingSimilarityIndex 时,出现以下错误:
>> from gensim.models import WordEmbeddingSimilarityIndex
ImportError: cannot import name 'WordEmbeddingSimilarityIndex
Run Code Online (Sandbox Code Playgroud)
函数也会出现同样的问题SparseTermSimilarityMatrix:
>> from gensim.similarities import SparseTermSimilarityMatrix
ImportError: cannot import name 'SparseTermSimilarityMatrix
Run Code Online (Sandbox Code Playgroud)
注意:我已经安装并导入了 gensim、gensim.models 和 gensim.similarities。但它仍然给了我ImportError导入上述函数的时间。
你能告诉我我做错了什么吗?
python ×2
bash ×1
curl ×1
data.table ×1
datetime ×1
gensim ×1
grep ×1
python-2.7 ×1
python-3.x ×1
r ×1
scipy ×1
statistics ×1
timezone ×1