我正在尝试自动化JMP所做的过程(“分析”->“分布”,将列A输入为“ Y值”,使用后续列作为“权重”值)。在JMP中,您必须一次完成一列-我想使用Python遍历所有列并创建一个数组,例如显示每列的中位数。
例如,如果质量数组为[0、10、20、30],列1的权重数组为[30、191、9、0],则质量数组的加权中位数应为10。我不确定如何得出这个答案。
到目前为止,我已经
我不确定从这里到底要去哪里。基本上,“ Y值”是一个质量范围,并且数组中的所有列均代表为每个质量找到的数据点数。我需要根据报告的频率找到中位质量。
我不是Python或统计专家,因此,如果我省略了任何有用的细节,请告诉我!
更新:这是到目前为止我所做的一些代码:
#Boilerplate & Import files
import csv
import scipy as sp
from scipy import stats
from scipy.stats import norm
import numpy as np
from numpy import genfromtxt
import pandas as pd
import matplotlib.pyplot as plt
inputFile = '/Users/cl/prov.csv'
origArray = genfromtxt(inputFile, delimiter = ",")
nArray = np.array(origArray)
dimensions = nArray.shape
shape = np.asarray(dimensions)
#Mask values ==0
maTest = np.ma.masked_equal(nArray,0)
#Create array of masses the same shape as the weights (nArray) …
Run Code Online (Sandbox Code Playgroud) 我想使用JSL从SAS JMP环境运行python脚本.有什么选择?
我有以下 Python 代码,我已经尝试使用 REML 执行 VCA 分析:
\nimport pandas as pd\nimport statsmodels.api as sm\nfrom statsmodels.formula.api import ols\ndata = {\'Part\':[1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3,3,3,3],\n \'Employee\':[1,1,1,2,2,2,3,3,3,1,1,1,2,2,2,3,3,3,1,1,1,2,2,2,3,3,3],\n \'Measurement\':[103.3, 103.1, 103.1, 103.3, 102.9, 103.6, 103.2, 103.6, 103.1, 104.5, 104.8, 103.9, 104.5, 104, 103.8, 103.8, 103.6, 104, 104, 103.6, 103.5, 103.9, 104.1, 104.5, 104.3, 103.9, 103.8]} \ndf = pd.DataFrame(data)\nlm = ols(\'Measurement ~ C(Part) + C(Part):(Employee)\', data=df).fit()\ntable = sm.stats.anova_lm(lm, typ=2)\ntable[\'Percentage of Total Variance\'] = (table[\'sum_sq\'] / table[\'sum_sq\'].sum()) * 100\n
Run Code Online (Sandbox Code Playgroud)\n\n当我通过运行以下步骤在 JMP 中运行此 An\xc3\xa1lises 时:
\n我喜欢JMP可变性图。(链接)这是一个强大的工具。
该示例的示例具有2个x轴标签,一个用于部件号,一个用于操作员。
在这里,JMP变异图显示了两个以上级别的变量。以下按油量,批量和爆米花类型划分。找到正确的序列以显示最强的分离可能需要花费一些工作,但这是信息交流的绝佳工具。
使用ggplot2库,如何用R使用多层x标签?
我能找到的最好的是这个(link,link),它根据圆柱数分开,但是不做x轴标签。
我的示例代码是这样的:
#reproducible
set.seed(2372064)
#data (I'm used to reading my own, not using built-in)
data(mtcars)
attach(mtcars)
#impose factors as factors
fact_idx <- c(2,8:11)
for(i in fact_idx){
mtcars[,i] <- as.factor(mtcars[,i])
}
#boxplot
p <- ggplot(mtcars, aes(gear, mpg, fill=cyl)) +
geom_boxplot(notch = TRUE)
p
Run Code Online (Sandbox Code Playgroud)
这给出的图是:
如何使x轴标签同时显示齿轮和气缸?
我正在运行一个 python 脚本。我想在运行的 python 脚本中调用 *.jsl 脚本,并希望在 python 中使用它的输出。我可以知道我该怎么做吗?
我正在努力将带有 Pandas函数的SAS JMP 文件读read_csv
入 Pandas 数据帧。有没有人有这种类型的数据文件的经验?最有效的方法是什么?
sas-jmp ×6
python ×3
jsl ×2
r ×2
boxplot ×1
csv ×1
dataframe ×1
ggplot2 ×1
numpy ×1
pandas ×1
python-3.x ×1
sas ×1
scipy ×1
statistics ×1
statsmodels ×1