在无偏硬币翻转中,H或T发生50%的次数.
但我想模拟硬币给出概率为'p'的H和带有概率'(1-p)'的T.
这样的事情:
def flip(p):
'''this function return H with probability p'''
# do something
return result
>> [flip(0.8) for i in xrange(10)]
[H,H,T,H,H,H,T,H,H,H]
Run Code Online (Sandbox Code Playgroud) 任何人都可以告诉我如何在python中读取包含.mhd / .raw文件的数据集?
我可以通过以下代码在scikit中执行PCA:X_train有279180行和104列.
from sklearn.decomposition import PCA
pca = PCA(n_components=30)
X_train_pca = pca.fit_transform(X_train)
Run Code Online (Sandbox Code Playgroud)
现在,当我想将特征向量投影到特征空间时,我必须做到以下几点:
""" Projection """
comp = pca.components_ #30x104
com_tr = np.transpose(pca.components_) #104x30
proj = np.dot(X_train,com_tr) #279180x104 * 104x30 = 297180x30
Run Code Online (Sandbox Code Playgroud)
但我对此步骤犹豫不决,因为Scikit 文档说:
components_:array,[n_components,n_features]
特征空间中的主轴,表示数据中最大方差的方向.
在我看来,它已经被预测,但是当我检查源代码时,它只返回特征向量.
如何投影它的正确方法是什么?
最终,我的目标是计算重建的MSE.
""" Reconstruct """
recon = np.dot(proj,comp) #297180x30 * 30x104 = 279180x104
""" MSE Error """
print "MSE = %.6G" %(np.mean((X_train - recon)**2))
Run Code Online (Sandbox Code Playgroud) 我计算了我的多元线性回归方程,我希望看到调整后的R平方.我知道得分函数可以让我看到r平方,但它没有调整.
import pandas as pd #import the pandas module
import numpy as np
df = pd.read_csv ('/Users/jeangelj/Documents/training/linexdata.csv', sep=',')
df
AverageNumberofTickets NumberofEmployees ValueofContract Industry
0 1 51 25750 Retail
1 9 68 25000 Services
2 20 67 40000 Services
3 1 124 35000 Retail
4 8 124 25000 Manufacturing
5 30 134 50000 Services
6 20 157 48000 Retail
7 8 190 32000 Retail
8 20 205 70000 Retail
9 50 230 75000 Manufacturing
10 35 265 50000 Manufacturing
11 65 …Run Code Online (Sandbox Code Playgroud) 我正在尝试对扫描文档进行OCR,其中包含手写签名.见下图.
我的问题很简单,有没有办法在忽略签名的同时使用OCR提取人名?当我运行Tesseract OCR时,它无法检索名称.我尝试使用下面的代码进行灰度/模糊/阈值处理,但没有运气.有什么建议?
image = cv2.imread(file_path)
image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
image = cv2.GaussianBlur(image, (5, 5), 0)
image = cv2.threshold(image, 0, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1]
Run Code Online (Sandbox Code Playgroud) 我想知道如何使用Python来计算图像的渐变.渐变包括x和y方向.我想获得图像的x梯度图和图像的渐变图.谁能告诉我怎么做?
谢谢〜
我想模拟N面偏置模具?
def roll(N,bias):
'''this function rolls N dimensional die with biasing provided'''
# do something
return result
>> N=6
>> bias=( 0.20,0.20,0.15,0.15,0.14,0.16,)
>> roll(N,bias)
2
Run Code Online (Sandbox Code Playgroud) 我已经安装了SVM模型,并使用ROCR包创建了ROC曲线。如何计算曲线下面积(AUC)?
set.seed(1)
tune.out=tune(svm ,Negative~.-Positive, data=trainSparse, kernel ="radial",ranges=list(cost=c(0.1,1,10,100,1000),gamma=c(0.5,1,2,3,4) ))
summary(tune.out)
best=tune.out$best.model
##prediction on the test set
ypred = predict(best,testSparse, type = "class")
table(testSparse$Negative,ypred)
###Roc curve
yhat.opt = predict(best,testSparse,decision.values = TRUE)
fitted.opt = attributes(yhat.opt)$decision.values
rocplot(fitted.opt,testSparse ["Negative"], main = "Test Data")##
Run Code Online (Sandbox Code Playgroud) 在sklearn的Polynomial Features中需要帮助.它对一个功能很有效,但每当我添加多个功能时,除了提升到度数的值之外,它还会在数组中输出一些值.例如:对于这个数组,
X=np.array([[230.1,37.8,69.2]])
Run Code Online (Sandbox Code Playgroud)
当我尝试
X_poly=poly.fit_transform(X)
Run Code Online (Sandbox Code Playgroud)
它输出
[[ 1.00000000e+00 2.30100000e+02 3.78000000e+01 6.92000000e+01
5.29460100e+04 8.69778000e+03 1.59229200e+04 1.42884000e+03
2.61576000e+03 4.78864000e+03]]
Run Code Online (Sandbox Code Playgroud)
这是8.69778000e+03,1.59229200e+04,2.61576000e+03什么?
我正在使用skimage来裁剪给定图像中的矩形,现在我将(x1,y1,x2,y2)作为矩形坐标,然后我加载了图像
image = skimage.io.imread(filename)
cropped = image(x1,y1,x2,y2)
Run Code Online (Sandbox Code Playgroud)
然而,这是裁剪图像的错误方法,我将如何以正确的方式在skimage中进行
python ×9
numpy ×2
probability ×2
scikit-learn ×2
auc ×1
gradient ×1
image ×1
matplotlib ×1
ocr ×1
opencv ×1
pca ×1
polynomials ×1
r ×1
random ×1
roc ×1
scikit-image ×1
sympy ×1