小编San*_*Dey的帖子

如何在python中模拟偏置硬币的翻转?

在无偏硬币翻转中,H或T发生50%的次数.

但我想模拟硬币给出概率为'p'的H和带有概率'(1-p)'的T.

这样的事情:

def flip(p):
   '''this function return H with probability p'''
   # do something
   return result

>> [flip(0.8) for i in xrange(10)]
[H,H,T,H,H,H,T,H,H,H]
Run Code Online (Sandbox Code Playgroud)

python random probability coin-flipping sympy

25
推荐指数
4
解决办法
3万
查看次数

在python中读取*.mhd/*.raw格式

任何人都可以告诉我如何在python中读取包含.mhd / .raw文件的数据集?

python numpy image-processing matplotlib computer-vision

17
推荐指数
3
解决办法
9999
查看次数

PCA在Scikit中的预测和重建

我可以通过以下代码在scikit中执行PCA:X_train有279180行和104列.

from sklearn.decomposition import PCA
pca = PCA(n_components=30)
X_train_pca = pca.fit_transform(X_train)
Run Code Online (Sandbox Code Playgroud)

现在,当我想将特征向量投影到特征空间时,我必须做到以下几点:

""" Projection """
comp = pca.components_ #30x104
com_tr = np.transpose(pca.components_) #104x30
proj = np.dot(X_train,com_tr) #279180x104 * 104x30 = 297180x30
Run Code Online (Sandbox Code Playgroud)

但我对此步骤犹豫不决,因为Scikit 文档说:

components_:array,[n_components,n_features]

特征空间中的主轴,表示数据中最大方差的方向.

在我看来,它已经被预测,但是当我检查源代码时,它只返回特征向量.

如何投影它的正确方法是什么?

最终,我的目标是计算重建的MSE.

""" Reconstruct """
recon = np.dot(proj,comp) #297180x30 * 30x104 = 279180x104

"""  MSE Error """
print "MSE = %.6G" %(np.mean((X_train - recon)**2))
Run Code Online (Sandbox Code Playgroud)

python machine-learning pca scikit-learn

15
推荐指数
2
解决办法
1万
查看次数

python sklearn多元线性回归显示r平方

我计算了我的多元线性回归方程,我希望看到调整后的R平方.我知道得分函数可以让我看到r平方,但它没有调整.

import pandas as pd #import the pandas module
import numpy as np
df = pd.read_csv ('/Users/jeangelj/Documents/training/linexdata.csv', sep=',')
df
       AverageNumberofTickets   NumberofEmployees   ValueofContract Industry
   0              1                    51                  25750    Retail
   1              9                    68                  25000    Services
   2             20                    67                  40000    Services
   3              1                   124                  35000    Retail
   4              8                   124                  25000    Manufacturing
   5             30                   134                  50000    Services
   6             20                   157                  48000    Retail
   7              8                   190                  32000    Retail
   8             20                   205                  70000    Retail
   9             50                   230                  75000    Manufacturing
  10             35                   265                  50000    Manufacturing
  11             65 …
Run Code Online (Sandbox Code Playgroud)

python machine-learning sklearn-pandas

11
推荐指数
1
解决办法
2万
查看次数

Python OCR:忽略文档中的签名

我正在尝试对扫描文档进行OCR,其​​中包含手写签名.见下图.

在此输入图像描述

我的问题很简单,有没有办法在忽略签名的同时使用OCR提取人名?当我运行Tesseract OCR时,它无法检索名称.我尝试使用下面的代码进行灰度/模糊/阈值处理,但没有运气.有什么建议?

image = cv2.imread(file_path)
image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
image = cv2.GaussianBlur(image, (5, 5), 0)
image = cv2.threshold(image, 0, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1]
Run Code Online (Sandbox Code Playgroud)

python ocr opencv machine-learning image-processing

11
推荐指数
2
解决办法
1383
查看次数

如何使用Python计算图像的渐变

我想知道如何使用Python来计算图像的渐变.渐变包括x和y方向.我想获得图像的x梯度图和图像的渐变图.谁能告诉我怎么做?

谢谢〜

python gradient image image-processing

10
推荐指数
3
解决办法
1万
查看次数

如何在python中模拟偏置模?

我想模拟N面偏置模具?

def roll(N,bias):
     '''this function rolls N dimensional die with biasing provided'''
     # do something
     return result

>> N=6
>> bias=( 0.20,0.20,0.15,0.15,0.14,0.16,)
>> roll(N,bias)
   2
Run Code Online (Sandbox Code Playgroud)

python numpy probability

9
推荐指数
4
解决办法
1万
查看次数

如何使用ROCR软件包计算AUC

我已经安装了SVM模型,并使用ROCR包创建了ROC曲线。如何计算曲线下面积(AUC)?

set.seed(1)
tune.out=tune(svm ,Negative~.-Positive, data=trainSparse, kernel ="radial",ranges=list(cost=c(0.1,1,10,100,1000),gamma=c(0.5,1,2,3,4) ))
summary(tune.out)
best=tune.out$best.model

##prediction on the test set
ypred = predict(best,testSparse, type = "class")
table(testSparse$Negative,ypred)

###Roc curve
yhat.opt = predict(best,testSparse,decision.values = TRUE)
fitted.opt = attributes(yhat.opt)$decision.values
rocplot(fitted.opt,testSparse ["Negative"], main = "Test Data")## 
Run Code Online (Sandbox Code Playgroud)

r machine-learning roc auc

8
推荐指数
3
解决办法
1万
查看次数

用sklearn的PolynomialFeatures无法理解

在sklearn的Polynomial Features中需要帮助.它对一个功能很有效,但每当我添加多个功能时,除了提升到度数的值之外,它还会在数组中输出一些值.例如:对于这个数组,

X=np.array([[230.1,37.8,69.2]])
Run Code Online (Sandbox Code Playgroud)

当我尝试

X_poly=poly.fit_transform(X)
Run Code Online (Sandbox Code Playgroud)

它输出

[[ 1.00000000e+00 2.30100000e+02 3.78000000e+01 6.92000000e+01
5.29460100e+04 8.69778000e+03 1.59229200e+04 1.42884000e+03
2.61576000e+03 4.78864000e+03]]
Run Code Online (Sandbox Code Playgroud)

这是8.69778000e+03,1.59229200e+04,2.61576000e+03什么?

python machine-learning scikit-learn polynomials

7
推荐指数
3
解决办法
6494
查看次数

在图像中裁剪图像?

我正在使用skimage来裁剪给定图像中的矩形,现在我将(x1,y1,x2,y2)作为矩形坐标,然后我加载了图像

 image = skimage.io.imread(filename)
 cropped = image(x1,y1,x2,y2)
Run Code Online (Sandbox Code Playgroud)

然而,这是裁剪图像的错误方法,我将如何以正确的方式在skimage中进行

python image-processing scikit-image

6
推荐指数
2
解决办法
2万
查看次数