我从DPGMM得到的结果不是我所期望的.例如:
>>> import sklearn.mixture
>>> sklearn.__version__
'0.12-git'
>>> data = [[1.1],[0.9],[1.0],[1.2],[1.0], [6.0],[6.1],[6.1]]
>>> m = sklearn.mixture.DPGMM(n_components=5, n_iter=1000, alpha=1)
>>> m.fit(data)
DPGMM(alpha=1, covariance_type='diag', init_params='wmc', min_covar=None,
n_components=5, n_iter=1000, params='wmc',
random_state=<mtrand.RandomState object at 0x108a3f168>, thresh=0.01,
verbose=False)
>>> m.converged_
True
>>> m.weights_
array([ 0.2, 0.2, 0.2, 0.2, 0.2])
>>> m.means_
array([[ 0.62019109],
[ 1.16867356],
[ 0.55713292],
[ 0.36860511],
[ 0.17886128]])
Run Code Online (Sandbox Code Playgroud)
我预计结果会更像香草GMM; 也就是说,两个高斯(大约是1和6),具有不均匀的权重(如[0.625,0.375]).我预计"未使用过的"高斯人的重量接近于零.
我错误地使用了模型吗?
我也尝试过改变阿尔法而没有任何运气.
给定一个 numpy 2D 点数组,也就是第 3 维大小等于 2 的 3D 数组,如何获得所有点的最小 x 和 y 坐标?
例子:
第一的:
我编辑了我原来的例子,因为它是错误的。
data = np.array(
[[[ 0, 1],
[ 2, 3],
[ 4, 5]],
[[11, 12],
[13, 14],
[15, 16]]])
minx = 0 # data[0][0][0]
miny = 1 # data[0][0][1]
Run Code Online (Sandbox Code Playgroud)
4 x 4 x 2:
第二:
array([[[ 0, 77],
[29, 12],
[28, 71],
[46, 17]],
[[45, 76],
[33, 82],
[14, 17],
[ 3, 18]],
[[99, 40],
[96, 3],
[74, 60],
[ 4, 57]],
[[67, 57], …Run Code Online (Sandbox Code Playgroud) 我正在尝试使用Twitter API,当我在dev.twitter.com上登录时,打开一个“我的应用程序”并开始创建新的应用程序,它向我询问有关网站的信息,但是由于我没有网站,我应该填写什么内容?那个领域?谢谢。
我为项目实现的kmeans聚类算法有以下设置:
import numpy as np
import scipy
import sys
import random
import matplotlib.pyplot as plt
import operator
class KMeansClass:
#takes in an npArray like object
def __init__(self,dataset,k):
self.dataset=np.array(dataset)
#initialize mins to maximum possible value
self.min_x = sys.maxint
self.min_y = sys.maxint
#initialize maxs to minimum possible value
self.max_x = -(sys.maxint)-1
self.max_y = -(sys.maxint)-1
self.k = k
#a is the coefficient matrix that is continually updated as the centroids of the clusters change respectively.
# It is an mxk matrix where each …Run Code Online (Sandbox Code Playgroud) 我正在尝试使用python中的pyplot绘制像01010101010101这样的位的数字信号波形图

Pyplot可以吗?
我已经用零填充了已知长度的列表.我试图通过列表返回并在每个索引处放置0-1的随机浮点数.我正在使用while循环来执行此操作.但是,代码并没有输入随机数.列表仍然是零,我不明白为什么.我插入了一个print语句,它告诉我列表仍然是零.我将不胜感激任何帮助!
randomList = [0]*10
index = 0
while index < 10:
randomList[index] = random.random()
print("%d" %randomList[index])
index = index + 1
Run Code Online (Sandbox Code Playgroud) 对于机器学习任务,我需要处理相当大的数据集.结果,我无法在我的算法中同时适应整个数据集.我正在寻找一种方法来训练我的算法在数据集的部分,简单地提供新的块将无法工作,因为我的算法将只是重新安装,而不会考虑前面的例子.有没有一种方法可以用来为我的算法提供新的数据,同时"记住"之前看过的数据?
编辑:我使用的算法是来自scikit-learn的SGDRegressor.
代码:
train = pd.read_csv(os.path.join(dir,"Train.csv"),chunksize = 5000)
labels = pd.read_csv(os.path.join(dir,"Labels.csv"),chunksize = 5000)
algo = SGDRegressor(n_iter = 75)
print("looping for chunks in train")
for chunk in train:
algo.fit(train,labels)
Run Code Online (Sandbox Code Playgroud) 我有一个数据框('框架'),我想按国家和日期聚合:
aggregated=pd.DataFrame(frame.groupby(['Country','Date']).CaseID.count())
aggregated["Total duration"]=frame.groupby(['Country','Date']).Hours.sum()
aggregated["Mean duration"]=frame.groupby(['Country','Date']).Hours.mean()
Run Code Online (Sandbox Code Playgroud)
我想计算上述数字(总持续时间,平均持续时间等)仅针对'框架'中的正'小时'数字.我怎样才能做到这一点?
谢谢!
样本"框架"
import pandas as pd
Line1 = {"Country": "USA", "Date":"01 jan", "Hours":4}
Line2 = {"Country": "USA", "Date":"01 jan", "Hours":3}
Line3 = {"Country": "USA", "Date":"01 jan", "Hours":-999}
Line4 = {"Country": "Japan", "Date":"01 jan", "Hours":3}
pd.DataFrame([Line1,Line2,Line3,Line4])
Run Code Online (Sandbox Code Playgroud) 这是运行后我收到的错误我有这个问题:
Traceback (most recent call last):
File "t1.py", line 255, in <module>
pivot_rating = ratings.pivot(index='User-ID', columns='ISBN', values='Book-Rating')
File "/Library/Python/2.7/site-packages/pandas/core/frame.py", line 4182, in pivot
return pivot(self, index=index, columns=columns, values=values)
File "/Library/Python/2.7/site-packages/pandas/core/reshape.py", line 343, in pivot
indexed = Series(self[values].values,
File "/Library/Python/2.7/site-packages/pandas/core/frame.py", line 2003, in __getitem__
return self._get_item_cache(key)
File "/Library/Python/2.7/site-packages/pandas/core/generic.py", line 667, in _get_item_cache
values = self._data.get(item)
File "/Library/Python/2.7/site-packages/pandas/core/internals.py", line 1655, in get
_, block = self._find_block(item)
File "/Library/Python/2.7/site-packages/pandas/core/internals.py", line 1935, in _find_block
self._check_have(item)
File "/Library/Python/2.7/site-packages/pandas/core/internals.py", line 1942, in _check_have
raise KeyError('no item …Run Code Online (Sandbox Code Playgroud) 我正在尝试将图像堆栈读入3-d矩阵(例如X,Y,Z)。目的是遍历整个图像(从(X1,Y1)到(Xn,Yn)。在每个位置,例如(X1,Y3),我想读取整个Z数组并对其进行一些处理。例如,图像将包含计算结果。
举例来说,假设我有12幅(3x3)具有反射率数据的图像,每幅图像给出一个月的反射率。
图片1
X1 X2 X3
Y1 10 10 14
Y2 12 14 16
Y3 10 19 17
Run Code Online (Sandbox Code Playgroud)
图片2:
20 21 23
20 23 29
21 22 21
Run Code Online (Sandbox Code Playgroud)
。。。
图片7:
50 50 60
60 70 60
65 67 80
Run Code Online (Sandbox Code Playgroud)
。。。
图片12:
X1 X2 X3
Y1 10 11 12
Y2 10 16 17
Y3 12 13 14
Run Code Online (Sandbox Code Playgroud)
因此,最后,我想读取每个(X,Y)位置的z数组。从(X1,Y1)开始,到(X12,y12)结束。例如,在(X1,Y3),Z数组为:[10,21,。,。,。,65,。,。,。,12]。我将在数组上应用一些函数,例如,数组的最大值。例如,位置(X1,Y3)的新输出图像的值将为65。
我使用ENVI图像处理库在IDL中做了类似的操作。但是我真的很想用python做到这一点,因为我的目标是切换到开源语言。我刚刚开始使用python,到目前为止,我的搜索还没有给我任何解决方案,这就是为什么我要寻求经验丰富的python用户的帮助。
非常感谢,安吉拉
website = raw_input('website: ')
with open('words.txt', 'r+') as arquivo:
for lendo in arquivo.readlines():
msmwebsite = website + lendo
try:
abrindo = urllib2.urlopen(msmwebsite)
abrindo2 = abrindo.read()
except URLError as e:
pass
if abrindo.code == 200:
palavras = ['registration', 'there is no form']
for palavras2 in palavras:
if palavras2 in abrindo2:
print msmwebsite, 'up'
else:
pass
else:
pass
Run Code Online (Sandbox Code Playgroud)
它工作但由于某种原因,一些网站我收到此错误:
if abrindo.code == 200:
NameError: name 'abrindo' is not defined
Run Code Online (Sandbox Code Playgroud)
怎么解决?.................................................. .................................................. .................................................. .................................
我进行了一些数学计算,结果我有一些整数分钟。现在我需要帮助将此整数转换为此格式hh:mm:ss尝试使用日期时间执行此操作但没有成功。
NUM = 594.15
Run Code Online (Sandbox Code Playgroud)
预期转换输出:
9:54:09
Run Code Online (Sandbox Code Playgroud)