小编pbu*_*pbu的帖子

将PNG文件导入Numpy?

我有大约200个灰度PNG图像存储在这样的目录中.

1.png
2.png
3.png
...
...
200.png
Run Code Online (Sandbox Code Playgroud)

我想将所有PNG图像导入Numpy然后想要应用k-means来使用k-means(scikit)生成补丁字典

有没有人知道一个python库可以将这些图像加载到numpy中?

python png numpy image

39
推荐指数
6
解决办法
7万
查看次数

如何在非常大的数据集上训练Word2vec?

我正在考虑在Web爬行转储上大量超过10 TB +的大规模数据上训练word2vec.

我个人训练c实施GoogleNews-2012转储(1.5gb)在我的iMac上花了大约3个小时来训练和生成向量(对速度印象深刻).我没有尝试python实现虽然:(我读到某处,在300向量长度的wiki转储(11gb)上生成向量大约需要9天生成.

  1. 如何加速word2vec?我是否需要在2-3天内使用分布式模型或我需要哪种类型的硬件?我有8gb内存的iMac.

  2. 哪一个更快?Gensim python或C实现?

我看到word2vec实现不支持GPU培训.

c python machine-learning word2vec

18
推荐指数
1
解决办法
1万
查看次数

导入caffe错误

我在我的ubuntu机器上成功编译了caffe但是无法在python中导入.

Caffe安装/ home/pbu/Desktop/caffe

我尝试将/ home/pbu/caffe/python路径添加到sys.path.append,仍然无法正常工作

我想进口咖啡

root@pbu-OptiPlex-740-Enhanced:/home/pbu/Desktop# python ./caffe/output.py
Traceback (most recent call last):
  File "./caffe/output.py", line 13, in <module>
    import caffe
  File "/home/pbu/Desktop/caffe/python/caffe/__init__.py", line 1, in <module>
    from .pycaffe import Net, SGDSolver
  File "/home/pbu/Desktop/caffe/python/caffe/pycaffe.py", line 10, in <module>
    from ._caffe import Net, SGDSolver
ImportError: No module named _caffe
Run Code Online (Sandbox Code Playgroud)

python caffe

13
推荐指数
1
解决办法
3万
查看次数

Caffe中的多标签回归

我按照kaggle facialkeypoints竞赛从输入图像中提取30个面部关键点(x,y).

我如何设置caffe运行回归并产生30维输出?

Input: 96x96 image
Output: 30 - (30 dimensions).
Run Code Online (Sandbox Code Playgroud)

我如何相应地设置caffe?我正在使用EUCLIDEAN_LOSS(平方和)来获得回归输出.这是一个使用caffe的简单逻辑回归模型,但它不起作用.看起来精度图层无法处理多标签输出.

I0120 17:51:27.039113  4113 net.cpp:394] accuracy <- label_fkp_1_split_1
I0120 17:51:27.039135  4113 net.cpp:356] accuracy -> accuracy
I0120 17:51:27.039158  4113 net.cpp:96] Setting up accuracy
F0120 17:51:27.039201  4113 accuracy_layer.cpp:26] Check failed: bottom[1]->channels() == 1 (30 vs. 1) 
*** Check failure stack trace: ***
    @     0x7f7c2711bdaa  (unknown)
    @     0x7f7c2711bce4  (unknown)
    @     0x7f7c2711b6e6  (unknown)
Run Code Online (Sandbox Code Playgroud)

这是图层文件:

name: "LogReg"
layers {
  name: "fkp"
  top: "data"
  top: "label"
  type: HDF5_DATA
  hdf5_data_param {
   source: "train.txt"
   batch_size: 100
  } …
Run Code Online (Sandbox Code Playgroud)

machine-learning deep-learning caffe kaggle

11
推荐指数
1
解决办法
6499
查看次数

如何在python中处理机器学习中缺少的NaN

如何在应用机器学习算法之前处理数据集中的缺失值?

我注意到丢失缺失的NAN值并不是一件好事.我通常使用pandas进行插值(计算平均值)并填充数据,这是一种有效的工作并提高分类准确性,但可能不是最好的事情.

这是一个非常重要的问题.处理数据集中缺失值的最佳方法是什么?

例如,如果您看到此数据集,则只有30%具有原始数据.

Int64Index: 7049 entries, 0 to 7048
Data columns (total 31 columns):
left_eye_center_x            7039 non-null float64
left_eye_center_y            7039 non-null float64
right_eye_center_x           7036 non-null float64
right_eye_center_y           7036 non-null float64
left_eye_inner_corner_x      2271 non-null float64
left_eye_inner_corner_y      2271 non-null float64
left_eye_outer_corner_x      2267 non-null float64
left_eye_outer_corner_y      2267 non-null float64
right_eye_inner_corner_x     2268 non-null float64
right_eye_inner_corner_y     2268 non-null float64
right_eye_outer_corner_x     2268 non-null float64
right_eye_outer_corner_y     2268 non-null float64
left_eyebrow_inner_end_x     2270 non-null float64
left_eyebrow_inner_end_y     2270 non-null float64
left_eyebrow_outer_end_x     2225 non-null float64
left_eyebrow_outer_end_y     2225 non-null float64 …
Run Code Online (Sandbox Code Playgroud)

python machine-learning missing-data pandas

8
推荐指数
1
解决办法
9569
查看次数

PureCSS网格框不是100%高度,内容可变

我试图将purecss(purecss.io)集成到wordpress中,我在设置网格框100%高度时遇到了问题.我应用了灰色背景(奇数/偶数n-child css属性),它清楚地显示了框内可变内容的问题.

如何将盒子设置为100%高度,以便我可以均匀地应用背景?

在屏幕截图中,我希望显示搜索表单的网格框为100%高度,以便整个背景为灰色.

在此输入图像描述

<widgets class="pure-g">      
<div id="search-2" class="pure-u-1 pure-u-md-1-2 l-box widget widget_search"><form role="search" method="get" id="searchform" class="searchform" action="http://localhost/wp/">
                <div>
                    <label class="screen-reader-text" for="s">Search for:</label>
                    <input type="text" value="" name="s" id="s" />
                    <input type="submit" id="searchsubmit" value="Search" />
                </div>
            </form></div>       <div id="recent-posts-2" class="pure-u-1 pure-u-md-1-2 l-box widget widget_recent_entries">     <h2>Recent Posts</h2>       <ul>
                    <li>
                <a href="http://localhost/wp/index.php/2015/08/25/wordpress-themes-are-just-being-released-today/">WordPress themes are just being released today all over the World 1200 GMT</a>
                        </li>
                    <li>
                <a href="http://localhost/wp/index.php/2015/08/24/hello-world/">Hello world!</a>
                        </li>
                    <li>
                <a href="http://localhost/wp/index.php/2013/01/11/markup-html-tags-and-formatting/">Markup: HTML Tags and Formatting</a>
                        </li>
                    <li>
                <a href="http://localhost/wp/index.php/2013/01/10/markup-image-alignment/">Markup: Image Alignment</a> …
Run Code Online (Sandbox Code Playgroud)

html css

8
推荐指数
1
解决办法
2306
查看次数

合并Word2Vec中的预训练模型?

我已经下载了1000亿字谷歌新闻预训练矢量文件.最重要的是,我也在训练自己的3gb数据,生成另一个预训练的矢量文件.两者都有300个特征尺寸和超过1GB的尺寸.

我如何合并这两个巨大的预训练载体?或者我如何训练新模型并在另一个模型之上更新矢量?我看到基于C的word2vec不支持批量训练.

我希望从这两个模型中计算出类比.我相信从这两个来源学到的载体将产生相当好的结果.

machine-learning word2vec

7
推荐指数
1
解决办法
2880
查看次数

如何批量拆分numpy数组?

这听起来很容易,但我不知道该怎么做。

我有 numpy 二维数组

X = (1783,30)
Run Code Online (Sandbox Code Playgroud)

我想将它们分成 64 个批次。我这样编写代码。

batches = abs(len(X) / BATCH_SIZE ) + 1  // It gives 28
Run Code Online (Sandbox Code Playgroud)

我正在尝试批量预测结果。所以我用零填充批次,并用预测结果覆盖它们。

predicted = []

for b in xrange(batches): 

 data4D = np.zeros([BATCH_SIZE,1,96,96]) #create 4D array, first value is batch_size, last number of inputs
 data4DL = np.zeros([BATCH_SIZE,1,1,1]) # need to create 4D array as output, first value is  batch_size, last number of outputs
 data4D[0:BATCH_SIZE,:] = X[b*BATCH_SIZE:b*BATCH_SIZE+BATCH_SIZE,:] # fill value of input xtrain

 #predict
 #print [(k, v[0].data.shape) for k, v in …
Run Code Online (Sandbox Code Playgroud)

python numpy

6
推荐指数
2
解决办法
2万
查看次数

使用NumPy对灰度图像进行直方图均衡

如何对存储在NumPy阵列中的多个灰度图像进行直方图均衡?

我有这种4D格式的96x96像素NumPy数据:

(1800, 1, 96,96)
Run Code Online (Sandbox Code Playgroud)

python numpy image-processing histogram

5
推荐指数
1
解决办法
2万
查看次数

dmg和里面的App如何协同设计?

我有一个 dmg,里面有应用程序。我已经购买了苹果开发者许可证,并且我已经使用开发者证书成功签署了 dmg。我检查了 dmg,它已被 Gatekeeper 签名并接受成功。我使用 Sierra 10.12.5 进行编码

然后我复制并运行安装程序和应用程序。但运行应用程序抛出无法打开,因为它来自身份不明的开发人员。

运行应用程序抛出身份不明的开发人员

在此输入图像描述

codesign --verify --deep  --verbose=2 MyQt.app
MyQt.app: code object is not signed at all
In architecture: x86_64
Run Code Online (Sandbox Code Playgroud)

是否可以共同设计 dmg 并递归地包含应用程序在内的所有内容?

macos code-signing code-signing-certificate

5
推荐指数
1
解决办法
4035
查看次数