我有大约200个灰度PNG图像存储在这样的目录中.
1.png
2.png
3.png
...
...
200.png
Run Code Online (Sandbox Code Playgroud)
我想将所有PNG图像导入Numpy然后想要应用k-means来使用k-means(scikit)生成补丁字典
有没有人知道一个python库可以将这些图像加载到numpy中?
我正在考虑在Web爬行转储上大量超过10 TB +的大规模数据上训练word2vec.
我个人训练c实施GoogleNews-2012转储(1.5gb)在我的iMac上花了大约3个小时来训练和生成向量(对速度印象深刻).我没有尝试python实现虽然:(我读到某处,在300向量长度的wiki转储(11gb)上生成向量大约需要9天生成.
如何加速word2vec?我是否需要在2-3天内使用分布式模型或我需要哪种类型的硬件?我有8gb内存的iMac.
哪一个更快?Gensim python或C实现?
我看到word2vec实现不支持GPU培训.
我在我的ubuntu机器上成功编译了caffe但是无法在python中导入.
Caffe安装/ home/pbu/Desktop/caffe
我尝试将/ home/pbu/caffe/python路径添加到sys.path.append,仍然无法正常工作
我想进口咖啡
root@pbu-OptiPlex-740-Enhanced:/home/pbu/Desktop# python ./caffe/output.py
Traceback (most recent call last):
File "./caffe/output.py", line 13, in <module>
import caffe
File "/home/pbu/Desktop/caffe/python/caffe/__init__.py", line 1, in <module>
from .pycaffe import Net, SGDSolver
File "/home/pbu/Desktop/caffe/python/caffe/pycaffe.py", line 10, in <module>
from ._caffe import Net, SGDSolver
ImportError: No module named _caffe
Run Code Online (Sandbox Code Playgroud) 我按照kaggle facialkeypoints竞赛从输入图像中提取30个面部关键点(x,y).
我如何设置caffe运行回归并产生30维输出?
Input: 96x96 image
Output: 30 - (30 dimensions).
Run Code Online (Sandbox Code Playgroud)
我如何相应地设置caffe?我正在使用EUCLIDEAN_LOSS(平方和)来获得回归输出.这是一个使用caffe的简单逻辑回归模型,但它不起作用.看起来精度图层无法处理多标签输出.
I0120 17:51:27.039113 4113 net.cpp:394] accuracy <- label_fkp_1_split_1
I0120 17:51:27.039135 4113 net.cpp:356] accuracy -> accuracy
I0120 17:51:27.039158 4113 net.cpp:96] Setting up accuracy
F0120 17:51:27.039201 4113 accuracy_layer.cpp:26] Check failed: bottom[1]->channels() == 1 (30 vs. 1)
*** Check failure stack trace: ***
@ 0x7f7c2711bdaa (unknown)
@ 0x7f7c2711bce4 (unknown)
@ 0x7f7c2711b6e6 (unknown)
Run Code Online (Sandbox Code Playgroud)
这是图层文件:
name: "LogReg"
layers {
name: "fkp"
top: "data"
top: "label"
type: HDF5_DATA
hdf5_data_param {
source: "train.txt"
batch_size: 100
} …Run Code Online (Sandbox Code Playgroud) 如何在应用机器学习算法之前处理数据集中的缺失值?
我注意到丢失缺失的NAN值并不是一件好事.我通常使用pandas进行插值(计算平均值)并填充数据,这是一种有效的工作并提高分类准确性,但可能不是最好的事情.
这是一个非常重要的问题.处理数据集中缺失值的最佳方法是什么?
例如,如果您看到此数据集,则只有30%具有原始数据.
Int64Index: 7049 entries, 0 to 7048
Data columns (total 31 columns):
left_eye_center_x 7039 non-null float64
left_eye_center_y 7039 non-null float64
right_eye_center_x 7036 non-null float64
right_eye_center_y 7036 non-null float64
left_eye_inner_corner_x 2271 non-null float64
left_eye_inner_corner_y 2271 non-null float64
left_eye_outer_corner_x 2267 non-null float64
left_eye_outer_corner_y 2267 non-null float64
right_eye_inner_corner_x 2268 non-null float64
right_eye_inner_corner_y 2268 non-null float64
right_eye_outer_corner_x 2268 non-null float64
right_eye_outer_corner_y 2268 non-null float64
left_eyebrow_inner_end_x 2270 non-null float64
left_eyebrow_inner_end_y 2270 non-null float64
left_eyebrow_outer_end_x 2225 non-null float64
left_eyebrow_outer_end_y 2225 non-null float64 …Run Code Online (Sandbox Code Playgroud) 我试图将purecss(purecss.io)集成到wordpress中,我在设置网格框100%高度时遇到了问题.我应用了灰色背景(奇数/偶数n-child css属性),它清楚地显示了框内可变内容的问题.
如何将盒子设置为100%高度,以便我可以均匀地应用背景?
在屏幕截图中,我希望显示搜索表单的网格框为100%高度,以便整个背景为灰色.
<widgets class="pure-g">
<div id="search-2" class="pure-u-1 pure-u-md-1-2 l-box widget widget_search"><form role="search" method="get" id="searchform" class="searchform" action="http://localhost/wp/">
<div>
<label class="screen-reader-text" for="s">Search for:</label>
<input type="text" value="" name="s" id="s" />
<input type="submit" id="searchsubmit" value="Search" />
</div>
</form></div> <div id="recent-posts-2" class="pure-u-1 pure-u-md-1-2 l-box widget widget_recent_entries"> <h2>Recent Posts</h2> <ul>
<li>
<a href="http://localhost/wp/index.php/2015/08/25/wordpress-themes-are-just-being-released-today/">WordPress themes are just being released today all over the World 1200 GMT</a>
</li>
<li>
<a href="http://localhost/wp/index.php/2015/08/24/hello-world/">Hello world!</a>
</li>
<li>
<a href="http://localhost/wp/index.php/2013/01/11/markup-html-tags-and-formatting/">Markup: HTML Tags and Formatting</a>
</li>
<li>
<a href="http://localhost/wp/index.php/2013/01/10/markup-image-alignment/">Markup: Image Alignment</a> …Run Code Online (Sandbox Code Playgroud) 我已经下载了1000亿字谷歌新闻预训练矢量文件.最重要的是,我也在训练自己的3gb数据,生成另一个预训练的矢量文件.两者都有300个特征尺寸和超过1GB的尺寸.
我如何合并这两个巨大的预训练载体?或者我如何训练新模型并在另一个模型之上更新矢量?我看到基于C的word2vec不支持批量训练.
我希望从这两个模型中计算出类比.我相信从这两个来源学到的载体将产生相当好的结果.
这听起来很容易,但我不知道该怎么做。
我有 numpy 二维数组
X = (1783,30)
Run Code Online (Sandbox Code Playgroud)
我想将它们分成 64 个批次。我这样编写代码。
batches = abs(len(X) / BATCH_SIZE ) + 1 // It gives 28
Run Code Online (Sandbox Code Playgroud)
我正在尝试批量预测结果。所以我用零填充批次,并用预测结果覆盖它们。
predicted = []
for b in xrange(batches):
data4D = np.zeros([BATCH_SIZE,1,96,96]) #create 4D array, first value is batch_size, last number of inputs
data4DL = np.zeros([BATCH_SIZE,1,1,1]) # need to create 4D array as output, first value is batch_size, last number of outputs
data4D[0:BATCH_SIZE,:] = X[b*BATCH_SIZE:b*BATCH_SIZE+BATCH_SIZE,:] # fill value of input xtrain
#predict
#print [(k, v[0].data.shape) for k, v in …Run Code Online (Sandbox Code Playgroud) 如何对存储在NumPy阵列中的多个灰度图像进行直方图均衡?
我有这种4D格式的96x96像素NumPy数据:
(1800, 1, 96,96)
Run Code Online (Sandbox Code Playgroud) 我有一个 dmg,里面有应用程序。我已经购买了苹果开发者许可证,并且我已经使用开发者证书成功签署了 dmg。我检查了 dmg,它已被 Gatekeeper 签名并接受成功。我使用 Sierra 10.12.5 进行编码
然后我复制并运行安装程序和应用程序。但运行应用程序抛出无法打开,因为它来自身份不明的开发人员。
运行应用程序抛出身份不明的开发人员
codesign --verify --deep --verbose=2 MyQt.app
MyQt.app: code object is not signed at all
In architecture: x86_64
Run Code Online (Sandbox Code Playgroud)
是否可以共同设计 dmg 并递归地包含应用程序在内的所有内容?