小编lem*_*mon的帖子

如何选择类别概率的最佳阈值？

我的神经网络的输出是多标签分类的预测类概率表：

print(probabilities)

|   |      1       |      3       | ... |     8354     |     8356     |     8357     |
|---|--------------|--------------|-----|--------------|--------------|--------------|
| 0 | 2.442745e-05 | 5.952136e-06 | ... | 4.254002e-06 | 1.894523e-05 | 1.033957e-05 |
| 1 | 7.685694e-05 | 3.252202e-06 | ... | 3.617730e-06 | 1.613792e-05 | 7.356643e-06 |
| 2 | 2.296657e-06 | 4.859554e-06 | ... | 9.934525e-06 | 9.244772e-06 | 1.377618e-05 |
| 3 | 5.163169e-04 | 1.044035e-04 | ... | 1.435158e-04 | 2.807420e-04 | 2.346930e-04 |
| 4 …

Run Code Online (Sandbox Code Playgroud)

python machine-learning neural-network scikit-learn

lem*_*mon

2018 08-30

5
推荐指数

2
解决办法

9408
查看次数

为什么Keras LSTM在CPU上比GPU快三倍？

我使用Kaggle的这款笔记本来运行LSTM神经网络.

我开始训练神经网络,我发现它太慢了.它几乎比CPU训练慢三倍.

CPU perfomance: 每个时期8分钟;
GPU perfomance: 每个时期26分钟.

在此之后,我决定在Stackoverflow上找到这个问题的答案,并且我应用了一个CuDNNLSTM (仅在GPU上运行)而不是LSTM.

因此,GPU性能每个时期仅变为1分钟,模型的准确度降低3%.

问题:

1)有人知道为什么GPU在经典LSTM层中的工作速度比CPU慢吗？我不明白为什么会这样.

2)为什么当我使用CuDNNLSTM而不是LSTM,训练变得更快,模型的准确性降低？

PS:

My CPU: 英特尔酷睿i7-7700处理器(8M高速缓存,高达4.20 GHz)

My GPU: nVidia GeForce GTX 1050 Ti(4 GB)

python gpu machine-learning keras tensorflow

lem*_*mon

2018 09-24

4
推荐指数

2
解决办法

1910
查看次数

遍历两个字典列表并创建不带循环的元组列表

我有两份字典：list1和list2。

print(list1)
[{'name': 'fooa', 'desc': 'bazv', 'city': 1, 'ID': 1},
 {'name': 'bard', 'desc': 'besd', 'city': 2, 'ID': 1},
 {'name': 'baer', 'desc': 'bees', 'city': 2, 'ID': 1},
 {'name': 'aaaa', 'desc': 'bnbb', 'city': 1, 'ID': 2},
 {'name': 'cgcc', 'desc': 'dgdd', 'city': 1, 'ID': 2}]

print(list2)
[{'name': 'foo', 'desc': 'baz', 'city': 1, 'ID': 1},
 {'name': 'bar', 'desc': 'bes', 'city': 1, 'ID': 1},
 {'name': 'bar', 'desc': 'bes', 'city': 2, 'ID': 1},
 {'name': 'aaa', 'desc': 'bbb', 'city': 1, 'ID': 2},
 {'name': …

Run Code Online (Sandbox Code Playgroud)

python

lem*_*mon

lucky-day

2
推荐指数

1
解决办法

92
查看次数

Elasticsearch按字段分组以获取首次出现的值

抱歉，如果我的问题可能重复，我只是没有发现任何类似的问题。

我通过Python将请求发送到Elasticsearch。

这是我的代码：

import json
import requests

query = {
 "size": 5,
 "_source": ["UserId", "Name", "Status"],
 "query": {
   "match_all": {
   }
 }
}

query = json.dumps(query) 

response = requests.get(f'{ES_URL}/{ES_INDEX}/_search',
                        headers={'Content-Type': 'application/json'},
                        data=query)

Run Code Online (Sandbox Code Playgroud)

这是我的回应：

{'took': 16,
 'timed_out': False,
 '_shards': {'total': 5, 'successful': 5, 'skipped': 0, 'failed': 0},
 'hits': {'total': 2069099,
  'max_score': 1.0,
  'hits': [{'_index': 'index2',
    '_type': 'indexresult',
    '_id': '8768768',
    '_score': 1.0,
    '_source': {'UserId': 4264151, 'Name': 'Victor', 'Status': 'High'}},
   {'_index': 'index2',
    '_type': 'indexresult',
    '_id': '5463255',
    '_score': 1.0,
    '_source': {'UserId': 4264151, 'Name': 'Victor', …

Run Code Online (Sandbox Code Playgroud)

python elasticsearch

lem*_*mon

lucky-day

1
推荐指数

1
解决办法

32
查看次数