小编syl*_*ong的帖子

在tensorflow.metrics中， precision_at_k 和 precision_at_top_k 之间的区别？

在tensorflow python API中，tf.metrics具有一些用于信息检索的指标。

尤其：

tf.precision_at_k和tf.precision_at_top_k
tf.recall_at_k和tf.recall_at_top_k

_at_k和指标有什么区别_at_top_k？

API文档似乎没有提供这方面的信息。

python information-retrieval machine-learning tensorflow

syl*_*ong

lucky-day

5
推荐指数

1
解决办法

1158
查看次数

按列表顺序从列表中选择熊猫数据框的行

该问题最初是在此处作为评论提出的，但由于该问题被标记为重复，因此无法获得正确的答案。

对于给定的pandas.DataFrame，让我们说

df = DataFrame({'A' : [5,6,3,4], 'B' : [1,2,3, 5]})
df

     A   B
0    5   1
1    6   2
2    3   3
3    4   5

Run Code Online (Sandbox Code Playgroud)

我们如何基于列中的值从列表中选择行（'A'例如）

例如

# from
list_of_values = [3,4,6]

# we would like, as a result
#      A   B
# 2    3   3
# 3    4   5
# 1    6   2

Run Code Online (Sandbox Code Playgroud)

使用此处isin提到的方法不能令人满意，因为它不能保持输入值列表的顺序。'A'

如何实现上述目标？

python dataframe pandas

syl*_*ong

lucky-day

5
推荐指数

2
解决办法

878
查看次数

如何在谷歌存储桶中读取、写入和列出文件夹和文件？

我想用 Python 读/写 Google Cloud Storage 存储桶中的文件。

假设我在gs://my_project/data.

如何列出上述文件夹中的文件夹和文件？
如何读写文件？

python google-cloud-storage

Cha*_*han

2018 08-23

4
推荐指数

1
解决办法

9573
查看次数

PyTorch conversion between tensor and numpy array: the addition operation

I am following the 60-minute blitz on PyTorch but have a question about conversion of a numpy array to a tensor. Tutorial example here.

This piece of code:

import numpy as np
a = np.ones(5)
b = torch.from_numpy(a)
np.add(a, 1, out=a)
print(a)
print(b)

Run Code Online (Sandbox Code Playgroud)

yields

[2. 2. 2. 2. 2.]

tensor([2., 2., 2., 2., 2.], dtype=torch.float64)

However

import numpy as np
a = np.ones(5)
b = torch.from_numpy(a)
a = a + 1 #the diff is here 
print(a)
print(b)

Run Code Online (Sandbox Code Playgroud)

yields

[2. …

python numpy pytorch

syl*_*ong

2020 06-20

4
推荐指数

1
解决办法

2481
查看次数

在BigQuery中，如何随机拆分查询结果？

在 BigQuery（标准 SQL）中，我想从查询中随机分割结果行。

分割需要保持一致，并且不应随时间变化：这意味着每次运行查询时，分割都应保持不变。
特别是，如果将数据添加到源表，则先前位于拆分一侧的数据应保留在同一拆分中。
该策略应该能够处理不同的分割比率

例如，我目前有一个表mytable，其中包含列（order_id、、）created_at：country

一方面，10%/90% 的分配

SELECT 
   *
FROM
   `mytable`
WHERE RAND() <= 10/90

Run Code Online (Sandbox Code Playgroud)

另一方面

SELECT 
   *
FROM
   `mytable`
WHERE RAND() > 10/90

Run Code Online (Sandbox Code Playgroud)

但这会产生不一致的分裂。有没有办法正确实现这一目标？

sql random ansi-sql google-bigquery

syl*_*ong

lucky-day

2
推荐指数

1
解决办法

2610
查看次数

在张量流中，沿 0 轴从张量中随机（子）采样 k 个条目

给定的张量rank>=1 T，我想从中随机采样k条目，均匀地，沿 0 轴。

编辑：采样应该是计算图的一部分作为惰性操作，并且每次调用时都应该输出不同的随机条目。

例如，给出Trank 2：

T = tf.constant( \
     [[1,1,1,1,1],
      [2,2,2,2,2],
      [3,3,3,3,3],
      ....
      [99,99,99,99,99],
      [100,100,100,100,100]] \
     )

Run Code Online (Sandbox Code Playgroud)

使用k=3，可能的输出是：

#output = \
#   [[34,34,34,34,34],
#    [6,6,6,6,6],
#    [72,72,72,72,72]]

Run Code Online (Sandbox Code Playgroud)

如何在 tensorflow 中实现这一点？

python tensorflow

syl*_*ong

2018 06-04

2
推荐指数

1
解决办法

2313
查看次数

为什么文本的特征提取未返回所有可能的特征名称？

这是《使用PyTorch进行自然语言处理》一书中的代码片段：

import numpy as np
from sklearn.feature_extraction.text import CountVectorizer
import seaborn as sns

corpus = ['Time flies flies like an arrow.', 'Fruit flies like a banana.']
one_hot_vectorizer = CountVectorizer()
vocab = one_hot_vectorizer.get_feature_names()

Run Code Online (Sandbox Code Playgroud)

的值vocab：

vocab = ['an', 'arrow', 'banana', 'flies', 'fruit', 'like', 'time']

Run Code Online (Sandbox Code Playgroud)

为什么'a'提取的要素名称中没有？如果自动将其排除为太普通的单词，出于同样的原因为什么不排除“ an”？如何也.get_feature_names()过滤其他单词？

python nlp feature-extraction scikit-learn pytorch

use*_*115

2019 03-04

2
推荐指数

1
解决办法

92
查看次数

找不到 BigQuery 公共数据集 (`bigquery-public-data`)

在 BigQuery 的左侧面板中，bigquery-public-data找不到该数据集。

我不知道它是怎么消失的。有人有解决方案将其重新整合吗？

google-bigquery

syl*_*ong

lucky-day

0
推荐指数

1
解决办法

4488
查看次数

标签统计

python ×6

google-bigquery ×2

pytorch ×2

tensorflow ×2

ansi-sql ×1

dataframe ×1

feature-extraction ×1

google-cloud-storage ×1

information-retrieval ×1

machine-learning ×1

nlp ×1

numpy ×1

pandas ×1

random ×1

scikit-learn ×1

sql ×1

标签 统计

小编syl_ong的帖子

标签统计