小编syl*_*ong的帖子

在tensorflow.metrics中, precision_at_k 和 precision_at_top_k 之间的区别?

在tensorflow python API中,tf.metrics具有一些用于信息检索的指标。

尤其:

  • tf.precision_at_ktf.precision_at_top_k
  • tf.recall_at_ktf.recall_at_top_k

_at_k和指标有什么区别_at_top_k

API文档似乎没有提供这方面的信息。

python information-retrieval machine-learning tensorflow

5
推荐指数
1
解决办法
1158
查看次数

按列表顺序从列表中选择熊猫数据框的行

该问题最初是在此处作为评论提出的,但由于该问题被标记为重复,因此无法获得正确的答案。

对于给定的pandas.DataFrame,让我们说

df = DataFrame({'A' : [5,6,3,4], 'B' : [1,2,3, 5]})
df

     A   B
0    5   1
1    6   2
2    3   3
3    4   5
Run Code Online (Sandbox Code Playgroud)

我们如何基于列中的值从列表中选择行('A'例如)

例如

# from
list_of_values = [3,4,6]

# we would like, as a result
#      A   B
# 2    3   3
# 3    4   5
# 1    6   2
Run Code Online (Sandbox Code Playgroud)

使用此处isin提到的方法不能令人满意,因为它不能保持输入值列表的顺序。'A'

如何实现上述目标?

python dataframe pandas

5
推荐指数
2
解决办法
878
查看次数

如何在谷歌存储桶中读取、写入和列出文件夹和文件?

我想用 Python 读/写 Google Cloud Storage 存储桶中的文件。

假设我在gs://my_project/data.

  • 如何列出上述文件夹中的文件夹和文件?

  • 如何读写文件?

python google-cloud-storage

4
推荐指数
1
解决办法
9573
查看次数

PyTorch conversion between tensor and numpy array: the addition operation

I am following the 60-minute blitz on PyTorch but have a question about conversion of a numpy array to a tensor. Tutorial example here.

This piece of code:

import numpy as np
a = np.ones(5)
b = torch.from_numpy(a)
np.add(a, 1, out=a)
print(a)
print(b)
Run Code Online (Sandbox Code Playgroud)

yields

[2. 2. 2. 2. 2.]

tensor([2., 2., 2., 2., 2.], dtype=torch.float64)

However

import numpy as np
a = np.ones(5)
b = torch.from_numpy(a)
a = a + 1 #the diff is here 
print(a)
print(b)
Run Code Online (Sandbox Code Playgroud)

yields

[2. …

python numpy pytorch

4
推荐指数
1
解决办法
2481
查看次数

在BigQuery中,如何随机拆分查询结果?

在 BigQuery(标准 SQL)中,我想从查询中随机分割结果行。

  • 分割需要保持一致,并且不应随时间变化:这意味着每次运行查询时,分割都应保持不变。

  • 特别是,如果将数据添加到源表,则先前位于拆分一侧的数据应保留在同一拆分中。

  • 该策略应该能够处理不同的分割比率

例如,我目前有一个表mytable,其中包含列(order_id、、)created_atcountry

一方面,10%/90% 的分配

SELECT 
   *
FROM
   `mytable`
WHERE RAND() <= 10/90
Run Code Online (Sandbox Code Playgroud)

另一方面

SELECT 
   *
FROM
   `mytable`
WHERE RAND() > 10/90
Run Code Online (Sandbox Code Playgroud)

但这会产生不一致的分裂。有没有办法正确实现这一目标?

sql random ansi-sql google-bigquery

2
推荐指数
1
解决办法
2610
查看次数

在张量流中,沿 0 轴从张量中随机(子)采样 k 个条目

给定 的张量rank>=1 T,我想从中随机采样k条目,均匀地,沿 0 轴。

编辑:采样应该是计算图的一部分作为惰性操作,并且每次调用时都应该输出不同的随机条目。

例如,给出Trank 2

T = tf.constant( \
     [[1,1,1,1,1],
      [2,2,2,2,2],
      [3,3,3,3,3],
      ....
      [99,99,99,99,99],
      [100,100,100,100,100]] \
     )
Run Code Online (Sandbox Code Playgroud)

使用k=3,可能的输出是:

#output = \
#   [[34,34,34,34,34],
#    [6,6,6,6,6],
#    [72,72,72,72,72]]
Run Code Online (Sandbox Code Playgroud)

如何在 tensorflow 中实现这一点?

python tensorflow

2
推荐指数
1
解决办法
2313
查看次数

为什么文本的特征提取未返回所有可能的特征名称?

这是《 使用PyTorch进行自然语言处理》一书中的代码片段:

import numpy as np
from sklearn.feature_extraction.text import CountVectorizer
import seaborn as sns

corpus = ['Time flies flies like an arrow.', 'Fruit flies like a banana.']
one_hot_vectorizer = CountVectorizer()
vocab = one_hot_vectorizer.get_feature_names()
Run Code Online (Sandbox Code Playgroud)

的值vocab

vocab = ['an', 'arrow', 'banana', 'flies', 'fruit', 'like', 'time']
Run Code Online (Sandbox Code Playgroud)

为什么'a'提取的要素名称中没有?如果自动将其排除为太普通的单词,出于同样的原因为什么不排除“ an”?如何也.get_feature_names()过滤其他单词?

python nlp feature-extraction scikit-learn pytorch

2
推荐指数
1
解决办法
92
查看次数

找不到 BigQuery 公共数据集 (`bigquery-public-data`)

在 BigQuery 的左侧面板中,bigquery-public-data找不到该数据集。

我不知道它是怎么消失的。有人有解决方案将其重新整合吗?

google-bigquery

0
推荐指数
1
解决办法
4488
查看次数