小编use*_*737的帖子

关于垃圾邮件检测中精度和召回的困惑

我正在做一个根据教程检测垃圾邮件帐户的项目.两个标签 - "垃圾邮件"和"非垃圾邮件"用于训练和测试.分类已经完成,我正在进行评估.

结果是:

*Spam* precision: 0.962917933131
*Spam* recall: 0.6336

*Not spam* precision: 0.72697466468
*Not spam* recall: 0.9756
Run Code Online (Sandbox Code Playgroud)

我已经阅读了精确和召回的维基,仍然感到困惑,并且不知道如何将它用于测量.

我的目的是减少标记为"垃圾邮件"普通帐户的数量.一些"垃圾邮件"帐户可以逃脱并不重要.所以我想知道上面哪些结果我应该集中精力改进?谢谢.

classification machine-learning spam precision-recall

3
推荐指数
1
解决办法
1636
查看次数

Hadoop顺序数据访问

根据Hadoop权威指南:

HDFS是一种文件系统,用于存储具有流式或顺序数据访问模式的非常大的文件

什么是流式或顺序数据访问?它将如何减少磁盘的查找时间?

hadoop hdfs

3
推荐指数
1
解决办法
2076
查看次数

熊猫会丢弃重复项;值按相反顺序排列

我正在尝试找到一种方法,利用 pandasdrop_duplicates()来识别当值顺序相反时行是重复的。

一个例子是,如果我试图查找客户同时购买苹果和香蕉的交易,但数据收集顺序可能会颠倒这些项目。换句话说,当合并为完整订单时,交易将被视为重复,因为它由相同的商品组成。

我希望以下内容被识别为重复项:

Item1   Item2
Apple   Banana
Banana  Apple
Run Code Online (Sandbox Code Playgroud)

duplicates python-2.7 pandas

3
推荐指数
1
解决办法
1712
查看次数

Python按字符串排序字典可能不稳定?(在Hackerrank)

我正在使用Hackerrank进行Python 3学习.

最常见的任务中,您将获得一个仅包含小写英文字符的字符串,您需要在该字符串中找到前三个最常见的字符.

我遇到了一些问题.

我对此问题的解决方案如下:

#!/bin/python3
import sys

if __name__ == "__main__":
  s = input().strip()
  ch_dict = {}
  for ch in s:
      if ch in ch_dict : ch_dict[ch] +=1
      else: ch_dict[ch] = 1

  result = sorted(ch_dict.items(),key=lambda d:d[1],reverse=True)
  for i in result:
      if i[1] != 1:
          print(" ".join(map(str,i)))
Run Code Online (Sandbox Code Playgroud)

当我在本地环境中测试此代码时,它可以工作!

但在线测试中,它可能会失败!

对于此输入:

aabbbccde
Run Code Online (Sandbox Code Playgroud)

我提交了很多次,有时得到这样的正确答案:

b 3
a 2
c 2
Run Code Online (Sandbox Code Playgroud)

并且还可以得到这个:

b 3
c 2
a 2
Run Code Online (Sandbox Code Playgroud)

看起来好像不稳定?或者我的代码有什么关系?或者在Hackerrank环境中出了什么问题?

我怎样才能保证输出?

python sorting dictionary

3
推荐指数
1
解决办法
442
查看次数

获取一个数字列表并返回平均值

做GCSE计算和作为家庭作业任务,我需要做下面的事情.我只是开始编程,我一直在试图弄清楚如何做但无济于事.我相信我需要使用function但是搜索"python函数列表"等在我尝试时没有给我任何帮助.

你能告诉我如何:

要求用户输入"数字列表"
打印这些数字以进行确认
将它们转换为变量?
将它们加在一起
除以输入数字的总和 - 对于如何做到这一点甚至没有丝毫的线索!
最后,打印Average is和结果.

我目前得到的是:

print("Welcome, this program will find the average of a list of numbers you enter.")

numbers = input("Enter your numbers, seperated by spaces.")

print("You have entered")

print(numbers)

print(numbers[0])
print(numbers[1])
print(numbers[2])
print(numbers[3])
print(numbers[4])
print(numbers[5])
print(numbers[6])

print(len(numbers))

print("The average of the above numbers is: ") #FURTHEST I'VE GOT
Run Code Online (Sandbox Code Playgroud)

python average function list

2
推荐指数
1
解决办法
11万
查看次数

评估清单:AvgP @ K和R @ K是否相同?

我的目标是了解平均值Precision at K,和Recall at K.我有两个列表,一个是预测的,另一个是实际的(基本事实)

我们可以将这两个列表称为预测和实际.现在我想做precision@krecall@k.

使用python我在K处实现了Avg精度,如下所示:

def apk(actual, predicted, k=10):
    """
    Computes the average precision at k.

    This function computes the average precision at k between two lists of items.

    Parameters
    ----------
    actual: list
            A list of elements that are to be predicted (order doesn't matter)
    predicted : list
            A list of predicted elements (order does matter)
    k: int, optional

    Returns
    -------
    score : double
            The average precision at k over …
Run Code Online (Sandbox Code Playgroud)

python algorithm machine-learning precision-recall

2
推荐指数
1
解决办法
3516
查看次数

将数字四舍五入到最接近的 10 位 javascript

如何将数字四舍五入到最接近的 10 位?例如如果 number = 123,那么它应该四舍五入到 100,如果它是 175 大于 150 那么它应该四舍五入到 200,数字会改变吗?

javascript

2
推荐指数
1
解决办法
1336
查看次数

Python - 如何使这个多重继承工作?

我正在开发一个涉及PyQt5的项目,我正在努力管理小部件之间的继承.

我有一个QWidget屏幕继承了QtWidgets.QWidget和另一个由QtDesigner生成的类.它读起来像这样:

class a(QtWidgets.QWidget, Ui_a):
    def __init__(self, parent=None):
        QtWidgets.QWidget.__init__(self, parent)
        self.setupUi(self)

        <some attributes>

    <some functions
Run Code Online (Sandbox Code Playgroud)

在这里,我继承了Ui_a一个存储在生成文件中的单独类,我可以调用setupUi(一种方法Ui_a).

我现在想要创建另一个类b,它也是一个需要显示的QWidget.该类b需要使用类中的一些函数和属性a.我可以轻松地复制粘贴所需的东西,但这是不好的做法,所以我正在寻找一个更整洁的解决方案.如果我做代码:

class b(QtWidgets.QWidget, Ui_b, a):
    def __init__(self, parent=None):
        QtWidgets.QWidget.__init(self, parent)
        self.setupUi(self)
Run Code Online (Sandbox Code Playgroud)

然后崩溃并显示一条错误消息,指出它无法创建一致的方法解析顺序.

我的第一个问题是 - 我知道我需要调用类的init方法,a因为a那里创建了属性,但我不知道如何.

我的第二个问题是 - 如何修复此MRO错误并成功创建b可以使用其a属性和函数的新类?

python class pyqt multiple-inheritance

2
推荐指数
1
解决办法
257
查看次数

Facebook图形API,获取所有广告帐户

我有Facebook应用程序.用户的用户ID和访问令牌已授予ads_management和ads_read权限.如何获取与该用户相关联的所有广告帐户的列表?

在php中看到解决方案会很高兴.谢谢!

php api facebook facebook-graph-api

2
推荐指数
1
解决办法
2811
查看次数

Python:2的所有幂,从0到16的幂

我正在尝试使用Python进行编程,以便可以将2的结果打印到从0到16的每个数字的幂。到目前为止,我有下面的代码,但是它只能将2的结果打印到16的幂,什么也没有在它之前。如何打印其他答案?


n = 2
exponent = 16

while exponent < 16+1:
  n = n ** exponent
  exponent = exponent + 1
  print (n)
Run Code Online (Sandbox Code Playgroud)

python math loops exponent

2
推荐指数
1
解决办法
5217
查看次数