标签: counting

如何计算具有重复的集合中所有可能的唯一子集的总数?

给定包含重复元素的集合**,如何确定S的所有可能子集的总数,其中每个子集是唯一的.

例如,假设S = {A,B,B}并且让K为所有子集的集合,则K = {{},{A},{B},{A,B},{B,B}, {A,B,B}}因此| K | = 6.

另一个例子是,如果S = {A,A,B,B},则K = {{},{A},{B},{A,B},{A,A},{B,B}, {A,B,B},{A,A,B},{A,A,B,B}}及其| K | = 9

很容易看出,如果S是一个真实的集合,只有唯一的元素,那么| K | = 2 ^ | S |.

什么是计算该值的公式| K | 给定一个"set"S(带有重复项),而不生成所有子集?

**技术上不是一套.

language-agnostic math set counting combinatorics

6
推荐指数
1
解决办法
6123
查看次数

使用javascript,我如何计算亚洲字符和英语单词的混合

我需要采取一系列混合的亚洲人物(现在,只假设中国汉字或日本汉字/平假名/片假名)和"字母​​数字"(即Enlgish,法语),并按以下方式计算:

1)将每个亚洲字符数计为1; 2)将每个字母数字WORD计为1;

几个例子:

株式会社myCompany = 4个字符+ 1个字=总共5个株式会社マイコ= 7个字符


到目前为止我唯一的想法是使用:

var wordArray=val.split(/\w+/);
Run Code Online (Sandbox Code Playgroud)

然后检查每个元素以查看其内容是否为字母数字(因此计为1)或不是(因此取数组长度).但我觉得这根本不是很聪明,被计算的文本可能高达10,000字,所以不是很快.

想法?

javascript text character counting

6
推荐指数
2
解决办法
4414
查看次数

使用hector计算cassandra行中总列数的更快方法

我想使用Hector客户端计算Cassandra行的总列数.目前我正在做这个CountQuery,但对我来说似乎很慢.对于一排,只有6万列,它需要将近2秒.我的代码目前看起来像这样:

QueryResult<Integer> qr = HFactory.createCountQuery(ksp, se, se).
    setColumnFamily("ColumnFamily1").
    setKey("RowKey").
    setRange(null, null, 1000000000).execute();
Run Code Online (Sandbox Code Playgroud)

PS:我必须将范围设置为如此高的数字,否则它只计算我最大值.我在该范围内提供的数字.

我有什么想法可以改善这个吗?

java performance counting cassandra hector

6
推荐指数
1
解决办法
2350
查看次数

计算csv中特定单词出现的Python算法

我刚开始学习python.我很好奇计算CSV文件中特定单词出现的有效方法是什么,而不是简单地使用for循环逐行和读取.

更具体地说,假设我有一个CSV文件包含两列,"名称"和"等级",有数百万条记录.

如何计算"等级"下"A"的出现?

Python代码示例将不胜感激!

python csv algorithm counting

6
推荐指数
1
解决办法
1万
查看次数

如何检测和计算螺旋的转弯

我需要检测螺旋形弹簧并计算其线圈圈数.

我试过如下:

Image<Bgr, Byte> ProcessImage(Image<Bgr, Byte> img)
{ 
    Image<Bgr, Byte> imgClone = new Image<Bgr,byte>( img.Width, img.Height);
    imgClone = img.Clone();
    Bgr bgrRed = new Bgr(System.Drawing.Color.Red);


    #region Algorithm 1


    imgClone.PyrUp();
    imgClone.PyrDown();
    imgClone.PyrUp();
    imgClone.PyrDown();
    imgClone.PyrUp();
    imgClone.PyrDown();

    imgClone._EqualizeHist();
    imgClone._Dilate(20);
    imgClone._EqualizeHist();
    imgClone._Erode(10);

    imgClone.PyrUp();
    imgClone.PyrDown();
    imgClone.PyrUp();
    imgClone.PyrDown();
    imgClone.PyrUp();
    imgClone.PyrDown();

    imgClone._EqualizeHist();
    imgClone._Dilate(20);
    imgClone._EqualizeHist();
    imgClone._Erode(10);


    Image<Gray, Byte> imgCloneGray = new Image<Gray, byte>(imgClone.Width, imgClone.Height);

    CvInvoke.cvCvtColor(imgClone, imgCloneGray, Emgu.CV.CvEnum.COLOR_CONVERSION.CV_BGR2GRAY);

    imgCloneGray = imgCloneGray.Canny(c_thresh, c_threshLink);//, (int)c_threshSize);

    Contour<System.Drawing.Point> pts = imgCloneGray.FindContours(Emgu.CV.CvEnum.CHAIN_APPROX_METHOD.CV_CHAIN_APPROX_SIMPLE, Emgu.CV.CvEnum.RETR_TYPE.CV_RETR_EXTERNAL);

    CvInvoke.cvCvtColor(imgCloneGray, imgCloneYcc, Emgu.CV.CvEnum.COLOR_CONVERSION.CV_GRAY2BGR);

    if (null != pts)
    {
        imgClone.Draw(pts, bgrRed, 2);
        imgClone.Draw(pts.BoundingRectangle, …
Run Code Online (Sandbox Code Playgroud)

c# wpf counting emgucv

6
推荐指数
1
解决办法
1111
查看次数

有效计算真假的方法

这可能是一个微不足道的问题,但我想更多地了解其他更聪明有效的解决方法.

我有一个项目列表,每个项目都有一个a值为二进制的属性.

  • 如果列表中的每个项目都有a == 0,那么我设置一个单独的变量b = 0.
  • 如果列表中的每个项目都有a == 1,那么我就设置了b = 1.
  • 如果存在的混合物a == 0,并a == 1在列表中,然后我设置 b = 2.

我可以使用一个集合来跟踪a值的类型,这样如果在遍历列表后集合中有两个项目,那么我可以设置b = 2,而如果集合中只有一个项目我只是检索项目(0或1)并使用它来设置b.

有更好的方法吗?

python algorithm counting python-2.7

6
推荐指数
3
解决办法
767
查看次数

将唯一ID分配给python中的列表列表,其中重复项获得相同的id

我有一个列表列表(最多可包含90k个元素)

[[1,2,3], [1,2,4], [1,2,3], [1,2,4], [1,2,5]]
Run Code Online (Sandbox Code Playgroud)

我想为每个元素分配一个id,其中id是唯一的,除非项目是重复的.所以对于上面的列表,我需要这个:

[0,1,0,1,2]
Run Code Online (Sandbox Code Playgroud)

这样做最有效的方法是什么?

python list counting

6
推荐指数
1
解决办法
1823
查看次数

groupby一列,并在另一只熊猫中计算5以上的项目

所以我有一个这样的df:

NAME    TRY SCORE  
Bob   1st   3  
Sue   1st   7  
Tom   1st   3  
Max   1st   8  
Jay   1st   4  
Mel   1st   7  
Bob   2nd   4  
Sue   2nd   2  
Tom   2nd   6  
Max   2nd   4  
Jay   2nd   7  
Mel   2nd   8  
Bob   3rd   3  
Sue   3rd   5  
Tom   3rd   6  
Max   3rd   3  
Jay   3rd   4  
Mel   3rd   6 
Run Code Online (Sandbox Code Playgroud)

我想算一下每个人得分超过5的haw mant时间?
进入一个看起来像这样的新df2:

NAME    COUNT  
Bob     0  
Sue     1  
Tom     2  
Mary    1  
Jay     1  
Mel     3  
Run Code Online (Sandbox Code Playgroud)

我的尝试很多 - 这是最新的

df2 = …
Run Code Online (Sandbox Code Playgroud)

python counting pandas

6
推荐指数
1
解决办法
169
查看次数

Pyspark 数据框:计算数组或列表中的元素

让我们假设数据帧df为:

df.show()
Run Code Online (Sandbox Code Playgroud)

输出:

+------+----------------+
|letter| list_of_numbers|
+------+----------------+
|     A|    [3, 1, 2, 3]|
|     B|    [1, 2, 1, 1]|
+------+----------------+
Run Code Online (Sandbox Code Playgroud)

我想要做的是对countcolumn 中特定元素的编号list_of_numbers。像这样的东西:

+------+----------------+----+
|letter| list_of_numbers|ones|
+------+----------------+----+
|     A|    [3, 1, 2, 3]|   1|
|     B|    [1, 2, 1, 1]|   3|
+------+----------------+----+
Run Code Online (Sandbox Code Playgroud)

到目前为止,我已经尝试过创建udf并且它完美地工作,但我想知道我是否可以在不定义任何udf.

arrays list counting dataframe pyspark

6
推荐指数
2
解决办法
1万
查看次数

如何计算递归函数中的案例数?

def calcPath(trace_map, x, y):
    n = len(trace_map)
    count = 0
    if x > n - 1 or y > n - 1:
        pass
    elif x < n and y < n:
        if x + trace_map[x][y] == (n - 1) and y == (n - 1):
            count += 1
        elif x == (n - 1) and y + trace_map[x][y] == (n - 1):
            count += 1
        else:
            calcPath(trace_map, x + trace_map[x][y], y)
            calcPath(trace_map, x, y + trace_map[x][y])
    return count


if __name__ …
Run Code Online (Sandbox Code Playgroud)

python recursion counter if-statement counting

6
推荐指数
1
解决办法
297
查看次数