相关疑难解决方法(0)

搜索快速/高效的直方图算法(带有预先指定的箱)

我没有在Matlab之外做太多编码,但我需要将我的Matlab代码导出到另一种语言,很可能是C.我的Matlab代码包括一个直方图函数histc(),它放置我的输入数据(这是双-precision,而不是整数)到指定的bin数组中,以形成直方图.

我确信我可以拼凑几个嵌套循环来生成直方图函数,但是我需要这个函数快速且内存很轻,因为它将被重复且经常访问.

为了避免重新发明轮子,任何人都知道C语言是否有任何现有的直方图功能可供使用,或者是否需要这样的人通常自己创建它?

有人知道创建直方图的有效算法吗?伪代码很好.

提前致谢.

c c++ algorithm matlab histogram

24
推荐指数
3
解决办法
4万
查看次数

设计一个数据结构,以便在最后1分钟内返回到Web服务器的连接数

在cs.stackexchange上问这个..得到了一个downvote ..因为我不是很清楚..所以我会尝试在这里更具体..

问:设计一个数据结构,以便在最后1分钟内返回到Web服务器的连接数.

假设 -

  1. 服务器连接数量很大..如印度铁路预订或社交网站等.
  2. 假设这是一个大数据问题..然后我有infra运行大数据工作..

我在寻找:

  1. 效率 - 是否可以在O(1)中执行此操作?例如,如果我们在O(n)中这样做..问题是如果计算答案需要N毫秒......还有一些连接已经在N ms中排队了.我应该如何解决这个问题.或者我只能忽略小延迟而O(n)是一个好的表现

  2. 推理/方法 - 我们在生产中的无数部署中是否做了类似的事情?有类似的问题..?

  3. 这是"大数据"吗?用于存储连接的数据是否是大数据问题的最后N(N是10阶)分钟?

我的努力:我知道 -

  1. 与Web服务器的连接在被线程提供之前放入队列中
  2. 每个连接都有一个时间戳

方法 -

  1. 只要在队列中放入连接,就将其写入文件..(至少它的时间戳和连接的句柄/唯一标识符)
  2. 一旦客户端请求"在最后1分钟给我num连接"..处理文件以找出连接数...我们知道以毫秒为单位的当前时间,并且我们必须找到其当前时间的当前时间戳的连接 - 60秒
  3. 这个工作可以使用map reduce运行.我也知道文件已经排序了数据(按时间戳).

我还运行一个守护程序,删除超过10分钟的条目/文件..所以我不存储不需要的数据

algorithm data-structures

5
推荐指数
1
解决办法
4047
查看次数

标签 统计

algorithm ×2

c ×1

c++ ×1

data-structures ×1

histogram ×1

matlab ×1