Count-Min草图的宽度(桶数)和深度(哈希函数数)决定了检索到的频率估计的准确性。
摘自Count-Min作者的2005年论文:
参数w和d可以通过设置w =?e /?来选择。和d =?ln1 / ??,其中回答查询的误差在?的范围内。有概率?
如上所述:
w=?e/error?
d=?ln(1/(1?certainty))?
Run Code Online (Sandbox Code Playgroud)
Count-Min原始作者在2011年发表的论文中:
假设我们希望误差最大为0.1(所有频率之和),并且确定性为99.9。然后我们想要2 / w = 1/1000,我们将w = 2000设置为(1/2)^ d = 0.001,即d = log0.001 / log0.5?10。
导致:
w=?2/error?
d=?ln(1?certainty)/ln(1/2)?
Run Code Online (Sandbox Code Playgroud)
然而,误差必须取决于存储在草图中的元素N的总数。元素越多,错误和错误概率就越大。为了创建初始草图,什么是合适的功能?
我恢复了从中删除的一个默认模板Collection Pane(只需单击close图标).它现在是从计算机中删除还是只是隐形?我可以从Evolus Pencil Project 下载页面下载它.但是我可以在不下载的情况下恢复它吗?