psi*_*lia 44 c algorithm math set data-structures
在C中实现set数据结构(一组唯一值)是否有任何棘手的方法?集合中的所有元素都是相同的类型,并且存在巨大的RAM内存.
据我所知,对于整数,使用值索引数组可以非常快速地完成它.但我想要一个非常通用的Set数据类型.如果一个集合可以包含它本身就会很好.
vla*_*adr 44
有多种方法可以实现 set(和map)功能,例如:
既然你提到了值索引数组,那么让我们尝试基于散列的方法,该方法自然地构建在值索引数组技术之上.
注意基于散列与基于树的方法的优缺点.
可以设计出散列的组(的特例哈希表的指针),以可哈希 POD S,与链接,内部表示为的铲斗的固定大小的数组hashables,其中:
有了大量内存供您使用,您可以大量调整存储桶数量,并结合良好的散列方法,大幅降低碰撞概率,实现几乎恒定的时间性能.
你必须实现:
您还可以使用开放式寻址作为维护和管理存储桶的替代方法.
在 C 中获得通用性的方法是 by void *,所以无论如何你都会使用指针,并且指向不同对象的指针是唯一的。这意味着您需要一个包含指针的哈希图或二叉树,这适用于所有数据对象。
这样做的缺点是您无法独立输入右值。你不能有一个包含值 5 的集合;你必须将 5 分配给一个变量,这意味着它不会匹配随机的 5。你可以将其输入为(void *) 5,出于实际目的,这可能适用于小整数,但如果你的整数可以达到足够大的大小与指针竞争,失败的可能性很小。
这也不适用于字符串值。给定char a[] = "Hello, World!"; char b[] = "Hello, World!";,一组指针将发现a和b是不同的。您可能想要对值进行哈希处理,但如果您担心哈希冲突,则应该将字符串保存在集合中,并将strncmp()存储的字符串与探测字符串进行比较。
(浮点数也有类似的问题,但尝试在集合中表示浮点数首先是一个坏主意。)
因此,您可能需要一个标记值,一个标记用于任何类型的对象,一个用于整数值,一个用于字符串值,并且可能需要更多用于不同类型的值。这很复杂,但可行。