我有100万亿个元素,每个元素的大小从1字节到1万亿字节(0.909 TiB).如何存储和访问它们非常有效？

Question

这是一个面试问题:

假设:我有100万亿个元素,每个元素的大小从1字节到1万亿字节(0.909 TiB).如何存储和访问它们非常有效？

我的想法:他们希望测试有效处理大量数据的知识.这不仅仅是一个正确答案的问题.

将它们保存为一些特殊的数据结构？

实际上我对这种开放式问题没有任何想法.

任何帮助都非常感谢.

Answer 1

这实际上取决于所讨论的数据集.我认为关键在于您讨论替代方案并描述各种利弊.

也许你应该回答更多问题!

您选择的数据结构取决于您愿意做出的权衡取舍.

例如,如果您只需要按顺序遍历集合,也许您可以使用链表,因为它具有相对较小的存储开销.

如果您需要随机访问,您可能需要查看:

TL; DR:这一切都与问题有关.有很多选择.

这基本上与文件系统/数据库面临的问题相同.