我有一个将生成大量图像的项目。大约 1,000,000 开始。它们不是大图像,所以一开始我会将它们全部存储在一台机器上。
您如何建议有效地存储这些图像?(目前是 NTFS 文件系统)
我正在考虑一个命名方案...一开始,所有图像都将有一个从 1 开始的增量名称,我希望这将有助于我以后在需要时对它们进行排序,并将它们放在不同的文件夹中。
什么是更好的命名方案:
a/b/c/0 ... z/z/z/999
或者
a/b/c/000 ... z/z/z/999
对此有什么想法吗?
我们有一个应用程序计划存储大约 1.1TB 的 XML 文件,平均大小为 8.5kb。
这些代表了 18 个月的滚动数据,每天创建大约 200,000 个新文件。
每个文件只会写入一次,然后有 3% 的机会在接下来的 18 个月内被读取少量 (<10) 次。
哪些 NTFS 选项对我们开放,有助于提高性能?
目前我们名单上的有:
关于碎片:我们计划使用 2k 集群大小来提高磁盘空间使用效率。每个文件将只写入一次(即没有文件编辑)。文件将在 18 个月后每天删除。
因此,我们认为碎片化不会是一个重大问题。
我有一个开发人员实用程序,我将用它来生成 5000 万个文件。目录结构有四层深。顶层包含 16 个目录(2000-2016 年),下一层 - 月(1-12),下一层 - 天(1 - 31),最后是 - xml 文件(每个最多 85k)。最终目录可能有 3000 多个文件(我还没有算出 5000 万个文件如何适合该目录结构)。
我目前正在运行该实用程序,并且我已经完成了大约 1/3(要执行的天数)。正如我所担心的,遍历目录树的任何部分都是一种痛苦的经历。仅在资源管理器中需要几秒钟。这与服务器级硬件。SAS 7200RPM(我知道现在这并不快)12 TB Raid 5 或 10,分配有 4 个 3.4ghz xeon cpu。
如何提高 Windows Server 2012 R2 在内存中缓存文件句柄的能力?我没有运行 NFS 服务。
M:\>defrag /a /v /h m:
Microsoft Drive Optimizer
Copyright (c) 2013 Microsoft Corp.
Invoking slab consolidation on DB MDF (M:)...
The operation completed successfully.
Post Defragmentation Report:
Volume Information:
Volume size = 12.99 TB
Cluster size = 64 KB …
Run Code Online (Sandbox Code Playgroud)