我是数据仓库环境中的数据库设计人员。我习惯于处理最多有 100 万行的表,现在面临着超过 50 亿行的表。与“效率工具箱”中的工具有什么显着差异?我可以相信我以前对索引、分区等的了解吗,或者这些特定工具中的一些是否比对如此大数据的帮助更多的障碍?处理表格的任何其他技巧?
(已经找到了一篇关于将7 亿行更新为相同值的好文章)
索引等的基本原理都以完全相同的方式工作,所以严格来说,唯一的区别是出错的成本!
也就是说,这里有一个(不一定是完整的)值得记住的事情清单:
estimate_percent
收集统计数据时使用较小的值,因此表中的样本较少。如果您还不熟悉阅读和理解执行计划,我会花一些时间来学习这些:您一定会在某个时候遇到性能问题,因此知道如何正确诊断问题将变得更加重要,因为添加新计划变得更加困难当您的行数较大时,索引或进行架构更改。
归档时间: |
|
查看次数: |
1972 次 |
最近记录: |