标签: database-performance

我有一个伙伴为一个列出待售汽车的人运行一个网络应用程序.有几千个客户使用它,每个客户在数据库中有数百甚至数千行(有些已经持续了5年,每月销售数百辆汽车,每次销售10行(评论,消息,等等)).他已经在一个SQL Server数据库中运行这个系统,在一个物理服务器中使用20GB或RAM,并且一直使用几个处理器,没有任何问题.这是某种奇迹吗？

就像大多数程序员一样,我不是DBA而且只是过去了,感谢ORMs等.无论我看到什么,人们都在讨论是否需要为Web应用程序的大用户进行分片或获取单独的数据库服务器.为什么是这样？拥有大量或多行的大型DB是否真的效率低下？我是否应该计划使用Cassandra或其他东西,或者我可以依靠与Postgres一起扩展吗？

database scalability database-performance

oro*_*aki

2016 02-17

8
推荐指数

2
解决办法

910
查看次数

我遇到了DB性能瓶颈,现在在哪里？

我现在有一些查询耗时太长(300毫秒),因为数据库已经增长到几百万条记录.幸运的是,对我来说,查询不需要查看大部分数据,最新的100,000条记录就足够了,所以我的计划是维护一个包含最新100,000条记录的单独表格并针对此运行查询.如果有人对更好的方法有任何建议,这将是伟大的.我真正的问题是,如果查询确实需要针对历史数据运行,有哪些选项,下一步是什么？我想到的事情:

升级硬件
使用内存数据库
在您自己的数据结构中手动缓存对象

这些事情是否正确,还有其他选择吗？某些数据库提供程序是否具有比其他数据库提供程序更多的功能来处理这些问题,例如将特定的表/索引指定为完全在内存中？

对不起,我应该提到这个,我正在使用mysql.

我忘了在上面提到索引.到目前为止,索引是我唯一的改进来源.为了识别瓶颈,我一直在使用maatkit进行查询,以显示是否正在使用索引.

我知道我现在正在远离问题的目的,所以也许我应该再做一个.我的问题是EXPLAIN说查询需要10毫秒而不是300毫秒jprofiler报告.如果有人有任何建议我会非常感激.查询是:

select bv.* 
from BerthVisit bv 
inner join BerthVisitChainLinks on bv.berthVisitID = BerthVisitChainLinks.berthVisitID 
inner join BerthVisitChain on BerthVisitChainLinks.berthVisitChainID = BerthVisitChain.berthVisitChainID 
inner join BerthJourneyChains on BerthVisitChain.berthVisitChainID = BerthJourneyChains.berthVisitChainID 
inner join BerthJourney on BerthJourneyChains.berthJourneyID = BerthJourney.berthJourneyID 
inner join TDObjectBerthJourneyMap on BerthJourney.berthJourneyID = TDObjectBerthJourneyMap.berthJourneyID 
inner join TDObject on TDObjectBerthJourneyMap.tdObjectID = TDObject.tdObjectID 
where 
BerthJourney.journeyType='A' and 
bv.berthID=251860 and 
TDObject.headcode='2L32' and 
bv.depTime is null and 
bv.arrTime > '2011-07-28 16:00:00'

Repro脚本

标签 统计

标签统计