小编Gau*_*ale的帖子

连接来自不同数据库的表的性能影响

我有一个网站,使用一个名为"site1"的数据库.我打算将另一个站点放在同一台服务器上,该站点也将使用"site1"中的一些表.

因此,我应该使用三个不同的数据库,如"site1"(对于第一个站点特定数据),"site2"(对于第二个站点特定数据)和"general"(对于常见表).其中将存在数据库general和site1和site2之间的连接语句.或者我应该将所有表放在一个数据库中?

哪种做法最好?每种情况下表现如何不同?我正在使用MySQL.那么这种情况尤其适用于MySQL呢?

提前致谢...

mysql database join cross-database

15
推荐指数
1
解决办法
8439
查看次数

猪:控制映射器的数量

我可以通过在导致reducers的语句中使用PARALLEL子句来控制reducers的数量.

我想控制映射器的数量.数据源已经创建,我无法减少数据源中的部件数量.是否可以控制我的猪声明产生的地图数量?我可以在产生的地图数量上设置上限和上限吗?控制它是一个好主意吗?

我尝试使用pig.maxCombinedSplitSize,mapred.min.split.size,mapred.tasktracker.map.tasks.maximum等,但它们似乎无济于事.

有人可以帮我理解如何控制地图的数量并可能分享一个工作示例吗?

hadoop apache-pig

5
推荐指数
1
解决办法
9674
查看次数

标签 统计

apache-pig ×1

cross-database ×1

database ×1

hadoop ×1

join ×1

mysql ×1