标签: database-partitioning

" 何时使用索引:Cassandra的内置索引最适合包含索引值的许多行的表.特定列中存在的唯一值越多,平均而言,查询和查询的开销就越大.维护索引.例如,假设您有一个拥有十亿用户的用户表,并希望按照他们所居住的状态查找用户.许多用户将共享相同的状态列值(例如CA,NY,TX等) .).这将是一个指数的良好候选人. "

" 何时不使用索引:不要使用索引来查询少量结果的大量记录.例如,如果在具有许多不同值的列上创建索引,则字段之间的查询将招致许多寻求极少数的结果.在该表中有一个十亿用户,查找通过他们的电子邮件地址(也就是通常是唯一针对每个用户的值)的用户,而不是由他们的状态,很可能是非常低效的.它可能会更有效地手动维护表作为索引的一种形式,而不是使用Cassandra内置索引.对于包含唯一数据的列,为方便起见,使用索引有时性能良好,只要查询量到具有索引列的表是适度的而不是在恒定负载下."

查看CQL的SELECT for 中的示例

" 查询复合主键和排序结果 ",我看到类似UUID的东西被用作分区键... 这表明最好使用一些相当独特的东西？

在此输入图像描述

cassandra database-partitioning composite-primary-key database-indexes

and*_*and

2013 08-11

23
推荐指数

2
解决办法

2万
查看次数

如何在django迁移中执行原始SQL

我知道Django中的游标对象.在迁移中是否还有其他首选方法可以执行原始SQL？我想为我的一个模型表引入postgresql分区.分区逻辑是一系列功能和触发器,必须在我想要自动化的设置中添加到数据库中.

django postgresql database-partitioning django-migrations

Dav*_*han

lucky-day

22
推荐指数

1
解决办法

1万
查看次数

如何在hive中将unix纪元时间转换为日期字符串

我有一个包含时间戳列的日志文件.时间戳采用unix纪元时间格式.

我想基于具有分区年,月和日的时间戳创建分区.

到目前为止,我已经做到了这一点,但它正在抛出错误.

PARSE ERROR cannot recognize input '(' in column type

Run Code Online (Sandbox Code Playgroud)

这是我的代码.

from (
      from raw_data
            MAP  ${PREFIX}raw_data.line
            USING 's3://scripts/clean.py'
            AS (timestamp STRING, name STRING)
      ) map_out
INSERT OVERWRITE TABLE date_base_data_temp PARTITION(year(timestamp), month(timestamp)), day(timestamp))) 
    select map_out.name;

Run Code Online (Sandbox Code Playgroud)

hive function database-partitioning

pri*_*ank

2012 09-03

20
推荐指数

3
解决办法

7万
查看次数

如何删除分区而不丢弃MySQL中的数据？

我有一张桌子:

create table registrations( 
id int not null auto_increment primary key,
name varchar(50),
mobile_number varchar(13)) 
engine=innodb 
partition by range(id) (
partition p0 values less than (10000),
partition p0 values less than (20000),
partition p0 values less than max value);

Run Code Online (Sandbox Code Playgroud)

不完全像上面那样但与......相似

现在假设我的表有200000行,现在我想删除表上的分区,并根据要求重新组织它们,而不包含MAX VALUE.

任何人都可以帮我重新排列分区而不丢弃数据或删除表并重新创建它吗？

mysql sql database database-administration database-partitioning

vid*_*har

2013 01-07

20
推荐指数

3
解决办法

3万
查看次数

我希望我的hive脚本能够根据一些输入日期和天数加载相关分区.所以如果我通过date ='2011-08-03'和days ='7'
脚本应加载以下分区 - d = 2011-08-03
- d = 2011-08-04
- d = 2011-08-05
- d = 2011-08-06
- d = 2011-08-07
- d = 2011-08-08
- d = 2011-08-09

除了明确地运行之外,我没有找到任何方法来做到这一点:

ALTER TABLE table_name ADD PARTITION (d='2011-08-03');  
ALTER TABLE table_name ADD PARTITION (d='2011-08-04');  
ALTER TABLE table_name ADD …

Run Code Online (Sandbox Code Playgroud)

hadoop hive date dynamic database-partitioning

Tom*_*mer

2012 09-03

18
推荐指数

2
解决办法

2万
查看次数

ORA_HASH函数使用的算法是什么？

我在我正在处理的应用程序中遇到了一些代码,它只是为了调用UUID字符串上的ORA_HASH函数(文档)而进行数据库调用.它这样做的原因是它需要值来对另一个似乎ORA_HASH用于分区的系统进行服务调用.

我想知道算法的ORA_HASH使用,以便我可以重新实现它,以便为一个无法访问真实数据库的应用程序进行类似的服务调用,更不用说Oracle了.到目前为止,我只能找到相当于Oracle API文档的内容.

只是要非常明确:我需要克隆,ORA_HASH因为这是我控制之外的另一个系统所使用的,我需要与该系统集成.是的,如果可以使用真正标准的算法,如MD5 ,那将是很好的,但我不能,除非这ORA_HASH是在幕后的内容.

建议使用散列算法的答案或注释ORA_HASH无济于事.这个问题具体是关于ORA_HASH,而不是一般的散列或分区.

oracle algorithm hash plsql database-partitioning

Kay*_* II

2017 08-31

16
推荐指数

2
解决办法

5730
查看次数

如何按日期时间列对表进行分区？

我想通过datetime列对mysql表进行分区.有一天分区.创建表脚本是这样的:

CREATE TABLE raw_log_2011_4 (
  id bigint(20) NOT NULL AUTO_INCREMENT,
  logid char(16) NOT NULL,
  tid char(16) NOT NULL,
  reporterip char(46) DEFAULT NULL,
  ftime datetime DEFAULT NULL,
  KEY id (id)
) ENGINE=InnoDB AUTO_INCREMENT=286802795 DEFAULT CHARSET=utf8
PARTITION BY hash (day(ftime)) partitions 31;

Run Code Online (Sandbox Code Playgroud)

但是当我选择某天的数据时,它找不到分区.select语句是这样的:

explain partitions select * from raw_log_2011_4 where day(ftime) = 30;

Run Code Online (Sandbox Code Playgroud)

当我使用另一个语句时,它可以找到分区,但我没有选择某天的数据.

explain partitions select * from raw_log_2011_4 where ftime = '2011-03-30';

Run Code Online (Sandbox Code Playgroud)

有没有人告诉我如何选择某天的数据并利用分区.谢谢!

mysql hash datetime database-partitioning

tin*_*hen

2012 09-04

15
推荐指数

2
解决办法

4万
查看次数

标签统计

database-partitioning ×10

mysql ×3

database ×2

hash ×2

hive ×2

sharding ×2

sql ×2

algorithm ×1

cassandra ×1

composite-primary-key ×1

database-administration ×1

database-design ×1

database-indexes ×1

database-performance ×1

database-table ×1

date ×1

datetime ×1

django ×1

django-migrations ×1

dynamic ×1

function ×1

hadoop ×1

oracle ×1

partitioning ×1

plsql ×1

postgresql ×1

标签 统计

标签统计