小编And*_*rea的帖子

HBase列系列:有多少？

可能有很多类似的问题,但他们不回答我的情况(至少我不能明白这一点).

比方说,我在HBase中有一个包含4个列族的表.主要原因是每个列族具有不同的VERSIONS属性(非常不同).
所有系列的所有列都不存储大数据(例如fulltexts),但平均为1KB(标识符为long,一些短字符串,整数等)
我需要以多种方式访问数据:按列系列扫描和获取,按版本(特定版本或范围)获取给定行的所有单元格,最后但并非最不重要:获取给定行的所有列的最新版本.

那么,在这种情况下,有4个列族的缺点是什么？读取是否效率较低,因为它们在不同的存储文件上运行(如果行不在内存中)？

hbase

And*_*rea

lucky-day

10
推荐指数

3
解决办法

9364
查看次数

Apache Kafka:消费者状态

我在Kafka网站上阅读了文档,但在尝试实现一个完整的最小例子(生产者 - > kafka - >消费者)后,我不太清楚"消费者状态",偏移量是如何处理的.

一些信息

我正在使用HighLevel API(Java)
我的消费者是一个带有Main的简单类,基本上可以在"快速启动"Kafka页面上找到
我正在使用Zookeeper
我正在使用一个经纪人

现在,文档说HighLevel API使用者使用zookeeper存储其状态,所以我希望偏移量因此消费者的状态将保持在

Kafka经纪人重启
消费者重启

但不幸的是它没有:每次重新启动代理或消费者时,都会重新传递所有消息.现在,可能这些都是愚蠢的问题但是

在Kafka重启的情况下:我明白这取决于消费者保持其状态所以可能当经纪人(重新)启动重新发送所有(!)消息并且消费者决定要消费什么......是吗？如果是这样,如果我有10.0000.0000的消息会怎么样？
如果JVM使用者重新启动:如果状态保留在Zookeeper上,为什么重新传递消息？是否有可能新的JVM具有不同的消费者"身份"？在这种情况下,我如何绑定以前的身份？

messaging asynchronous apache-kafka

And*_*rea

2013 02-08

8
推荐指数

1
解决办法

6849
查看次数

Maven和代码度量:检查每个类是否存在测试用例

是否有可以在Maven中使用的东西来自动进行这种检查？我看到checkstyle和PMD,但我没有找到这个功能.

基本上我觉得如果有一个类A而且没有一个类,那么构建就会失败ATestCase.我知道,这不是一个严格的检查,只需创建一个类就可以轻松绕过,但此刻就足够了.

java checkstyle pmd code-metrics maven

And*_*rea

2013 11-12

6
推荐指数

1
解决办法

422
查看次数

HBase HTablePool：正确用法

HTablePool的正确使用模式是什么？我的意思是，假设我有用HTablePool实例初始化的DAO。此DAO是无状态会话Bean的成员实例，因此可以在调用之间重用。

以下各项之间的正确用法是什么？

private HTableInterface aTable;

public XYZDAO(final HTablePool pool)
{
    this.aTable = pool.getTable(...);
}

public void doSomething(...)
{
    aTable.get(...)
}

Run Code Online (Sandbox Code Playgroud)

或HTablePool应该像数据源一样使用，因此更合适的用法是

private HTablePool datasource;

public XYZDAO(final HTablePool pool)
{
    this.datasource = pool;
}

public void doSomething(...)
{
    HTableInterface aTable = datasource.getTable(...);
    aTable.get(...);
    aTable.close();
}

Run Code Online (Sandbox Code Playgroud)

hbase connection-pooling

And*_*rea

lucky-day

5
推荐指数

1
解决办法

6218
查看次数

HBase:列族TTL

根据HBase规范:

"ColumnFamilies可以设置TTL长度(以秒为单位),HBase会在到达到期时间后自动删除行.这适用于行的所有版本 - 甚至是当前版本.在行的HBase中编码的TTL时间在世界标准时间."

特别是我不理解的是这句话"一旦达到到期时间"......什么？所有版本的所有细胞？一个单元格的至少一个版本？

假设我的表有一个TTL设置为X的列族.

我正在插入一个时间戳为1的单元格:这一行的到期日期是多少？1 + X？
接下来,我正在插入另一个单元格(使用相同的行键)和时间戳2:整行的到期日期是多少？还是1 + X或2 + X？

hbase ttl

And*_*rea

2017 05-17

3
推荐指数

1
解决办法

3863
查看次数

如何在Mojo.execute()中获取$ {basedir}值(或其他属性)？

我想要获得${basedir}Mojo中的价值.我以为我可以看到这是一个正常的系统属性但是

System.getProperty("basedir")

Run Code Online (Sandbox Code Playgroud)

回报null.

public void execute() throws MojoExecutionException, MojoFailureException {
    String baseDir = ???
}

Run Code Online (Sandbox Code Playgroud)

mojo maven-plugin maven

And*_*rea

2016 09-29

3
推荐指数

1
解决办法

1597
查看次数

Apache Camel:file2并拆分每一行

我的路由配置如下:

<route>
   <from uri="file:mydir" />
   <split streaming="true" parallelProcessing="true">
       <tokenize token="\n" xml="false" trim="true" />
       <to uri="seda:requests" />
   </split>
</route>

Run Code Online (Sandbox Code Playgroud)

这是在Linux上运行但是"mydir"中的文件来自在Linux(\n)和Windows(\ r \n)上运行的应用程序,因此我的拆分在第二种情况下失败

如何为这两种情况配置一个配置？

newline splitter apache-camel

And*_*rea

lucky-day

0
推荐指数

1
解决办法

2154
查看次数

计算嵌套列表的成对差异

我有一个由以下各项组成的列表的列表（列始终为5）：

(   
 (1 3 2 4 5)   
 (2 5 1 3 1)   
 (0 8 1 2 2)  
 ...  
)

Run Code Online (Sandbox Code Playgroud)

我想获得另一个清单

每个项目都是一个列表
第n个子列表中的第i个项目是原始输入的第n个和第（n + 1）个子列表中的第i个项目之间的差。

在上面的示例中，结果将是：

(   
 (-1 -2 1 1 4)   
 (2 -3 0 1 -1)  
 ... 
)

Run Code Online (Sandbox Code Playgroud)

第一个列表（-1 -2 1 1 4）是在原始输入中获取第一和第二个列表的结果

（1 3 2 4 5）
（2 5 1 3 1）

然后减去具有相同索引的元素

（1-2 3-5 2-1 4-3 5-1）

等等。

我怎样才能做到这一点？

clojure

And*_*rea

2019 10-09

0
推荐指数

1
解决办法

82
查看次数

标签统计

hbase ×3

maven ×2

apache-camel ×1

apache-kafka ×1

asynchronous ×1

checkstyle ×1

clojure ×1

code-metrics ×1

connection-pooling ×1

java ×1

maven-plugin ×1

messaging ×1

mojo ×1

newline ×1

pmd ×1

splitter ×1

ttl ×1

标签 统计

小编And_rea的帖子

标签统计