小编And*_*rea的帖子

HBase列系列:有多少?

可能有很多类似的问题,但他们不回答我的情况(至少我不能明白这一点).

  • 比方说,我在HBase中有一个包含4个列族的表.主要原因是每个列族具有不同的VERSIONS属性(非常不同).

  • 所有系列的所有列都不存储大数据(例如fulltexts),但平均为1KB(标识符为long,一些短字符串,整数等)

  • 我需要以多种方式访问​​数据:按列系列扫描和获取,按版本(特定版本或范围)获取给定行的所有单元格,最后但并非最不重要:获取给定行的所有列的最新版本.

那么,在这种情况下,有4个列族的缺点是什么?读取是否效率较低,因为它们在不同的存储文件上运行(如果行不在内存中)?

hbase

10
推荐指数
3
解决办法
9364
查看次数

Apache Kafka:消费者状态

我在Kafka网站上阅读了文档,但在尝试实现一个完整的最小例子(生产者 - > kafka - >消费者)后,我不太清楚"消费者状态",偏移量是如何处理的.

一些信息

  1. 我正在使用HighLevel API(Java)
  2. 我的消费者是一个带有Main的简单类,基本上可以在"快速启动"Kafka页面上找到
  3. 我正在使用Zookeeper
  4. 我正在使用一个经纪人

现在,文档说HighLevel API使用者使用zookeeper存储其状态,所以我希望偏移量因此消费者的状态将保持在

  • Kafka经纪人重启
  • 消费者重启

但不幸的是它没有:每次重新启动代理或消费者时,都会重新传递所有消息.现在,可能这些都是愚蠢的问题但是

  1. 在Kafka重启的情况下:我明白这取决于消费者保持其状态所以可能当经纪人(重新)启动重新发送所有(!)消息并且消费者决定要消费什么......是吗?如果是这样,如果我有10.0000.0000的消息会怎么样?

  2. 如果JVM使用者重新启动:如果状态保留在Zookeeper上,为什么重新传递消息?是否有可能新的JVM具有不同的消费者"身份"?在这种情况下,我如何绑定以前的身份?

messaging asynchronous apache-kafka

8
推荐指数
1
解决办法
6849
查看次数

Maven和代码度量:检查每个类是否存在测试用例

是否有可以在Maven中使用的东西来自动进行这种检查?我看到checkstyle和PMD,但我没有找到这个功能.

基本上我觉得如果有一个类A而且没有一个类,那么构建就会失败ATestCase.我知道,这不是一个严格的检查,只需创建一个类就可以轻松绕过,但此刻就足够了.

java checkstyle pmd code-metrics maven

6
推荐指数
1
解决办法
422
查看次数

HBase HTablePool:正确用法

HTablePool的正确使用模式是什么?我的意思是,假设我有用HTablePool实例初始化的DAO。此DAO是无状态会话Bean的成员实例,因此可以在调用之间重用。

以下各项之间的正确用法是什么?

private HTableInterface aTable;

public XYZDAO(final HTablePool pool)
{
    this.aTable = pool.getTable(...);
}

public void doSomething(...)
{
    aTable.get(...)
}
Run Code Online (Sandbox Code Playgroud)

或HTablePool应该像数据源一样使用,因此更合适的用法是

private HTablePool datasource;

public XYZDAO(final HTablePool pool)
{
    this.datasource = pool;
}

public void doSomething(...)
{
    HTableInterface aTable = datasource.getTable(...);
    aTable.get(...);
    aTable.close();
}
Run Code Online (Sandbox Code Playgroud)

hbase connection-pooling

5
推荐指数
1
解决办法
6218
查看次数

HBase:列族TTL

根据HBase规范:

"ColumnFamilies可以设置TTL长度(以秒为单位),HBase会在到达到期时间后自动删除行.这适用于行的所有版本 - 甚至是当前版本.在行的HBase中编码的TTL时间在世界标准时间."

特别是我不理解的是这句话"一旦达到到期时间"......什么?所有版本的所有细胞?一个单元格的至少一个版本?

假设我的表有一个TTL设置为X的列族.

  • 我正在插入一个时间戳为1的单元格:这一行的到期日期是多少?1 + X?
  • 接下来,我正在插入另一个单元格(使用相同的行键)和时间戳2:整行的到期日期是多少?还是1 + X或2 + X?

hbase ttl

3
推荐指数
1
解决办法
3863
查看次数

如何在Mojo.execute()中获取$ {basedir}值(或其他属性)?

我想要获得${basedir}Mojo中的价值.我以为我可以看到这是一个正常的系统属性但是

System.getProperty("basedir") 
Run Code Online (Sandbox Code Playgroud)

回报null.

public void execute() throws MojoExecutionException, MojoFailureException {
    String baseDir = ???
}
Run Code Online (Sandbox Code Playgroud)

mojo maven-plugin maven

3
推荐指数
1
解决办法
1597
查看次数

Apache Camel:file2并拆分每一行

我的路由配置如下:

<route>
   <from uri="file:mydir" />
   <split streaming="true" parallelProcessing="true">
       <tokenize token="\n" xml="false" trim="true" />
       <to uri="seda:requests" />
   </split>
</route>
Run Code Online (Sandbox Code Playgroud)

这是在Linux上运行但是"mydir"中的文件来自在Linux(\n)和Windows(\ r \n)上运行的应用程序,因此我的拆分在第二种情况下失败

如何为这两种情况配置一个配置?

newline splitter apache-camel

0
推荐指数
1
解决办法
2154
查看次数

计算嵌套列表的成对差异

我有一个由以下各项组成的列表的列表(列始终为5):

(   
 (1 3 2 4 5)   
 (2 5 1 3 1)   
 (0 8 1 2 2)  
 ...  
)
Run Code Online (Sandbox Code Playgroud)

我想获得另一个清单

  • 每个项目都是一个列表
  • 第n个子列表中的第i个项目是原始输入的第n个和第(n + 1)个子列表中的第i个项目之间的差。

在上面的示例中,结果将是:

(   
 (-1 -2 1 1 4)   
 (2 -3 0 1 -1)  
 ... 
)
Run Code Online (Sandbox Code Playgroud)

第一个列表(-1 -2 1 1 4)是在原始输入中获​​取第一和第二个列表的结果

(1 3 2 4 5)
(2 5 1 3 1)

然后减去具有相同索引的元素

(1-2 3-5 2-1 4-3 5-1)

等等。

我怎样才能做到这一点?

clojure

0
推荐指数
1
解决办法
82
查看次数