标签: google-cloud-bigtable

行键的长度是否有上限？

我想知道Google的BigTable中的行键值是否有最大长度.

我知道文档建议将散列作为创建相同长度的密钥的潜在解决方案,但在我的场景中,如果我在密钥中包含文件路径,我可以更好地分组相关数据.

google-cloud-bigtable

Dar*_*ale

lucky-day

3
推荐指数

1
解决办法

620
查看次数

Bigtable CSV导入

我在多个文件(存储在存储桶中)中有一个大的csv数据集(> 5TB),我需要将其导入到Google Bigtable中.文件格式如下:

rowkey,s1,s2,s3,s4
text,int,int,int,int
...

有一个带有hbase的importtsv函数是完美的但是在Windows中使用Google hbase shell时似乎没有这个功能.可以使用这个工具吗？如果没有,实现这一目标的最快方法是什么？我对hbase和Google Cloud几乎没有经验,所以一个简单的例子会很棒.我已经看到一些使用DataFlow的类似示例,但除非必要,否则不愿意学习如何执行此操作.

谢谢

csv bigtable google-cloud-bigtable

mat*_*rix

lucky-day

3
推荐指数

1
解决办法

2640
查看次数

低频通话的Bigtable扫描/获取响应时间（等待时间）非常高

我在10个实例的bigtable中有一个小表（大小为100Mb）。当我尝试每1分钟扫描/获取一行时，通话延迟超过300毫秒。如果我打的是更频繁的呼叫，例如每秒一次，则延迟为50-60ms。我不确定如何改善低频通话的性能。这是预期的行为吗？还是我做错了什么。

这是我的测试代码。我为两个与大表的hbase客户端连接创建了一个执行程序。但是低频连接响应的速度要比进行更频繁呼叫的连接慢。

有什么建议么？

package com.bids;

import java.io.IOException;
import java.util.ArrayList;
import java.util.LinkedHashMap;
import java.util.List;
import java.util.Map;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.CellUtil;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.TableName;
import org.apache.hadoop.hbase.client.Connection;
import org.apache.hadoop.hbase.client.ConnectionFactory;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.client.ResultScanner;
import org.apache.hadoop.hbase.client.Scan;
import org.apache.hadoop.hbase.client.Table;
import org.apache.hadoop.hbase.filter.FilterList;
import org.apache.hadoop.hbase.util.Bytes;
import org.fusesource.jansi.AnsiConsole;

public class BTConnectTest {
    public static void main(String[] args) throws IOException, InterruptedException {

        Configuration hBaseConfig = HBaseConfiguration.create();
        hBaseConfig.set("google.bigtable.project.id", "xxxxxxx");
        hBaseConfig.set("google.bigtable.cluster.name", "hbase-test1");
        hBaseConfig.set("google.bigtable.zone.name", "us-central1-b");
        hBaseConfig.set("hbase.client.connection.impl", "com.google.cloud.bigtable.hbase1_1.BigtableConnection");

        ExecutorService executor = Executors.newSingleThreadExecutor();

        final Connection bigTableConnection1 = ConnectionFactory.createConnection(hBaseConfig, executor); …

Run Code Online (Sandbox Code Playgroud)

java google-cloud-bigtable

Pra*_*enK

2016 02-21

3
推荐指数

1
解决办法

1158
查看次数

如何使用HBase API删除Google Cloud Bigtable中单行的列

我正在使用HBase API访问Google Cloud Bigtable,但每当我尝试删除列时:

Delete delete = new Delete(r.getRow());
delete.addColumn(CF, Bytes.toBytes(d.seqid()));
delete.addColumn(CF, COL_LEASE);
tasksTable.delete(delete);

Run Code Online (Sandbox Code Playgroud)

我得到了UnsupportedOperationException:

java.lang.UnsupportedOperationException: Cannot delete single latest cell.
at com.google.cloud.bigtable.hbase.adapters.DeleteAdapter.throwIfUnsupportedPointDelete(DeleteAdapter.java:85)
at com.google.cloud.bigtable.hbase.adapters.DeleteAdapter.adapt(DeleteAdapter.java:141)
at com.google.cloud.bigtable.hbase.adapters.HBaseRequestAdapter.adapt(HBaseRequestAdapter.java:71)
at com.google.cloud.bigtable.hbase.BigtableTable.delete(BigtableTable.java:307)
at queue.BigTableRowBackedQueue.poll(BigTableRowBackedQueue.java:54)

Run Code Online (Sandbox Code Playgroud)

我在代码中看到它出现在这里.

我可以从HBase Java客户端中删除整行,并且可以使用HBase shell删除单个列.

如何在不删除Java客户端中的行的情况下删除列？

java google-cloud-platform google-cloud-bigtable

Chr*_*ris

2016 09-25

3
推荐指数

1
解决办法

1196
查看次数

如何集成测试Dataflow管道写入Bigtable？

根据Beam网站,

通常,对管道代码执行本地单元测试比调试管道的远程执行更快更简单.

我想为我的Beam/Dataflow应用程序使用测试驱动开发,因为这个原因写入Bigtable.

然而,遵循Beam测试文档我陷入了僵局--PAssert没用,因为输出PCollection包含org.apache.hadoop.hbase.client.Put对象,它们不会覆盖equals方法.

我无法获得 PCollection 的内容来对它们进行验证,因为

不可能直接获取PCollection的内容 - Apache Beam或Dataflow管道更像是应该进行什么处理的查询计划,其中PCollection是计划中的逻辑中间节点,而不是包含数据.

那么除了手动运行之外,我该如何测试这个管道呢？我正在使用Maven和JUnit(在Java中,因为所有Dataflow Bigtable Connector似乎都支持).

google-cloud-dataflow google-cloud-bigtable apache-beam

Ada*_*air

lucky-day

3
推荐指数

1
解决办法

853
查看次数

我可以自动增加BigTable中的列值吗？

BigTable是否支持类似于INCRRedis的原子增量操作？

有此功能的Golang库BT - https://godoc.org/cloud.google.com/go/bigtable#ReadModifyWrite.Increment。但是，我可以看到一个应用程序的两个实例尝试同时增加的情况，但是由于竞争条件，它只能增加一次。

google-cloud-bigtable

use*_*121

lucky-day

3
推荐指数

1
解决办法

422
查看次数

Google Cloud Bigtable压缩

我正在研究BigTable如何压缩我的数据.

我已经将1,5GB装入1张桌子; 大约500k行包含1列,平均每个单元格大约3kb.在进一步的测试中,将向包含具有相似大小的类似数据的这些行添加更多列.

每个单元格中的数据目前是一个JSON序列化的字典数组[平均10元],如:

[{
    "field1": "100.10",
    "field2": "EUR",
    "field3": "10000",
    "field4": "0",
    "field5": "1",
    "field6": "1",
    "field7": "0",
    "field8": "100",
    "field9": "110.20",
    "field10": "100-char field",
    "dateField1": "1970-01-01",
    "dateField2": "1970-01-01",
    "dateTimeField": "1970-01-01T10:10:10Z"
},{
    "field1": "200.20",
    "field2": "EUR",
    "field3": "10001",
    "field4": "0",
    "field5": "1",
    "field6": "0",
    "field7": "0",
    "field8": "100",
    "field9": "220.30",
    "field10": "100-char field",
    "dateField1": "1970-01-01",
    "dateField2": "1970-01-01",
    "dateTimeField": "1970-01-01T20:20:20Z"
}, ...]

Run Code Online (Sandbox Code Playgroud)

BigTable控制台向我显示集群保持1,2GB.因此它将我插入的1,5GB压缩到原始大小的大约80%.然而,当它们存储在单元中时对一个典型的字符串进行Gzipping但是给出了约20%的压缩比.

因此,Big Iable的压缩性能对我来说似乎很低,因为我插入的数据包含大量重复值(例如字典键).我理解BigTable的压缩速度,但我希望它能在我的数据上表现更好.

对于上述数据,压缩率是否为80%,或者预期值较低？除了重新构建我正在上传的数据之外,是否有任何改进压缩的技术？

谢谢!

google-cloud-platform google-cloud-bigtable

Mat*_*ven

lucky-day

2
推荐指数

1
解决办法

484
查看次数

由于未安装NPN/ALPN扩展而导致云Bigtable失败

尝试通过Java lib与Google Cloud Bigtable交互,并在成功创建连接对象后,发送"list"命令,我收到以下command.run()方法错误:

command.run(connection, argsList.subList(1, argsList.size()));

Run Code Online (Sandbox Code Playgroud)

特别:

Jul 06, 2015 1:12:15 PM io.grpc.transport.netty.ProtocolNegotiators$AbstractBufferingHandler fail
SEVERE: Transport failed during protocol negotiation
io.netty.channel.ChannelPipelineException: io.grpc.transport.netty.ProtocolNegotiators$1$1.handlerAdded() has thrown an exception; removed.
at io.netty.channel.DefaultChannelPipeline.callHandlerAdded0(DefaultChannelPipeline.java:600)
at io.netty.channel.DefaultChannelPipeline.callHandlerAdded(DefaultChannelPipeline.java:582)
at io.netty.channel.DefaultChannelPipeline.addFirst0(DefaultChannelPipeline.java:124)
at io.netty.channel.DefaultChannelPipeline.addFirst(DefaultChannelPipeline.java:108)
at io.netty.channel.DefaultChannelPipeline.addFirst(DefaultChannelPipeline.java:291)
at io.netty.channel.DefaultChannelPipeline.addFirst(DefaultChannelPipeline.java:246)
at io.grpc.transport.netty.ProtocolNegotiators$AbstractBufferingHandler.channelRegistered(ProtocolNegotiators.java:233)
at io.netty.channel.ChannelHandlerInvokerUtil.invokeChannelRegisteredNow(ChannelHandlerInvokerUtil.java:32)
at io.netty.channel.DefaultChannelHandlerInvoker.invokeChannelRegistered(DefaultChannelHandlerInvoker.java:50)
at io.netty.channel.AbstractChannelHandlerContext.fireChannelRegistered(AbstractChannelHandlerContext.java:114)
at io.netty.channel.DefaultChannelPipeline.fireChannelRegistered(DefaultChannelPipeline.java:833)
at io.netty.channel.AbstractChannel$AbstractUnsafe.register0(AbstractChannel.java:487)
at io.netty.channel.AbstractChannel$AbstractUnsafe.access$100(AbstractChannel.java:401)
at io.netty.channel.AbstractChannel$AbstractUnsafe$1.run(AbstractChannel.java:461)
at io.netty.util.concurrent.SingleThreadEventExecutor.runAllTasks(SingleThreadEventExecutor.java:322)
at io.netty.channel.nio.NioEventLoop.run(NioEventLoop.java:356)
at io.netty.util.concurrent.SingleThreadEventExecutor$4.run(SingleThreadEventExecutor.java:703)
at java.lang.Thread.run(Thread.java:745)
Caused by: java.lang.IllegalStateException: NPN/ALPN extensions not installed

Run Code Online (Sandbox Code Playgroud)

跟随; https://cloud.google.com/bigtable/docs/samples-simple-cli

任何帮助将非常感谢!

java google-cloud-bigtable

Eas*_*est

2016 02-21

2
推荐指数

1
解决办法

411
查看次数