标签: hbase

hbase-site.xml中的zookeeper仲裁设置究竟是什么？

java hadoop hbase apache-zookeeper

raj*_*raj

2012 08-16

20
推荐指数

2
解决办法

3万
查看次数

对hadoop工作跟踪器api的困惑

我试着从求职者那里收集一些信息.对于初学者,我想首先获得运行的工作信息,例如工作ID或工作名称等.但是已经卡住了,这就是我所拥有的(打印出当前正在运行的工作的工作ID):

public static void main(String[] args) throws IOException {
        Configuration conf = HBaseConfiguration.create();
        conf.set("hbase.zookeeper.quorum", "zk1.myhost,zk2.myhost,zk3.myhost");
        conf.set("hbase.zookeeper.property.clientPort", "2181");

        InetSocketAddress jobtracker = new InetSocketAddress("jobtracker.mapredhost.myhost", 8021);
        JobClient jobClient = new JobClient(jobtracker, conf);
        JobStatus[] jobs = jobClient.jobsToComplete();

        for (int i = 0; i < jobs.length; i++) {
            JobStatus js = jobs[i];
            if (js.getRunState() == JobStatus.RUNNING) {
                JobID jobId = js.getJobID();
                System.out.println(jobId);
            }
        }
    }

Run Code Online (Sandbox Code Playgroud)

这上面努力时显示作业ID,但现在我想显示的作业名称以及工作方式的魅力.所以我在打印作业ID后添加了这一行:

System.out.println(jobClient.getJob(jobId).getJobName());

Run Code Online (Sandbox Code Playgroud)

我得到这个例外:

Exception in thread "main" java.lang.NullPointerException
    at org.apache.hadoop.mapred.JobClient$NetworkedJob.<init>(JobClient.java:226)
    at org.apache.hadoop.mapred.JobClient.getJob(JobClient.java:1080)
    at org.apache.test.JobTracker.main(JobTracker.java:28)

Run Code Online (Sandbox Code Playgroud)

jobClient不是null.我知道这是因为我尝试使用null …

java jobs hadoop hbase

Gan*_*row

2017 05-23

20
推荐指数

1
解决办法

5218
查看次数

Hbase/Hadoop查询帮助

我正在与一位朋友合作开发一个项目,该项目将利用Hbase来存储它的数据.有什么好的查询示例吗？我似乎正在编写大量的Java代码来遍历RowResult的列表,而在SQL领域,我可以编写一个简单的查询.我错过了什么吗？或者Hbase遗漏了什么？

hadoop hbase

zec*_*ahs

lucky-day

19
推荐指数

1
解决办法

2万
查看次数

HBase:复制如何工作？

我目前正在评估HBase作为数据存储区,但有一个问题没有得到解答:HBase在许多节点上存储了同一对象的许多副本(也就是复制).由于HBase具有所谓的强一致性(与最终一致性相对),因此它保证每个副本在读取时返回相同的值.

据我了解HBase概念,在读取值时,首先要查询HBase主服务器(必须有多个)提供数据的RegionServer.然后,我可以在没有主发明的情况下发出读写请求.然后如何复制工作？

HBase如何提供一致性？
内部写入操作如何工作？
写操作是否阻塞,直到写入所有副本(=>同步复制).如果是,谁管理此转移？
HDFS如何进入游戏？

我已经阅读了BigTable -Paper并搜索了文档,但我没有找到关于HBase架构的更多信息.

谢谢!

hadoop hbase

the*_*ega

lucky-day

18
推荐指数

1
解决办法

9946
查看次数

hbase无法找到现有表

我设置了一个hbase集群来存储来自opentsdb的数据.最近由于重启了一些节点,hbase丢失了表"tsdb".我仍然可以在hbase的主节点页面上,但是当我点击它时,它给了我一个tableNotFoundException

org.apache.hadoop.hbase.TableNotFoundException: tsdb
    at org.apache.hadoop.hbase.client.HConnectionManager$HConnectionImplementation.locateRegionInMeta(HConnectionManager.java:952)
    at org.apache.hadoop.hbase.client.HConnectionManager$HConnectionImplementation.locateRegion(HConnectionManager.java:818)
    at org.apache.hadoop.hbase.client.HConnectionManager$HConnectionImplementation.locateRegion(HConnectionManager.java:782)
    at org.apache.hadoop.hbase.client.HTable.finishSetup(HTable.java:249)
    at org.apache.hadoop.hbase.client.HTable.<init>(HTable.java:213)
    at org.apache.hadoop.hbase.client.HTable.<init>(HTable.java:171)
......

Run Code Online (Sandbox Code Playgroud)

我进入了hbase shell,尝试找到'tsdb'表,但得到了类似的消息

hbase(main):018:0> scan 'tsdb'
ROW                                                          COLUMN+CELL

ERROR: Unknown table tsdb!

Run Code Online (Sandbox Code Playgroud)

但是当我试图重新创建这个表时,hbase shell告诉我该表已经存在...

hbase(main):013:0> create 'tsdb', {NAME => 't', VERSIONS => 1, BLOOMFILTER=>'ROW'}

ERROR: Table already exists: tsdb!

Run Code Online (Sandbox Code Playgroud)

我还可以在hbase shell中列出该表

hbase(main):001:0> list
TABLE
tsdb
tsdb-uid
2 row(s) in 0.6730 seconds

Run Code Online (Sandbox Code Playgroud)

看一下日志,我发现这应该是我的问题的原因

2012-05-14 12:06:22,140 WARN org.apache.hadoop.hbase.client.HConnectionManager$HConnectionImplementation: Encountered problems when prefetch META table:
org.apache.hadoop.hbase.TableNotFoundException: Cannot find row in .META. for table: tsdb, row=tsdb,,99999999999999
    at org.apache.hadoop.hbase.client.MetaScanner.metaScan(MetaScanner.java:157)
    at …

Run Code Online (Sandbox Code Playgroud)

hadoop hbase opentsdb

She*_*eng

2012 05-15

18
推荐指数

2
解决办法

3万
查看次数

datanode,regionserver在Hbase-hadoop集成中的作用

根据我的理解,行被插入到HBase表中,并被存储为不同区域服务器中的区域.因此,区域服务器存储数据

类似地,就Hadoop而言,数据存储在hadoop集群中存在的数据节点中.

假设我在Hadoop 1.1.1之上配置了HBase 0.90.6,如下所示

2个节点 - 主站和从站

主节点充当,
- Hadoop - Namenode,Secondary Namenode,作业跟踪器,数据节点,任务跟踪器
- HBase - Master,RegionServer和zookeeper.
从节点充当,
- Hadoop datanode和任务跟踪器
- HBase区域服务器

根据我的陈述,如果表数据存储在区域服务器中; 那么数据节点和区域服务器的作用是什么？

hadoop hbase

lea*_*man

2014 12-08

18
推荐指数

1
解决办法

2万
查看次数

"HDFS缺少随机读写访问"是什么意思？

任何文件系统都应提供API来访问其文件和目录等.

那么,"HDFS缺少随机读写访问"是什么意思？

所以,我们应该使用HBase.

hadoop hbase hdfs

lov*_*ing

2014 07-12

18
推荐指数

1
解决办法

6907
查看次数

无法从凤凰表中读取大数据

大家好我在大型桌子上运行凤凰计数查询时收到以下错误消息.

0: jdbc:phoenix:hadoopm1:2181> select Count(*) from PJM_DATASET;
+------------+
|  COUNT(1)  |
+------------+

java.lang.RuntimeException: org.apache.phoenix.exception.PhoenixIOException: org.apache.phoenix.exception.PhoenixIOException: Failed after attempts=36, exceptions:
Fri Jan 09 02:18:10 CST 2015, null, java.net.SocketTimeoutException: callTimeout=60000, callDuration=62365: row '' on table 'PJM_DATASET' at region=PJM_DATASET,,1420633295836.4394a3aa2721f87f3e6216d20ebeec44., hostname=hadoopctrl,60020,1420790733247, seqNum=27753

    at sqlline.SqlLine$IncrementalRows.hasNext(SqlLine.java:2440)
    at sqlline.SqlLine$TableOutputFormat.print(SqlLine.java:2074)
    at sqlline.SqlLine.print(SqlLine.java:1735)
    at sqlline.SqlLine$Commands.execute(SqlLine.java:3683)
    at sqlline.SqlLine$Commands.sql(SqlLine.java:3584)
    at sqlline.SqlLine.dispatch(SqlLine.java:821)
    at sqlline.SqlLine.begin(SqlLine.java:699)
    at sqlline.SqlLine.mainWithInputRedirection(SqlLine.java:441)
    at sqlline.SqlLine.main(SqlLine.java:424)
0: jdbc:phoenix:hadoopm1:2181>

Run Code Online (Sandbox Code Playgroud)

请帮忙.

hbase phoenix ambari sqlline

use*_*741

2015 05-06

18
推荐指数

1
解决办法

3537
查看次数