小编Nee*_*els的帖子

将数据从.txt文件加载到表中存储为Hive中的ORC

我有一个.txt格式的数据文件.我正在使用该文件将数据加载到Hive表中.当我在一个表中加载文件时

CREATE TABLE test_details_txt(
visit_id INT,
store_id SMALLINT) STORED AS TEXTFILE;
Run Code Online (Sandbox Code Playgroud)

使用正确加载数据

LOAD DATA LOCAL INPATH '/home/user/test_details.txt' INTO TABLE test_details_txt;
Run Code Online (Sandbox Code Playgroud)

我可以SELECT * FROM test_details_txt;在Hive的桌子上跑一个.

但是,如果我尝试在表中加载数据

CREATE TABLE test_details_txt(
visit_id INT,
store_id SMALLINT) STORED AS ORC; 
Run Code Online (Sandbox Code Playgroud)

尝试运行SELECT时收到以下错误:

Failed with exception java.io.IOException:java.io.IOException: Malformed ORC file hdfs://master:6000/user/hive/warehouse/test.db/transaction_details/test_details.txt. Invalid postscript.

使用上面的LOAD语句加载数据时,我没有收到任何错误或异常.

使用命令将数据存储到ORC表时还有什么需要完成的LOAD DATA IN PATH..吗?

hadoop hive

35
推荐指数
2
解决办法
7万
查看次数

如何在Angular 2中的两个组件之间传递数据

我正在寻找将数据传递给另一个组件的解决方案,并且类似地访问其他组件中的另一个组件的方法(两者都是并行组件).

例如,我有两个组件home.tsmap.ts.我得到一些数据map.ts并需要传入,home.ts反之亦然.

components shared-data angular

21
推荐指数
5
解决办法
6万
查看次数

if语句的可变范围问题(PHP)

好吧,我似乎对PHP的变量范围存在误解,原谅我缺乏主题,因为我来自Java,C#背景.认为我可以通过将函数放在函数外部来使函数或if语句可以访问变量.下面是我正在努力实现的内容片段:

foreach ($nm as $row=>$im) {
    $itm_name = $im;
    $lnk = $lnk_cty[$row];  
    if($mode == 'addMenu') {
        $m = $m_id; //id will be coming from fresh insert of menu_name 
    } else {
        $m = $_POST['mnu_add'][$row];
        echo "MENU_ID: ".$m;
    }
    if($mode == 'addCat') {
        $m = $c_id; //id will be coming from fresh insert of cat_name
    } else {
 $m = $_POST['cat_add'][$row];
    }
    //used for testing purposes
    echo "item name: ".$itm_name ."<br />";
    echo "lnk: ".$lnk ."<br />";
    echo "m: ".$m ."<br …
Run Code Online (Sandbox Code Playgroud)

php scope if-statement

16
推荐指数
1
解决办法
2万
查看次数

R中%%运算符的C++版本

C中的任何函数是否等同%in%于R中的运算符?考虑R中的以下命令:

which(y %in% x)
Run Code Online (Sandbox Code Playgroud)

我试图在C++中找到相同的东西(特别是在Armadillo中),我找不到任何东西.然后我编写了自己的函数,与上面的R命令相比,这个函数非常慢.

这是我写的:

#include <RcppArmadillo.h>
// [[Rcpp::depends("RcppArmadillo")]]

// [[Rcpp::export]]
arma::uvec myInOperator(arma::vec myBigVec, arma::vec mySmallVec ){
 arma::uvec rslt = find(myBigVec == mySmallVec[0]);
 for (int i = 1; i < mySmallVec.size(); i++){
   arma::uvec rslt_tmp = find(myBigVec == mySmallVec[i]);
   rslt = arma::unique(join_cols( rslt, rslt_tmp ));
 }
 return rslt;
}
Run Code Online (Sandbox Code Playgroud)

现在,在上面的代码中采购后,我们有:

x <- 1:4
y <- 1:10
res <- benchmark(myInOperator(y, x), which(y %in% x), columns = c("test",
      "replications", "elapsed", "relative", "user.self", "sys.self"), 
       order = "relative")
Run Code Online (Sandbox Code Playgroud)

以下是结果:

                 test replications elapsed …
Run Code Online (Sandbox Code Playgroud)

c++ r armadillo rcpp

15
推荐指数
2
解决办法
1012
查看次数

如何修改pdf.js显示的文字?

我不是要修改PDF,我只是想改变显示的文本

pdf.js输出它在一堆div中读取的文本.textLayer > div,它也绘制了一个画布

在这里看到,在浏览器中查看和编辑pdf几乎是不可能的,但......

由于pdf.js确实有一个API,我的想法是"挂钩"到pdf.js并更改显示的文本(这在我的情况下绰绰有余)

我能找到的最接近的是这个名为getTextContent()的函数,但是没有回调注册的AFAICS.

这甚至可能(没有弄乱pdf.js本身)?如果是这样,怎么样?


编辑(3)

这段代码会将PDF文本打印到控制台中,但如何从这里开始是一个谜.

'use strict';

// In production, the bundled pdf.js shall be used instead of SystemJS.
Promise.all([System.import('pdfjs/display/api'),
System.import('pdfjs/display/global'),
System.import('pdfjs/display/network'),
System.resolve('pdfjs/worker_loader')])
    .then(function (modules)
    {
        var api = modules[0], global = modules[1];

        // In production, change this to point to the built `pdf.worker.js` file.
        global.PDFJS.workerSrc = modules[3];

        // Fetch the PDF document from the URL using promises
        let loadingTask        = api.getDocument('cv.pdf');

        loadingTask.onProgress = function (progressData) …
Run Code Online (Sandbox Code Playgroud)

javascript pdf pdf.js

11
推荐指数
2
解决办法
2156
查看次数

Hive错误:parseexception缺少EOF

我不确定我在这里做错了什么:

hive> CREATE TABLE default.testtbl(int1 INT,string1 STRING)  
      stored as orc 
      tblproperties ("orc.compress"="NONE") 
      LOCATION "/user/hive/test_table";

      FAILED: ParseException line 1:107 missing EOF at 'LOCATION' near ')'
Run Code Online (Sandbox Code Playgroud)

而以下查询完全正常:

hive>  CREATE TABLE default.testtbl(int1 INT,string1 STRING)  
       stored as orc 
       tblproperties ("orc.compress"="NONE");
       OK
       Time taken: 0.106 seconds
Run Code Online (Sandbox Code Playgroud)

我在这里错过了一些东西.任何指针都会有所帮助.谢谢!

hadoop hive hiveql hcatalog

10
推荐指数
2
解决办法
7万
查看次数

无法对Hive中的大型数据集应用动态分区

我有一张test_details包含大约400万条记录的表格.使用此表中的数据,我必须创建一个分区test_details_par记录的新分区表visit_date.创建表并不是一个挑战,但是当我来到我必须使用动态分区来插入数据的部分时,当我尝试插入数据更多天时,Hive放弃了.如果我这样做2或3天,Map Reduce作业会成功运行,但是在更多天内它没有给出一个JAVA Heap Space Error或者GC Error.

我的DDL的简化快照如下:

CREATE TABLE test_details_par( visit_id INT, visit_date DATE, store_id SMALLINT);

INSERT INTO TABLE test_details_par PARTITION(visit_date) SELECT visit_id, store_id, visit_date FROM test_details DISTRIBUTE BY visit_date;

我尝试设置这些参数,以便Hive以更好的方式执行我的工作:

set hive.exec.dynamic.partition.mode=nonstrict; 
set hive.exec.dynamic.partition=true; 
set hive.exec.max.dynamic.partitions.pernode = 10000;
Run Code Online (Sandbox Code Playgroud)

有没有什么我缺少运行INSERT完整批处理而没有具体指定日期?

hadoop hive

8
推荐指数
1
解决办法
3816
查看次数

HiveQL:查询仅列出视图

是否有 Hive 查询仅列出特定数据库中可用的视图。

在 MySql 中,我认为查询如下:

SELECT TABLE_NAME FROM information_schema.TABLES WHERE TABLE_TYPE LIKE 'VIEW' AND TABLE_SCHEMA LIKE 'database_name';

我想要 HiveQL 类似的东西。

hive hiveql

5
推荐指数
1
解决办法
2万
查看次数

使用来自查询的变量进行 SQLPlus 条件执行

我有一个批处理文件,其中包含许多步骤,可以一一执行。

但是,为了能够使其更加灵活,我想在SQLPlus.

类似于,首先从查询中获取条件变量的值并存储在 say 中v_variable。然后将其用于一些检查,例如

IF v_variable = 'Y' THEN
--DO SOME DDL
ELSE
--DO OTHER DDL
END IF
Run Code Online (Sandbox Code Playgroud)

我必须在批处理文件的许多地方重复这个块,我无法通过 PL/SQL 以某种方式完成它。

我正在尝试使用此COLUMN命令,SQLPlus但以某种方式无法获取要保存的变量值。

COLUMN VARIABLE1 NEW_VALUE V_VARIABLE1

SELECT PARAM_VAL AS VARIABLE1 FROM TABLE_T WHERE PARAM_TYPE =  'XYZ'; 
-- This query will only throw one record.

DEFINE V_VARIABLE1
Run Code Online (Sandbox Code Playgroud)

那是绝对错误的吗?我们如何查看是否V_VARIABLE1从查询中获取值?

即使我做对了,我也对这IF-ELSE部分一无所知。有人可以帮忙吗?我对适用于 SQLPlus 的解决方案感兴趣。

sqlplus batch-file conditional-statements

5
推荐指数
1
解决办法
1万
查看次数

BASH语法错误 - [:缺少`]'

我是Bash编程的新手,可能真的很傻.

基本上我正在编写一个脚本来ping我传入的IP地址,它会从传输的数据包中获取并返回错误或传递消息,具体取决于丢失的数据包数量.

但是每当我从终端运行脚本时,我都会收到消息 -

./ipGatewayCheck.sh: line 13: [: missing]'`

这是我的代码:

#!/bin/bash

healthy_status=0

warning_status=10

critical_status=100

for gateway in $@

do
RESULT=`ping -q -c 10 $gateway | grep 'packets transmitted' | awk '{print $6}' | tr -d "%"`
echo "$RESULT"
if [ $RESULT -eq $healthy_status ]; then
  echo "No Issue - IP Address is pinging"
elif [ $RESULT -ge $warning_status && -le $critical_status ]; then
  echo "Warning - Issue with packet loss on this IP Address"
elif [ $RESULT -eq $critical_status …
Run Code Online (Sandbox Code Playgroud)

bash shell sh

2
推荐指数
1
解决办法
911
查看次数

java String split,空数组

我尝试将字符串"1.1"拆分为2个新字符串:

String[] array = "1.1".split(".");
System.out.println(array[0]);
Run Code Online (Sandbox Code Playgroud)

但我得到了java.lang.ArrayIndexOutOfBoundsException.

为什么?

java string split

-1
推荐指数
1
解决办法
292
查看次数