小编Tej_eja的帖子

内部在Big Query中加入大表

我试图在两个大表之间执行内部联接,其中每个表包含近3000万条记录.当我尝试在这两个表之间运行一个简单的INNER JOIN时,我得到一个错误,如下所示,要求我使用JOIN EACH语法,但我没有找到关于JOIN EACH的google引用的任何适当文档.有人可以分享一下这个想法吗？这是我的错误如下.

Error: Table too large for JOIN. Consider using JOIN EACH. For more details, please see https://developers.google.com/bigquery/docs/query-reference#joins

Run Code Online (Sandbox Code Playgroud)

google-bigquery

2
推荐指数

1
解决办法

1296
查看次数

如何通过在连接子句中使用子字符串函数在 Big Query 中执行两个表之间的连接

我从两个表中有一些输入数据，如下所示，我需要将它们连接起来以从中提取一些结果。请仔细阅读以下详细信息。如有任何意见/想法，我们将不胜感激。

Table A
ColA,ColB
abc,1
def,2



Table B
ColA,ColC
abc_,45
abc*,67
def_,23
def,12

Run Code Online (Sandbox Code Playgroud)

现在我需要在 ColA 上连接两个表 A、B 以提取结果。我在这里面临的复杂部分是我想忽略 *,_ 然后连接两个表并得到如下的最终结果。

Expected Result :-

abc,1,45
abc,1,67
def,2,23
def,2,12

Run Code Online (Sandbox Code Playgroud)

What I have tried?

SELECT A.ColA AS ColA,
       A.ColB AS ColB
       B.ColC AS ColC
  FROM TableA A
JOIN EACH 
       TableB B
    ON A.ColA = B.ColA; 

 -- SUBSTR( B.ColA, 1, LENGTH( A.ColA ) ) 

Comments :- The above join clause using SUBSTR function is not supported in Big Query.

Run Code Online (Sandbox Code Playgroud)

regex sql bigdata google-bigquery

2
推荐指数

1
解决办法

3226
查看次数

不使用分析功能即可实施排名

我想知道是否有一种无需使用内置函数即可实现SQL分析功能的方法。

SELECT *,
    ROW_NUMBER() OVER (PARTITION BY dept_id ORDER BY salary DESC) AS rownum,
    DENSE_RANK() OVER (PARTITION BY dept_id ORDER BY salary DESC) AS denserank,
    RANK() OVER (PARTITION BY dept_id ORDER BY salary DESC) AS rnk
FROM emp;

Run Code Online (Sandbox Code Playgroud)

2
推荐指数

1
解决办法

3117
查看次数

使用ROWNUM在Oracle中获取Prime Number记录

我试图从我的桌子上得到所有主要(行)编号的记录.有人请说明如何解决这个问题？

以下是我的示例数据.

EMPID EMPNAME
1 A
2 B
3 C
4 D
5 E
6 F
7 G
8 H
9 I
10 J

Run Code Online (Sandbox Code Playgroud)

所需输出:

EMPID EMPNAME
2 B 
3 C
5 E
7 G

Run Code Online (Sandbox Code Playgroud)

如果我有大量数据,我如何获得这样的输出而不是使用IN运算符？

1
推荐指数

1
解决办法

4041
查看次数

如何使用空格分隔符获取任何通用单词或句子中的第n个字符串

如何在空格分隔符的句子或一组字符串中获取第n个单词？

对不起要求的变化.谢谢.

sql oracle oracle11g

1
推荐指数

2
解决办法

2万
查看次数

在awk中的反斜杠（“ \”）分隔符上拆分字符串？

我正在尝试基于某些定界符将字符串拆分到文件中。但是我无法正确实现它。这是下面的代码。

awk 'var=split($2,arr,'\'); {print $var}' file1.dat

Run Code Online (Sandbox Code Playgroud)

这是我的样本数据专家。

Col1 Col2
abc  123\abc
abcd 123\abcd

Run Code Online (Sandbox Code Playgroud)

需求输出：

Col1 Col2
abc  abc
abcd abcd

Run Code Online (Sandbox Code Playgroud)

1
推荐指数

1
解决办法

1万
查看次数

如何在R中实现方差函数

我试图从数据框计算列的方差.我知道有内置函数var()用于计算方差但我不知道如何通过将我的数据框列作为变量来编写方差函数.

var(banknote$Length)*((n-1)/n)

Run Code Online (Sandbox Code Playgroud)

1
推荐指数

1
解决办法

6226
查看次数

使用 MySQL 在每组中运行总计

我正在尝试编写一个 SQL 来计算下面输入中每个组的运行总计。只是想知道如何使用 MySQL 来做到这一点。我知道如何使用分析函数在常规 SQL 中执行此操作，但不知道如何在 MySQL 中执行此操作。您能否分享一下您对如何实施它的想法？

SQL小提琴： http://sqlfiddle.com/#!9/59366d /19

使用窗口函数的SQL：

SELECT e.Id,
       SUM( e.Salary ) OVER( PARTITION BY e.Id ORDER BY e.Month  ) AS cumm_sal
  FROM Employee e 
LEFT JOIN
       (
          SELECT Id,MAX(Month) AS maxmonth
            FROM Employee
          GROUP BY Id
        ) emax
    ON e.Id = emax.Id
WHERE e.Month != emax.maxmonth
ORDER BY e.Id,e.Month DESC;

Run Code Online (Sandbox Code Playgroud)

输入：

Create table Employee (Id int, Month int, Salary int);

insert into Employee (Id, Month, Salary) values ('1', '1', '20');
insert into …

Run Code Online (Sandbox Code Playgroud)

mysql sql cumulative-sum

1
推荐指数

1
解决办法

2353
查看次数

如何在bash中使用分隔符逐行合并两个文件

我想使用逗号分隔符合并两个输入文件并写入一个新文件。我如何在 bash 中实现它？以下是示例数据。任何输入/建议将不胜感激。谢谢你。

**

 - What I have tried?

Run Code Online (Sandbox Code Playgroud)

**

paste -d ' , ' file1 file2 > file3

Input Datastrong text

file1            file2
1,A               10    
2,B               20    
3,C               30

Run Code Online (Sandbox Code Playgroud)

Desired Output

file3
1,A,10
2,B,20
3,C,30

Run Code Online (Sandbox Code Playgroud)

0
推荐指数

1
解决办法

4680
查看次数

我可以在不使用 ON 子句的情况下离开连接两个表吗？

如果我尝试在LEFT JOIN不使用ON子句的情况下在两个表之间执行 a 是否有效。SQL 引擎如何处理此类连接？它会被视为CROSS JOIN还是会出现错误。

mysql sql postgresql

0
推荐指数

1
解决办法

2万
查看次数

标签统计

sql ×6

awk ×2

google-bigquery ×2

unix ×2

cumulative-sum ×1

r ×1

«
1
2
3
4
5
»