小编Tej*_*eja的帖子

如何检索数据框中存在的列中重复次数最多的值

我试图检索数据框中存在的特定列中最重复的值.这是我的示例数据和代码如下.

data("Forbes2000", package = "HSAUR")
head(Forbes2000)


  rank                name        country             category  sales profits  assets marketvalue
1    1           Citigroup  United States              Banking  94.71   17.85 1264.03      255.30
2    2    General Electric  United States        Conglomerates 134.19   15.59  626.93      328.54
3    3 American Intl Group  United States            Insurance  76.66    6.46  647.66      194.87
4    4          ExxonMobil  United States Oil & gas operations 222.88   20.96  166.99      277.02
5    5                  BP United Kingdom Oil & gas operations 232.57   10.27  177.57      173.54
6    6     Bank of America  United States …
Run Code Online (Sandbox Code Playgroud)

r max dataframe

10
推荐指数
3
解决办法
2万
查看次数

如何从数据框中按顺序排名前n位公司

我试图从数据框架中获得顶级'n'公司.这是我的代码如下.

data("Forbes2000", package = "HSAUR")
sort(Forbes2000$profits,decreasing=TRUE)
Run Code Online (Sandbox Code Playgroud)

现在我想从这个有序向量中获得前50个观测值.

sorting r top-n plyr

10
推荐指数
3
解决办法
5万
查看次数

在UNIX中基于分隔符拆分行

我有一些SQL查询返回的数据,如下所示.我正在尝试根据分隔符分隔行并将其发送到新行.如何在UNIX中执行此操作..我尝试使用shell-脚本但无法完成......

ALB|1001|2012-04-15 ALB|1001|2012-04-14 ALB|1001|2012-04-16 ALB|1001|2012-04-17


ALB|1001|2012-04-15
ALB|1001|2012-04-14 
ALB|1001|2012-04-16 
ALB|1001|2012-04-17
Run Code Online (Sandbox Code Playgroud)

unix string split

8
推荐指数
2
解决办法
2万
查看次数

以Parquet格式将数据文件从Amazon Redshift卸载到Amazon S3

我想以Apache Parquet格式将数据文件从Amazon Redshift卸载到Amazon S3,以便使用Redshift Spectrum查询S3上的文件.我已经探索过每一个地方但我找不到任何关于如何使用Parquet格式将文件从Amazon Redshift卸载到S3的内容.此功能尚未支持,或者我无法找到有关它的任何文档.有人研究过这个问题吗?谢谢.

amazon-redshift parquet amazon-athena amazon-redshift-spectrum

7
推荐指数
3
解决办法
5015
查看次数

如何使用SQL在字符串中获取奇数编号的字符

我正在玩一些加密数据,我需要从字符串中获取奇数字符并填充到列中:

abcedfgh
Run Code Online (Sandbox Code Playgroud)

acdg
Run Code Online (Sandbox Code Playgroud)

是否真的可以在SQL中执行此操作?我尝试使用谷歌搜索,但找不到任何搜索结果.

sql oracle substring

6
推荐指数
1
解决办法
1486
查看次数

如何在Google Big Query中实现MINUS运算符

我正在尝试在Google Big Query中实现MINUS操作,但看起来查询参考中没有文档.有人可以分享你对此的看法.我以前在常规SQL中完成了它,但不确定Google是否在Big Query中提供它.您的意见得到赞赏.谢谢.

sql google-bigquery

6
推荐指数
2
解决办法
2809
查看次数

如何在unix中每行末尾附加一个字符

我有一个大数据文件,我需要在每一行的末尾附加逗号。我该如何完成?谢谢。这是我的示例数据文件,如下所示。

1000050G8611
1000200G8611
1000250G8611
1000350G8611
1000375G8611
1000376G9403
1000475G8611
1000500G8611
1000550G8611
1000600G8611
1000610G8611
1000611G0807
1000612G0804
1000614G0802
1000617G8611
1000618G0710
1000619G8611
1000621G8611
1000624G0606
Run Code Online (Sandbox Code Playgroud)

unix append

5
推荐指数
1
解决办法
1万
查看次数

如何从Big Query中的值列中获取第一个非空值?

我试图从基于时间戳的值列中提取第一个非空值。有人可以分享您对此的想法。谢谢。

到目前为止,我尝试了什么?

FIRST_VALUE( column ) OVER ( PARTITION BY id ORDER BY timestamp) 
Run Code Online (Sandbox Code Playgroud)

Input :-

id,column,timestamp
1,NULL,10:30 am
1,NULL,10:31 am
1,'xyz',10:32 am
1,'def',10:33 am
2,NULL,11:30 am
2,'abc',11:31 am

Output(expected) :-
1,'xyz',10:30 am
1,'xyz',10:31 am
1,'xyz',10:32 am
1,'xyz',10:33 am
2,'abc',11:30 am
2,'abc',11:31 am
Run Code Online (Sandbox Code Playgroud)

sql bigdata google-bigquery

5
推荐指数
2
解决办法
5130
查看次数

SQL Server 与 Postgresql 中的 ORDER BY

我正在尝试在庞大的数据集上运行 ORDER BY 并生成密集排名值以根据密集排名提取不同数量的行。后来,我在整个过程中使用密集排名值作为代理键来推进中间结果并将其进一步用于一些性能测试。

我面临的问题:-

我遇到的问题是我将数据集从 Matrix(postgresql)(PRODUCTION environment) 迁移到 SQL Server(New environment) 并实现了密集排名功能。但是由于 SQL Server 和 Matrix 中的 ORDER BY 子句行为导致不同的密集排名结果,我无法进一步验证代码和结果。

测试示例:-

SELECT *,DENSE_RANK() OVER ( ORDER BY Col ) AS drnk FROM 
(
SELECT '#2 Mayfair Terrace' AS Col
UNION 
SELECT '#2 MYSTIC COURT' AS Col
)Z;
Run Code Online (Sandbox Code Playgroud)

SQL Server 输出:-

Col                drnk
#2 Mayfair Terrace  1
#2 MYSTIC COURT     2
Run Code Online (Sandbox Code Playgroud)

矩阵(Postgresql)输出:-

Col                drnk
#2 MYSTIC COURT     1
#2 Mayfair Terrace  2
Run Code Online (Sandbox Code Playgroud)

有人能告诉我为什么两个不同的数据库环境之间 ORDER BY 的行为存在差异吗?任何帮助,将不胜感激。谢谢。

sql sql-server postgresql sql-order-by dense-rank

5
推荐指数
1
解决办法
191
查看次数

从BST移除额外的边缘

我有一个BST,如下所示.如何从BST中删除不需要的额外边缘?

1-> 2,1-> 3,2-> 4,2-> 5,3-> 5

应该删除2-> 5或3-> 5

 void BFS(int s)
    {
        // Mark all the vertices as not visited(By default
        // set as false)
        boolean visited[] = new boolean[V];

        // Create a queue for BFS
        LinkedList<Integer> queue = new LinkedList<Integer>();

        // Mark the current node as visited and enqueue it
        visited[s]=true;
        queue.add(s);

        while (queue.size() != 0)
        {
            // Dequeue a vertex from queue and print it
            s = queue.poll();
            System.out.print(s+" ");

            // Get all adjacent vertices of …
Run Code Online (Sandbox Code Playgroud)

java algorithm

5
推荐指数
2
解决办法
1278
查看次数