我必须删除数据框中有超过4000列和180行的列.我想设置的条件是删除数据框中的列:(i)如果列中的值/条目少于两个,则删除列column(ii)如果列中没有两个连续(一个接一个)值,则删除该列.(iii)移除所有值为NA的列.我提供了要删除列的条件.这里的目的不仅仅是找到一个名称列,如"如何删除data.table中的列?".我说明如下:
A B C D E
0.018 NA NA NA NA
0.017 NA NA NA NA
0.019 NA NA NA NA
0.018 0.034 NA NA NA
0.018 NA NA NA NA
0.015 NA NA NA 0.037
0.016 NA NA NA 0.031
0.019 NA 0.4 NA 0.025
0.016 0.03 NA NA 0.035
0.018 NA NA NA 0.035
0.017 NA NA NA 0.043
0.023 NA NA NA 0.040
0.022 NA NA NA 0.042
Run Code Online (Sandbox Code Playgroud)
期望的数据帧:
A E
0.018 NA
0.017 NA
0.019 NA …Run Code Online (Sandbox Code Playgroud) 我有一个包含4998列的巨大数据框,列标题是公司的名称.这些列包含股票价格作为列中的值.因此,我想删除股票价格(列中的值)小于1的便士股票.因此,如果其值小于1,我想删除整个列.此外,数据框中有列,其中值波动他们低于1,但然后返回等于或大于1,在这个场景中,我希望在此列中,当值低于1时,它将被NA替换.我已经提到'将多个数据帧列中的多个值替换为另一列中的值',但我的情况略有不同.我举例说明了数据框的一小部分
df1 <- Price
Date A B C
01/01/2000 NA 0.03 0.95
02/01/2000 NA 0.03 0.95
03/01/2000 NA 0.03 0.95
04/01/2000 NA 0.03 0.95
05/01/2000 5 0.03 0.95
06/01/2000 6 0.5 1
07/01/2000 7 0.5 1
08/01/2000 8 0.5 NA
09/01/2000 9 0.5 NA
Run Code Online (Sandbox Code Playgroud)
所需的输出数据帧
df2<- df1
Date A C
01/01/2000 NA NA
02/01/2000 NA NA
03/01/2000 NA NA
04/01/2000 NA NA
05/01/2000 5 NA
06/01/2000 6 NA
07/01/2000 7 1
08/01/2000 8 1
09/01/2000 9 NA
Run Code Online (Sandbox Code Playgroud)
非常感谢您的帮助.
我有一个包含 4000 列和 3000 行的数据框。列是公司,行是每日股票收盘价。这些行包含基于月份日期的每日观察数据。现在,我想要删除每个月最后一个日期之间的行,即我想根据数据框中的月份可用日期仅获取该月最后一天的数据。每个月的最后一个日期应该根据我的数据框中可用的日期列。我的问题与其他人的主要挑战和区别是上个月的日期应该根据我的数据框中提供的日期。它的财务数据和非交易日并没有。交易日的数量与其他类型的行业不同,我说明了我的数据框架的某些部分。
Date A B
30/12/1999 1 3
04/01/2000 1 3
05/01/2000 1 3
06/01/2000 1 3
07/01/2000 1 3
10/01/2000 1 3
11/01/2000 1 3
12/01/2000 1 3
13/01/2000 1 3
14/01/2000 1 3
17/01/2000 1 3
18/01/2000 1 3
19/01/2000 1 3
20/01/2000 1 3
21/01/2000 1 3
24/01/2000 1 3
25/01/2000 1 3
26/01/2000 1 3
27/01/2000 1 3
28/01/2000 1 3
31/01/2000 1 3
01/02/2000 1 3
02/02/2000 1 3
03/02/2000 1 3 …Run Code Online (Sandbox Code Playgroud)