我有两个数据框。我在数据框 NAME 中有一个列名列表。然后我有另一个数据框 DF,其中列名对应于下一列中的数据框 NAME。我需要将这些名称替换为 DF 中的列名称。
DF:
A B C D E
H001 947 95 10 10 678
H002 647 40 10 10 806
H003 840 20 99 53 21
H004 105 10 97 12 44
H005 595 59 76 76 67
NAME:
Name Real.name
A Pete
B May
C Jon
D Paul
E Emma
F Fuchs
G George
Desired output:
Pete May Jon Paul Emma
H001 947 95 10 10 678
H002 647 40 10 10 806
H003 …
Run Code Online (Sandbox Code Playgroud) 我在文件中有几列,其中第二列有“:”分隔符,我想删除第二列中的第一个、第三个和第四个字符串,并将第二个字符串留在该列中。但我有正常的分隔符空间,所以我不知道。
input:
--- 22:16050075:A:G 16050075 A G
--- 22:16050115:G:A 16050115 G A
--- 22:16050213:C:T 16050213 C T
--- 22:16050319:C:T 16050319 C T
--- 22:16050527:C:A 16050527 C A
desired output:
--- 22 16050075 16050075 A G
--- 22 16050115 16050115 G A
--- 22 16050213 16050213 C T
--- 22 16050319 16050319 C T
--- 22 16050527 16050527 C A
Wrong:
cat df.txt | awk -F: '{print $1, $3, $6, $7, $8}'
--- 22 A
--- 22 G
--- 22 C …
Run Code Online (Sandbox Code Playgroud) 我创建了一个数据框,现在我想通过拆分第一列中的“:”来分隔一个新列。
data frame:
unc.edu.0057f9f7-779b-4914-8290-abbad2a0d81e.2556919.rsem.genes.normalized_results:ASL|435 214.4421
unc.edu.0057f9f7-779b-4914-8290-abbad2a0d81e.2556919.rsem.genes.normalized_results:ASS1|445 2863.8055
unc.edu.0057f9f7-779b-4914-8290-abbad2a0d81e.2556919.rsem.genes.normalized_results:OTC|5009 0
unc.edu.050c2191-b96c-41e7-abdb-e52cbe82f268.2456235.rsem.genes.normalized_results:ASL|435 332.7522
unc.edu.050c2191-b96c-41e7-abdb-e52cbe82f268.2456235.rsem.genes.normalized_results:ASS1|445 3322.629
unc.edu.050c2191-b96c-41e7-abdb-e52cbe82f268.2456235.rsem.genes.normalized_results:OTC|5009 0
desired output:
unc.edu.0057f9f7-779b-4914-8290-abbad2a0d81e.2556919.rsem.genes.normalized_results ASL|435 214.4421
unc.edu.0057f9f7-779b-4914-8290-abbad2a0d81e.2556919.rsem.genes.normalized_results ASS1|445 2863.8055
unc.edu.0057f9f7-779b-4914-8290-abbad2a0d81e.2556919.rsem.genes.normalized_results OTC|5009 0
unc.edu.050c2191-b96c-41e7-abdb-e52cbe82f268.2456235.rsem.genes.normalized_results ASL|435 332.7522
unc.edu.050c2191-b96c-41e7-abdb-e52cbe82f268.2456235.rsem.genes.normalized_results ASS1|445 3322.629
unc.edu.050c2191-b96c-41e7-abdb-e52cbe82f268.2456235.rsem.genes.normalized_results OTC|5009 0
Run Code Online (Sandbox Code Playgroud)
我试过了
strsplit(df$V1, split = "\\:")
Run Code Online (Sandbox Code Playgroud)
但是 strsplit(t$V1, split = "\:") 中的错误:出现非字符参数。谢谢你。
我有一个如下数据框,并希望通过将数据框中的字符替换为数字条件来生成另一个数据框.
condition:
GD 5
O 4.5
AV 3
B 2.5
dataframe:
Name Peter Paul Mary Chan Jose
Nokia B O O GD GD
iPhone AV O O O O
Moto AV AV O O AV
HTC B O AV AV AV
dput:
structure(list(Name = c("Nokia", "iPhone", "Moto", "HTC"), Peter =
c("B", "AV", "AV", "B"), Paul = c("O", "O", "AV", "O"), Mary =
c("O", "O", "O", "AV"), Chan = c("GD", "O", "O", "AV"), Jose =
c("GD", "O", "AV", "AV")), .Names = …
Run Code Online (Sandbox Code Playgroud) 首先,我使用TTR包中的stoch函数来计算慢速随机,然后使用addTA函数将其添加到chartSeries函数的绘图中,然而,图中的这两行是黑色的,我想将它们更改为不同的颜色.
Input:
chartSeries(df, subset='last 3 years', TA = NULL, theme = "white", up.col = "green", dn.col = "red")
slow.stoc <- stoch(na.omit(HLC(df)), 25, 25, 9, 'SMA')[,2:3]
addTA(slow.stoc)
Run Code Online (Sandbox Code Playgroud)
我试着用:
lines(slow.stoc[2], col="red", lty="solid")
addLines(slow.stoc[2], col = "red")
Run Code Online (Sandbox Code Playgroud)
但两者都不起作用.请指教.谢谢.
我有很多行的整数,每行有7列,它是从实验记录的一些生物点.数字仅为1到7,我想确定出现的那些整数的常见模式.
first few rows of df:
[,1] [,2] [,3] [,4] [,5] [,6] [,7]
[1,] 1 2 3 4 6 7 7
[2,] 1 2 2 3 3 5 7
[3,] 1 2 2 3 3 4 5
[4,] 2 3 4 7 7 7 7
[5,] 1 1 3 4 5 6 7
[6,] 2 2 3 3 4 6 6
[7,] 1 1 2 3 3 6 6
[8,] 2 2 3 4 6 6 7
...
Run Code Online (Sandbox Code Playgroud)
为实例,
desired …
Run Code Online (Sandbox Code Playgroud) r frequency pattern-matching frequency-distribution frequency-analysis
我想绘制一个多堆叠条形图,但我不知道如何组合r代码。
Closing Date Non Current Assets Current Assets Non Current Liabilities
2 2013/12 13637344 13078654 9376243
3 2014/12 14075507 12772388 8895126
4 2015/12 14578093 14226181 9715914
5 2016/12 10911628 10205708 9810157
6 2017/12 10680998 10950779 13493110
Current Liabilities
2 5075985
3 4963856
4 5992229
5 8859263
6 4094183
Run Code Online (Sandbox Code Playgroud)
我可以通过以下方式绘制多个条形图:
highchart() %>%
hc_chart(type = "column") %>%
hc_xAxis(categories = bs.table$`Closing Date`) %>%
hc_add_series(name="Non Current Assets",data = bs.table$`Non Current
Assets`) %>%
hc_add_series(name="Current Assets",data = bs.table$`Current Assets`) %>%
hc_add_series(name="Non Current Liabilities",data = bs.table$`Non Current …
Run Code Online (Sandbox Code Playgroud) 我有一个数据框,首先我比较它们来创建一个布尔值列,然后我想通过grep它们在前两列中知道哪一个是假的.
df:
200610-1 200610-10
AA AA TRUE
CC CC TRUE
AA AA TRUE
AA EE FALSE
AA AA TRUE
RR RR TRUE
AA AA TRUE
FF AA FALSE
NN NN TRUE
AA AA TRUE
BB RR FALSE
desired output:
4 AA EE
8 FF AA
11 BB RR
Run Code Online (Sandbox Code Playgroud)
我比较了他们
table(df[,2] == df[,3])
Run Code Online (Sandbox Code Playgroud)
但后来我不知道如何将布尔值grep到数据帧值中.谢谢.