小编gia*_*iac的帖子

R - 排序后检索行号

我想知道如何在对数据进行排序后检索行号.

让我们想象一下我的矢量是这样的:

vec = c("GET FRESH", "EASTENDERS", "WORLD CUP", "SPORT", "DYNASTY" )
Run Code Online (Sandbox Code Playgroud)

然后我排序

sort(vec)
[1] "DYNASTY"    "EASTENDERS" "GET FRESH"  "SPORT"      "WORLD CUP" 
Run Code Online (Sandbox Code Playgroud)

我怎么能得到每个案例的行号?

     vec          rownumber
[1,] "DYNASTY"    "5"      
[2,] "EASTENDERS" "2"      
[3,] "GET FRESH"  "1"      
[4,] "SPORT"      "4"      
[5,] "WORLD CUP"  "3" 
Run Code Online (Sandbox Code Playgroud)

sorting r

3
推荐指数
1
解决办法
70
查看次数

R - gsub只有数字

我想清理这个向量,只保留数字

vec = c(" 4010  \"Filling in time budget diary\"", " 8888  \"Prob cont. preceding activity\"", " 9999   \"Missing, undecipherable\";") 
Run Code Online (Sandbox Code Playgroud)

我想要的只是: 4010, 8888, 9999

我想到了类似的东西,完全匹配数字,但它不起作用.

gsub("^[[:digit:]]$", replacement = '', vec)
Run Code Online (Sandbox Code Playgroud)

谢谢

regex r gsub grepl

3
推荐指数
1
解决办法
4871
查看次数

R - dplyr融合配对数据的交叉

我想知道如何使用进行交叉表dplyrmelted数据.我的数据看起来像这样.

         idmen sexe         dip14_rec
1  0110008218    1               Uni
2  0110008218    2 Primary-Secondary
3  0110010366    1               Uni
4  0110010366    2               Uni
5  0110011567    1 Primary-Secondary
6  0110011567    2 Primary-Secondary
7  0110012163    2 Primary-Secondary
8  0110012163    1 Primary-Secondary
9  0110016580    2               Uni
10 0110016580    1        No Diploma
Run Code Online (Sandbox Code Playgroud)

我想要的是dipl14_recby 的交叉表idmen.

我发现这一点的唯一方法是

dta1 = dta %>% filter(sexe == 1) 
dta2 = dta %>% filter(sexe == 2) 

dta12 = merge(dta1, dta2, by = 'idmen') 
table( Men = …
Run Code Online (Sandbox Code Playgroud)

r crosstab dplyr

3
推荐指数
1
解决办法
344
查看次数

R - 按组计算不匹配

我想知道如何按组计算不匹配的情况.

让我们想象这是我的数据:

sek = rbind(c(1, 'a', 'a', 'a'), 
        c(1, 'a', 'a', 'a'), 
        c(2, 'b', 'b', 'b'), 
        c(2, 'c', 'b', 'b'))

colnames(sek) <- c('Group', paste('t', 1:3, sep = ''))
Run Code Online (Sandbox Code Playgroud)

数据看起来像这样

     Group t1  t2  t3 
[1,] "1"   "a" "a" "a"
[2,] "1"   "a" "a" "a"
[3,] "2"   "b" "b" "b"
[4,] "2"   "c" "b" "b"
Run Code Online (Sandbox Code Playgroud)

为了获得类似的东西

Group 1 : 0 
Group 2 : 1 
Run Code Online (Sandbox Code Playgroud)

使用stringdist库来计算它是很奇怪的.

就像是

seqdistgroupStr = function(x) stringdistmatrix(x, method = 'hamming')

sek %>% 
  as.data.frame() …
Run Code Online (Sandbox Code Playgroud)

r sequence hamming-distance dplyr

2
推荐指数
1
解决办法
201
查看次数

Jekyll - 在索引中显示随机选择的帖子

我想在我的Jekyll网站的首页上显示随机选择的帖子.

您是否知道如何每次加载页面时循环并选择随机帖子

这是我目前的指数.

---
layout: default
title: Home
---
<h1 class="content-listing-header sans">Posts</h1>

<ul class="content">
{% for post in site.posts %}
  <li class="listing">
    <hr class="slender">
    <a href="{{ post.url }}"><h4 class="contrast">{{ post.title }}</h4></a>
    <span class="smaller">{{ post.date | date: "%B %-d, %Y" }}</span>  <br/>
    <div>{{ post.excerpt }}</div>

  </li>
{% endfor %}
Run Code Online (Sandbox Code Playgroud)

谢谢

jekyll

2
推荐指数
1
解决办法
1588
查看次数

R - stackplot/barplot随时间的比例

我试图实现像这样的分布图

在此输入图像描述

对于每个时期,我需要绘制"堆叠比例"的图表.

数据看起来基本上如下:

         400 401 402 403 404 ...
1013662   7   7   7   7   7
1024583   2   2   2   2   2
1024812   6  27  27  27  27
1025491  48  48  48  48  48
1036642  56  56  56  56  56
....
Run Code Online (Sandbox Code Playgroud)

我想到了类似的东西

ft = function(x) prop.table(table(x), NULL)
apply(dta, MARGIN = 2, FUN = ft)
Run Code Online (Sandbox Code Playgroud)

然后我会得到每个时间段的比例列表

$`400`
2    6    7   19   24   30   42   46   48   56   67 
0.05 0.05 0.45 0.05 0.10 0.05 0.05 0.05 0.05 0.05 0.05 
Run Code Online (Sandbox Code Playgroud)

我不确定下一步会是什么.我不知道如何正确地unlist存储在数据帧中? …

r bar-chart

2
推荐指数
1
解决办法
144
查看次数

dplyr在%>%运算符内重复

我正在尝试使用rep,dplyr但我不完全理解为什么我不能使它工作.

我的数据看起来像这样.我要的是简单重复dayweekn每个id.

head(dt4)

   id  dayweek n
1  1   Friday 3
2  1   Monday 3
3  1 Saturday 3
4  1   Sunday 3
5  1 Thursday 3
6  1  Tuesday 3
Run Code Online (Sandbox Code Playgroud)

我想要做的就是在一个dplyr流程中

cbind(rep(dt4$id, dt4$n), rep(as.character(dt4$dayweek), dt4$n) ) 
Run Code Online (Sandbox Code Playgroud)

这使

    [,1] [,2]    
[1,] "1"  "Friday"
[2,] "1"  "Friday"
[3,] "1"  "Friday"
[4,] "1"  "Monday"
[5,] "1"  "Monday"
[6,] "1"  "Monday"
Run Code Online (Sandbox Code Playgroud)

我不明白为什么这段代码不起作用

dt4 %>% 
  group_by(id) %>% 
  summarise(rep(dayweek, n))

Error: expecting a single …
Run Code Online (Sandbox Code Playgroud)

r repeat rep dplyr

2
推荐指数
1
解决办法
237
查看次数

Manim 展示乳胶桌

有没有办法使用显示乳胶表并为其设置动画manim

例如

\begin{table}[]
\centering
\begin{tabular}{lllll}
 &  & \multicolumn{2}{l}{End} &  \\
Top &  & Bottom & Bottom &  \\
 & Top & 40 & 160 & 200 \\
 & Bottom & 640 & 160 & 800 \\
 &  & 200 & 800 & 1000
\end{tabular}
\end{table}
Run Code Online (Sandbox Code Playgroud)

你会怎样去manim

from manimlib import *
import numpy as np

class TableManim(Scene):
     def construct(self):
     ...
Run Code Online (Sandbox Code Playgroud)

python manim

2
推荐指数
1
解决办法
1316
查看次数

使用dplyr计算熔化数据上值的出现次数

我想在做完我的数据table之后做一个简单的事情melt,但是使用了dplyr.

我的数据看起来像这样

   cluster   21:30   21:45
4        c   alone   alone
6        b       %       %
12       e partner partner
14       b partner partner
20       b   alone   alone
22       c partner partner
Run Code Online (Sandbox Code Playgroud)

随着table我可以简单地

table(dta$cluster)
   a b c d e 
   2 8 5 1 4 
Run Code Online (Sandbox Code Playgroud)

如何使用melt和得到相同的结果summarise

 library(dplyr)
 library(reshape2)

 dta %>% 
 melt(id.vars = 'cluster')  %>% 
 group_by(cluster) %>% 
 summarise( n() ) 
Run Code Online (Sandbox Code Playgroud)

融化数据之后,我需要的是table群集.

所以要正确计算这个 data.frame

 dta %>% 
 melt(id.vars = 'cluster') …
Run Code Online (Sandbox Code Playgroud)

r melt reshape2 dplyr

1
推荐指数
1
解决办法
230
查看次数

r - 字符串中的单独数字

在此示例中,分隔digitsfrom 的最有效方法是什么letters:

       V1 V2
1 p_men_1  1
2 p_men_2  0
3 p_men_3  1
4 p_wom_1  1
5 p_wom_2  1
6 p_wom_3  0
Run Code Online (Sandbox Code Playgroud)

输出中

     V1 V2 V3
1 p_men  1  1
2 p_men  2  0
3 p_men  3  1
4 p_wom  1  1
5 p_wom  2  1
6 p_wom  3  0
Run Code Online (Sandbox Code Playgroud)

我试过了

library(tidyr) 
library(dplyr)

df %>% separate(V1, c('V1', 'V2'), sep = '_')
Run Code Online (Sandbox Code Playgroud)

但由于'_',它不起作用

  df = rbind(c('p_men_1', 1), 
  c('p_men_2', 0), 
  c('p_men_3', 1), 
  c('p_wom_1', 1), 
  c('p_wom_2', 1), 
  c('p_wom_3', 0)) …
Run Code Online (Sandbox Code Playgroud)

regex r

1
推荐指数
1
解决办法
844
查看次数

标签 统计

r ×8

dplyr ×4

regex ×2

bar-chart ×1

crosstab ×1

grepl ×1

gsub ×1

hamming-distance ×1

jekyll ×1

manim ×1

melt ×1

python ×1

rep ×1

repeat ×1

reshape2 ×1

sequence ×1

sorting ×1