小编M--*_*M--的帖子

explorer.exe 作为 windows 中的父进程

我正在cmd使用以下命令杀死一些任务:

taskkill /f /im software* /t
Run Code Online (Sandbox Code Playgroud)

它完成工作并用它杀死所有任务IMAGENAME;但是,看看它给了我什么,我看到了一些有趣的东西。往下看:

SUCCESS: The process with PID 14712 (child process of PID 9068) has been terminated.
SUCCESS: The process with PID 12184 (child process of PID 9068) has been terminated.
SUCCESS: The process with PID 16344 (child process of PID 9068) has been terminated.
SUCCESS: The process with PID 6816 (child process of PID 9068) has been terminated.
SUCCESS: The process with PID 10656 (child process of PID 9068) has been …
Run Code Online (Sandbox Code Playgroud)

windows powershell cmd process child-process

1
推荐指数
1
解决办法
1924
查看次数

如何使用列名向量作为dplyr :: group_by()的输入?

我想创建一个函数dplyr,对数据子集执行某些操作。子集由数据集中一个或多个键列的值定义。当仅使用一列来标识子集时,我的代码可以正常工作:

set.seed(1)
df <- tibble(
  g1 = c(1, 1, 2, 2, 2),
  g2 = c(1, 2, 1, 2, 1),
  a = sample(5)
)
group_key <- "g1"
aggregate <- function(df, by) {
  df %>% group_by(!!sym(by)) %>% summarize(a = mean(a))
}
aggregate(df, by = group_key)
Run Code Online (Sandbox Code Playgroud)

这将按预期工作,并返回如下内容:

# A tibble: 2 x 2
     g1     a
  <dbl> <dbl>
1     1   1.5
2     2   4  
Run Code Online (Sandbox Code Playgroud)

不幸的是,如果我改变一切,一切都会崩溃group_key

# A tibble: 2 x 2
     g1     a
  <dbl> <dbl>
1     1   1.5
2     2 …
Run Code Online (Sandbox Code Playgroud)

eval r dplyr tidyeval

1
推荐指数
1
解决办法
112
查看次数

R跨多个列的多项选择调查问题的频率表

我想对R中的调查问题做一个相当普通的分析,但陷入了中间。

想象一个调查,要求您回答与某些功能相关联的品牌(例如,“品牌”可以是PlayStation,XBox ...,功能可以是“速度”,“图形” ...每个品牌可以在哪里检查了几个功能,也称为多选)。例如。在这里是这样的:https : //www.harvestyourdata.com/fileadmin/images/question-type-screenshots/Grid-multi-select.jpg

您通常将这些问题称为多选网格或矩阵问题。

无论如何,从数据角度来看,这类数据通常以宽格式存储,其中每行*列的组合是一个变量,其编码为0/1(如果调查参与者未选中该框,则为0,否则为1)。

假设我们有5个品牌和10个商品,则总共有50个变量,理想情况下遵循一个很好的结构化命名方案,例如item1_column1,item2_column1,item3_column1,[...],item1_column2等。

现在,我想一次迭代分析(频率表)所有这些变量。我已经在问题包中找到了cross.multi.table函数。但是,它仅允许基于单个因素分析所有项目。我需要的是同时允许多列。

有任何想法吗?我是否可能缺少另一个软件包中的函数,或者可以使用tidyverse甚至使用cross.multi.table函数轻松完成此操作?

使用此数据作为测试输入:

dat = data.frame(item1_column1 = c(0,1,1,1),
                 item2_column1 = c(1,1,1,0),
                 item3_column1 = c(0,0,1,1),
                 item1_column2 = c(1,1,1,0),
                 item2_column2 = c(0,1,1,1),
                 item3_column2 = c(1,0,1,1),
                 item1_column3 = c(0,1,1,0),
                 item2_column3 = c(1,1,1,1),
                 item3_column3 = c(0,0,1,0))
Run Code Online (Sandbox Code Playgroud)

我希望这个输出:

         column1    column2    column3
item1    3          3          2
item2    3          3          4
item3    2          3          1
Run Code Online (Sandbox Code Playgroud)

或理想的比例/百分比:

         column1    column2    column3
item1    75%        75%        50%
item2    75%        75%        100%
item3    50%        75%        25%
Run Code Online (Sandbox Code Playgroud)

r survey multi-select reshape

1
推荐指数
1
解决办法
75
查看次数

使用R dplyr整理数据帧

我的数据框df如下所示:

        Value
X.Y.Z   10
X.Y.K   20
X.Y.W   30
X.Y.Z.1 20
X.Y.K.1 5
X.Y.W.1 30
X.Y.Z.2 3
X.Y.K.2 23
X.Y.W.2 44
Run Code Online (Sandbox Code Playgroud)

我正在尝试使用行名的第三个字符来对列进行命名,例如:

在此处输入图片说明

因此,行名现在是行的最后一个字符(在点之后)。我知道这是可能的做dplyr,我试过gatherspread,但没有运气,谁能帮助?

谢谢!

编辑:这是上面文本中的数据,我:

structure(list(..1 = c("X.Y.Z", "X.Y.K", "X.Y.W", "X.Y.Z.1", 
"X.Y.K.1", "X.Y.W.1", "X.Y.Z.2", "X.Y.K.2", "X.Y.W.2"), Value = c(10, 
20, 30, 20, 5, 30, 3, 23, 44)), class = "data.frame", row.names = c(NA, 
-9L))
Run Code Online (Sandbox Code Playgroud)

xml r dplyr tidyverse

1
推荐指数
1
解决办法
88
查看次数

将 Excel 工作表作为单独的数据框导入到 R 中

我有一个包含 48 个工作表的 Excel 文件,我使用以下代码读取多个工作表:

lst <- lapply(1:48, function(i) read_excel("my_file.xlsx", sheet = i))
Run Code Online (Sandbox Code Playgroud)

lst有信息,但我想在 R 中创建单独的数据框。因此,我想创建 48 个表。我该怎么办?

excel r dataframe xlconnect readxl

1
推荐指数
1
解决办法
1398
查看次数

如何访问 R 中的嵌套 SQL 表?

从 R Studio 的ODBC 数据库文档中,我可以看到一个如何将 SQL 表读入 R 数据框架的简单示例:

data <- dbReadTable(con, "flights")
Run Code Online (Sandbox Code Playgroud)

BGBUref让我粘贴我正在尝试读取 R 数据框的表格图形(?)。这是来自我在 R studio 中的连接窗格。

嵌套表

如果我使用与上面相同的语法,con我的输出在哪里dbConnect(...) ,我得到以下内容:

df <- dbReadTable(con, "BGBURef")
#> Error: <SQL> 'SELECT * FROM "BGBURef"' nanodbc/nanodbc.cpp:1587: 42S02: 
#> [Microsoft][ODBC Driver 17 for SQL Server][SQL Server]Invalid object name
#> 'BGBURef'.
Run Code Online (Sandbox Code Playgroud)

我对“表”的理解是否不正确?或者我是否需要执行类似的操作才能访问嵌套BGBUref表:

df <- dbReadTable(con, "QnRStore\dbo\BGBURef")
#> Error: '\d' is an unrecognized escape in character string starting ""QnRStore\d"
Run Code Online (Sandbox Code Playgroud)

如果我单击小电子表格图标,数据BGBUref框将出现在 R Studio 中。就我而言,我只是不知道如何将其放入定义的数据框中df


这是我运行这些命令时的输出: …

sql-server odbc r r-dbi dbplyr

1
推荐指数
1
解决办法
1677
查看次数

将坐标从非常规格式的度数转换为十进制度数

我正在尝试转换我的数据,以便它可以绘制在地图上。例如,数据如下所示:

# A tibble: 2 x 2
  Latitud           Longitud        
  <chr>             <chr>           
1 10º 35' 28.98'' N 3º 41' 33.91'' O
2 10º 35' 12.63'' N 3º 45' 46.22'' O
Run Code Online (Sandbox Code Playgroud)

我正在尝试使用以下方法对其进行变异:

df %>% 
  mutate(
    Latitud = str_replace_all(Latitud, "''", ""),
    lat_edit = sp::char2dms(Latitud), "°")
Run Code Online (Sandbox Code Playgroud)

返回和错误:

Error in if (any(abs(object@deg) > 90)) return("abs(degree) > 90") : 
  missing value where TRUE/FALSE needed
In addition: Warning message:
In asMethod(object) : NAs introduced by coercion
Run Code Online (Sandbox Code Playgroud)

我想在 ggplot (或其他空间包)的地图上绘制这两个点

数据:

structure(list(Latitud = c("40º 25' 25.98'' N", "40º …
Run Code Online (Sandbox Code Playgroud)

r geo dataframe stringr dplyr

1
推荐指数
1
解决办法
336
查看次数

Alternative to plyr::mapvalues in data.table

I am looking for a readable alternative to plyr::mapvalues in data.table.

例如,在中plyr::mapvalues,如果我想将carbin 的值更改mtcarstype1, type2, type3,则可以执行以下操作:

library(tidyverse)

mtcars %>% 
  mutate(carb = plyr::mapvalues(
    carb,
    from = c("1", "2", "3", "4", "6", "8"),
    to = c("type1", "type1", "type2", "type2", "type3", "type3")))
Run Code Online (Sandbox Code Playgroud)

为了获得相同的效果data.table,我会这样做,但这似乎不是常规方法:

library(data.table)

dt <- data.table(mtcars)
dt$carb <- as.character(dt$carb)

dt[which(carb %in% c("1", "2")), 
   carb := "type1"]

dt[which(carb %in% c("3", "4")), 
   carb := "type2"]

dt[which(carb %in% c("6", "8")), 
   carb := "type3"]
Run Code Online (Sandbox Code Playgroud)

是否可以在一个条件(dt[...] …

r plyr dataframe dplyr data.table

1
推荐指数
2
解决办法
89
查看次数

Shinyapp.io 读取每 5 分钟更新一次内容的本地文件

我闪亮的应用程序将每 5 分钟从我桌面上的本地文件读取内容,因为文件的内容也每 5 分钟更新一次。我闪亮的应用程序基本上读入了新内容并将数据附加到现有数据框中,并每 5 分钟绘制一次新内容。

问题:最终,我想在网上主持这个。如果我将它托管在 上shinyapps.io,我是否仍然能够读取我桌面中每 5 分钟更新一次的本地文件?如果没有,我该怎么办?

r shiny shinyapps

1
推荐指数
1
解决办法
1233
查看次数

dplyr 中与 top_n() 等效的 Pandas 是什么?

dplyr 中与 top_n() 等效的 Pandas 是什么?

在 R dplyr 0.8.5 中:

> df <- data.frame(x = c(10, 4, 1, 6, 3, 1, 6))
> df %>% top_n(2, wt=x)
   x
1 10
2  6
3  6
Run Code Online (Sandbox Code Playgroud)

正如 dplyr 文档所强调的那样,请注意,我们在这里得到了 2 个以上的值,因为有一个关系:top_n() 要么获取所有带有值的行,要么没有。

我在 Pandas 1.0.1 中的尝试:

df = pd.DataFrame({'x': [10, 4, 1, 6, 3, 1, 6]})
df = df.sort_values('x', ascending=False)
df.groupby('x').head(2)
Run Code Online (Sandbox Code Playgroud)

结果:

    x
0  10
3   6
6   6
1   4
4   3
2   1
5   1
Run Code Online (Sandbox Code Playgroud)

预期成绩:

   x
1 10 …
Run Code Online (Sandbox Code Playgroud)

python pandas

1
推荐指数
1
解决办法
219
查看次数