小编Sum_edh的帖子

RStudio Shiny renderDataTable字体大小

我试图减少我的renderDataTable中的字体大小,但我找不到任何控制字体大小的示例.我已经读过可以通过jquery控制它,但我找不到任何例子.任何指导都非常有用,因为我使用Shiny ioslides演示文稿,我的数据表中的字体大小太大了.

13
推荐指数

1
解决办法

1万
查看次数

SQLAlchemy 从查询结果中访问列类型

我正在使用 SQLAlchemy（带有pymssql驱动程序）连接到 SQL Server 数据库。

import sqlalchemy

conn_string = f'mssql+pymssql://{uid}:{pwd}@{instance}/?database={db};charset=utf8'
sql = 'SELECT * FROM FAKETABLE;'

engine = sqlalchemy.create_engine(conn_string)
connection = engine.connect()
result = connection.execute(sql)
result.cursor.description

Run Code Online (Sandbox Code Playgroud)

这导致：

(('col_1', 1, None, None, None, None, None),
 ('col_2', 1, None, None, None, None, None),
 ('col_3', 4, None, None, None, None, None),
 ('col_4', 3, None, None, None, None, None),
 ('col_5', 3, None, None, None, None, None))

Run Code Online (Sandbox Code Playgroud)

根据PEP 249（光标的.description属性）：

前两项（name 和 type_code）是强制性的，其他五项是可选的，如果不能提供有意义的值，则设置为 None。

我假设整数(1, 1, 4, 3, 3) …

python sql-server sqlalchemy pymssql

7
推荐指数

1
解决办法

360
查看次数

R:如果加载了插入符号包,则set.seed()结果不匹配

我createFolds()在R(版本:3.3.0)中使用来创建训练/测试分区.为了使结果可重复,我使用set.seed()种子值为10.正如预期的那样,结果(生成的折叠)是可重复的.

但是,一旦我在设定种子之后加载了插入包.然后使用createFolds函数,我发现创建的折叠是不同的(虽然仍然可以重现).

具体而言,创建的折叠在以下两种情况下有所不同:

情况1:

library(caret)
set.seed(10)
folds=createFolds(y,k=5,returnTrain=TRUE)

Run Code Online (Sandbox Code Playgroud)

案例2:

set.seed(10)
library(caret)
folds=createFolds(y,k=5,returnTrain=TRUE)

Run Code Online (Sandbox Code Playgroud)

哪里y是矢量.

为什么会发生这种情况？

r random-seed r-caret

6
推荐指数

1
解决办法

586
查看次数

在ggplot2中的堆积条形图顶部显示每个组的总(总和)值

我用这段代码制作了下面的叠加条形图:

library(ggplot2)
library(dplyr)

Year      <- c(rep(c("2006", "2007", "2008", "2009"), each = 4))
Category  <- c(rep(c("A", "B", "C", "D"), times = 4))
Frequency <- c(168, 259, 226, 340, 216, 431, 319, 368, 423, 645, 234, 685, 166, 467, 274, 251)
Data      <- data.frame(Year, Category, Frequency)

Data2 <-Data%>%
  group_by(Year, Category)%>%
    summarise(Sum_grp = sum(Frequency))

Data3 <-transform(Data2, Pos = ave(Frequency, Year, FUN = cumsum) - Frequency / 2)

ggplot(Data3, aes(Year, Frequency, group=Category,fill = Category))+
  geom_bar(stat="identity")+
  geom_text(aes(label = Frequency,y=Pos), size = 3)

Run Code Online (Sandbox Code Playgroud)

现在,我想在每个栏的顶部添加每个组的总和,但我不知道如何.

有人可以帮帮我吗？

非常感谢!!!!!

r ggplot2 dplyr

6
推荐指数

1
解决办法

4643
查看次数

数据帧的多个变量之间的相关性

我有data.frame10个变量R.让我们称呼他们var1 var2......var10

我想找到一个相关性var1相对 var2,var3...var10

我们怎么做？

cor函数可以一次找到2个变量之间的相关性.通过使用我必须cor为每个分析编写函数

5
推荐指数

1
解决办法

1万
查看次数

学习data.table - 如何按行号和列名更新值

我的最后几篇文章写得不好,所以这次我会尝试做一份更好,更清洁的工作.

我正在学习如何使用数据表对象,我正在努力解决的一个任务是同时更新数据表中的行号和列名.使用data.frames这更容易,我只需执行以下操作:

my_df = as.data.frame(matrix(ncol = 10, nrow = (100)))
names(my_df) = c("P1", "P2", "P3", "P4", "P5", "Q1", "Q2", "Q3", "Q4", "Q5")
head(my_df)

  P1 P2 P3 P4 P5 Q1 Q2 Q3 Q4 Q5
1 NA NA NA NA NA NA NA NA NA NA
2 NA NA NA NA NA NA NA NA NA NA
3 NA NA NA NA NA NA NA NA NA NA
4 NA NA NA NA NA NA NA NA NA NA
5 NA NA …

Run Code Online (Sandbox Code Playgroud)

5
推荐指数

1
解决办法

809
查看次数

按百分位数分割矢量

我需要将R中已排序的未知长度向量拆分为"前10%,...,最低10%"所以,例如,如果我有vector <- order(c(1:98928)),我想将其拆分为10个不同的向量,每个向量代表大约10%的总长度.

香港专业教育学院尝试使用,split <- split(vector, 1:10)但由于我不知道向量的长度,如果它不是多个我得到这个错误

数据长度不是拆分变量的倍数

即使它的多个和函数有效,split()也不保持原始向量的顺序.这就是split给出的:

split(c(1:10) , 1:2)
$`1`
[1] 1 3 5 7 9

$`2`
[1]  2  4  6  8 10

Run Code Online (Sandbox Code Playgroud)

这就是我想要的:

$`1`
[1] 1 2 3 4 5

$`2`
[1]  6  7  8  9 10

Run Code Online (Sandbox Code Playgroud)

我是R的新手,我一直在尝试很多没有成功的事情,有谁知道怎么做？

4
推荐指数

2
解决办法

2273
查看次数

R - 删除data.table中每个因子的第一个和最后一个字符

我是R的新手,我有以下快速问题:删除data.table中每个"单元格"的第一个和最后一个字符的最佳方法是什么.我从.txt文件中导入了数据,其中文本有三个字符的分隔符 - "^ | ^"？

DT <- fread("file.txt", header = T, sep= "|")

  Row     Conc   group
  ^1^     ^2.5^    ^A^
  ^2^     ^3.0^    ^A^
  ^3^     ^4.6^    ^B^
  ^4^     ^5.0^    ^B^
  ^5^     ^3.2^    ^C^
  ^6^     ^4.2^    ^C^
  ^7^     ^5.3^    ^D^
  ^8^     ^3.4^    ^D^

Run Code Online (Sandbox Code Playgroud)

我可以使用stringi包删除"^"列的列:

DT[, Row := stri_sub(Row,2,-2)]

Run Code Online (Sandbox Code Playgroud)

它将它转换为char,但这应该没问题.但是,由于我使用的data.table有46列,我正在寻找更节省时间的方法.

4
推荐指数

1
解决办法

1358
查看次数

geom_area 绘图区域的间隙

我想根据因子变量“状态”区分绘图颜色的区域。我使用 fill=Status，但是，我看到绘图区域出现了中断。关于如何避免这种情况以及为什么会发生这种情况的任何想法/建议？

df1 <- data.frame(Date=seq(as.Date("2016/03/01"), as.Date("2016/03/10"), "day"),
             Storypoints=c(8,14,16,23,28,35,40,44,46,55),
             Status=c(rep("Completed",7), rep("Open",3)))

ggplot(data=df1, mapping = aes(x = Date)) + 
geom_area(aes(y=Storypoints, fill=Status))

Run Code Online (Sandbox Code Playgroud)

3
推荐指数

1
解决办法

1531
查看次数

根据闪亮的用户输入输出不同的图

我有一个selectInput小工具要求用户选择 y 轴。选项包括流派、体验和评级，我想输出我创建的三个条形图之一（ratebars3、expbars3 和 genbars4）。每个图都有相同的 x 轴（公司），但图表会根据 y 的不同而有所不同。以下是我的 UI 中选择输入的代码：

    selectInput("selecty", label = h3("Select Y axis"),
    choices = list("Rating", "Experience", "Genre"))

Run Code Online (Sandbox Code Playgroud)

我一直if.. return在服务器中尝试一些类型语句，但没有成功。如果有人知道一些服务器代码可以根据用户输入的内容显示我的绘图，那将是一个巨大的帮助。

3
推荐指数

1
解决办法

3468
查看次数

R:ggplot :: geom_path:每组只包含一个观察.你需要调整群体美感吗？

我想在ggplot中制作一个折线图,我很难诊断出我的错误.我已经阅读了几乎所有相似的主题,但一直无法解决我的问题.

我试图绘制日本的CPI.我从FRED在线下载了数据.

我的str看起来像:

str(jpycpi)

data.frame: 179 obs. of  2 variables:
 $ DATE           : Factor w/ 179 levels "2000-04-01","2000-05-01",..: 1 2 3 4 5 6 7 8 9 10 ...
 $ JPNCPIALLMINMEI: num  103 103 103 102 103 ...

Run Code Online (Sandbox Code Playgroud)

我的剧情代码:

ggplot(jpycpi, aes(x=jpycpi$DATE, y=jpycpi$JPNCPIALLMINMEI)) + geom_line()

Run Code Online (Sandbox Code Playgroud)

它给我一个错误说:

geom_path:每组只包含一个观察.你需要调整群体美感吗？

我已经尝试了以下内容并且已经能够绘制它,但是由于某些奇怪的原因,图形x条被扭曲了.该代码如下:

ggplot(jpycpi, aes(x=jpycpi$DATE, y=jpycpi$JPNCPIALLMINMEI, group=1)) + geom_line()

Run Code Online (Sandbox Code Playgroud)

0
推荐指数

1
解决办法

1万
查看次数

删除所有重复的值

如果我有一个矢量:

x <- c(5, 6, 2, 9, 5, 2, 1, 9, 9)

Run Code Online (Sandbox Code Playgroud)

如何创建包含从未重复过的元素的另一个向量？在这种情况下,它将是:( c(6, 1)因为重复了5,2和9)

0
推荐指数

1
解决办法

79
查看次数

标签统计

r ×11

correlation ×1

random-seed ×1