小编ben*_*890的帖子

将关联矩阵转换为包含每个行列对的记录的数据框

我有一个很大的相关矩阵(1093 x 1093).我正在尝试将我的矩阵放入一个数据帧,每个行和列对都有一列,所以它会(1093)^ 2条记录.

这是我的矩阵片段

            60516        45264        02117
60516  1.00000000 -0.370793012 -0.082897941
45264 -0.37079301  1.000000000  0.005145601
02117 -0.08289794  0.005145601  1.000000000
Run Code Online (Sandbox Code Playgroud)

这里的目标是拥有一个如下所示的数据框:

row column correlation
60516 60516 1.000000000
60516 45264 -0.370793012
Run Code Online (Sandbox Code Playgroud)

........ 等等.

有人有任何提示吗?如果我能澄清任何事情,请告诉我

谢谢,本

r matrix correlation

8
推荐指数
1
解决办法
3269
查看次数

根据列中的值从熊猫数据框中的列表中删除元素

假设我有以下数据框:

a = [[1,2,3,4,5,6],[23,23,212,223,1,12]]
b = [1,1]


df = pd.DataFrame(zip(a,b), columns = ['a', 'b'])
Run Code Online (Sandbox Code Playgroud)

我的目标是删除系列B中列表A中的元素。我这样做的尝试如下:

df['a'] = [i.remove(j) for i,j in zip(df.a, df.b)]
Run Code Online (Sandbox Code Playgroud)

逻辑似乎对我来说听起来不错,但是我最终得到df ['a']为一系列空值。这里发生了什么?

python pandas

8
推荐指数
2
解决办法
82
查看次数

从Python中的字符串中删除数字

有没有一种有效的方法从python中删除字符串中的数字?使用nltk或基础python?

谢谢,本

python nltk

7
推荐指数
3
解决办法
4万
查看次数

在 Shiny 应用程序部署中隐藏密钥

我正在使用从 S3 获取的数据将应用程序部署到 Shinyapps.io,我想确保我的 AWS 密钥是安全的。目前在 app.R 代码中,我正在设置环境变量,然后查询 S3 以获取数据。

有没有办法创建一个隐藏密钥的文件并将其与我的 app.R 文件一起部署到 ShinyApss

Sys.setenv("AWS_ACCESS_KEY_ID" = "XXXXXXXX",
           "AWS_SECRET_ACCESS_KEY" = "XXXXXXXXX",
           "AWS_DEFAULT_REGION" = "us-east-2")


inventory =aws.s3::s3read_using(read.csv, object = "s3://bucket/file.csv")
Run Code Online (Sandbox Code Playgroud)

我还要补充一点,我使用的是免费计划,因此用户身份验证不可用,否则我不会为我的密钥可见而大惊小怪。

r amazon-s3 shiny shinyapps

7
推荐指数
1
解决办法
217
查看次数

SQL内连接到左连接表

所以这可能更多是关于MySQL如何工作的理论问题,但我喜欢一些指导.

假设我有三个表,表a,b和c,其中表a和b是事实表,表c是表b的维表.如果我想要将表b连接到表a(我想保留表a的所有内容,但也想要表b中的匹配内容),我是否仍然可以将表c连接到表b,即使表b仍然连接?或者我是否必须将表c连接到表b?或者这两种意图和目的是否会产生相同的结果?

select a.column, c.name
from tablea a
left join tableb b on a.id = b.id
inner join (?) tablec c on b.name_id = c.name
Run Code Online (Sandbox Code Playgroud)

mysql sql left-join

5
推荐指数
3
解决办法
7893
查看次数

是否可以在合并中使用列索引?

如果我有两个我希望合并的数据帧,是否有一种方法可以通过列索引而不是列的名称进行合并?

例如,如果我有这两个dfs,并希望在x.x1和y.x2上合并.

dtest <- data.frame(x1 = 1:10, y = 2:11)
dtest2 <- data.frame(x2 = 1:10, y1 = 11:20)
Run Code Online (Sandbox Code Playgroud)

我尝试了以下但我无法让它工作

xy <- merge(dtest, dtest2, by.x = x[,1], by.y = y[,1], all.x = TRUE, all.y = TRUE)
Run Code Online (Sandbox Code Playgroud)

merge r

4
推荐指数
1
解决办法
3231
查看次数

Vertica SQL在一个语句中插入多行

想知道是否有可能在一个插入声明中完成以下内容?

drop table analytics.bw_covariance_matrix;
create table analytics.bw_covariance_matrix (
row int,
x1 float,
x2 float,
x3 float
);

insert into analytics.bw_covariance_matrix VALUES
(1, 4.01926965, -0.4686067, -0.07592112),
insert into analytics.bw_covariance_matrix VALUES
(2, -0.46860675,  4.1799267, -0.82461139);
insert into analytics.bw_covariance_matrix VALUES
(3, -0.07592112, -0.8246114,  4.37186211);
Run Code Online (Sandbox Code Playgroud)

sql vertica

3
推荐指数
1
解决办法
7159
查看次数

使用 openpyxl 取消合并 Excel 工作表中的每个单元格

有没有办法使用 openpyxl 取消合并 Excel 工作表中的每个单元格。不能保证每个或任何单元格都被合并,但基本上我想取消合并单元格(如果它们存在于工作表中)。

python openpyxl

3
推荐指数
1
解决办法
6154
查看次数

使用plyr在两列上连接两个大型数据帧

我有一个非常大的数据帧,我需要连接到两列上的另一个数据帧.我一直在使用merge来完成ir,但是R会耗尽内存,表格越大.是否有使用dplyr或plyr的类似解决方案?我听说他们需要的内存要少得多.我知道如何在plyr中使用join函数,我正在努力的是通过两列连接.我一直在使用的合并synatx如下:

Correlation_Table <- merge(Correlation_Table, inter, by.x = c(1,2), by.y = c(1,2), all.x = TRUE, all.y = TRUE)
Run Code Online (Sandbox Code Playgroud)

例如,如果我有以下两个数据帧:

> head(df1)
  x y         z          a
1 1 2 429.57410  43.746670
2 2 3 717.98184 524.288886
3 3 4 601.66938 640.245469
4 4 5  87.41476 318.964765
5 5 6 586.22234 196.759991
6 6 7 619.82194   3.308136
> head(df2)
   b  c        d
1  5  8 152.2855
2  6  9 191.5406
3  7 10 197.0520
4  8 11 175.4209
5  9 12 157.6239
6 …
Run Code Online (Sandbox Code Playgroud)

r dplyr

2
推荐指数
1
解决办法
6431
查看次数

将pandas数据帧转换为二维数组

我有一个包含三列的数据框.X,Y和count,其中count是x和y一起出现的出现次数.我的目标是将其从数据帧转换为二维数组,其中X是行的名称,Y是列的名称,计数构成表中的记录.

这可能吗?如果需要,我可以详细说明.

arrays dataframe pandas

2
推荐指数
2
解决办法
6013
查看次数