我想在同一个图中绘制多个变量的 CDF 图。变量的长度不同。为了简化细节,我使用以下示例代码:
library("ggplot2")
a1 <- rnorm(1000, 0, 3)
a2 <- rnorm(1000, 1, 4)
a3 <- rnorm(800, 2, 3)
df <- data.frame(x = c(a1, a2, a3),ggg = gl(3, 1000))
ggplot(df, aes(x, colour = ggg)) + stat_ecdf()+ coord_cartesian(xlim = c(0, 3)) + scale_colour_hue(name="my legend", labels=c('AAA','BBB', 'CCC'))
Run Code Online (Sandbox Code Playgroud)
可以看到,a3的长度是800,与a1、a2不同。当我运行代码时,它显示:
> df <- data.frame(x = c(a1, a2, a3),ggg = gl(3, 1000))
Error in data.frame(x = c(a1, a2, a3), ggg = gl(3, 1000)) :
arguments imply differing number of rows: 2800, 3000
> ggplot(df, aes(x, …
Run Code Online (Sandbox Code Playgroud) 我希望根据两个列值选择一些特定的行.例如:
d = {'user' : [1., 2., 3., 4] ,'item' : [5., 6., 7., 8.],'f1' : [9., 16., 17., 18.], 'f2':[4,5,6,5], 'f3':[4,5,5,8]}
df = pd.DataFrame(d)
print df
Out:
f1 f2 f3 item user
0 9 4 4 5 1
1 16 5 5 6 2
2 17 6 5 7 3
3 18 5 8 8 4
Run Code Online (Sandbox Code Playgroud)
我想根据'user'和'item'的值选择行.给定一个存储[user,item]值对的2d numpy数组:
samples = np.array([[1,5],[3,7],[3,7],[2,6]])
Out:
array([[1, 5],
[3, 7],
[3, 7],
[2, 6]])
Run Code Online (Sandbox Code Playgroud)
然后预期的输出是:
Out:
f1 f2 f3 item user
0 9 …
Run Code Online (Sandbox Code Playgroud) 我有两个大的numpy二维数组.一种形状是X1(1877055,1299),另一种是X2(1877055,1445).然后我用
X = np.hstack((X1, X2))
Run Code Online (Sandbox Code Playgroud)
将两个数组连接成一个更大的数组.但是,程序不会运行并退出代码-9.它没有显示任何错误消息.
问题是什么?如何连接这两个大的numpy 2D数组?