小编C8H*_*4O2的帖子

import pandas as pd
import numpy as np
import numexpr
import timeit

someDf = pd.DataFrame({'a':np.random.uniform(size=int(1e6)), 'b':np.random.uniform(size=int(1e6))})

%timeit -n100 someDf.eval("a**b - a*b > b**a - b/a") # DataFrame.eval() on notional expression
%timeit -n100 eval("someDf['a']**someDf['b'] - someDf['a']*someDf['b'] > someDf['b']**someDf['a'] …

Run Code Online (Sandbox Code Playgroud)

python performance eval pandas

C8H*_*4O2

2016 08-03

11
推荐指数

1
解决办法

3728
查看次数

在R中,自定义dcast.data.table创建的列的名称

我是新手reshape2,data.table并试图学习语法.

我有一个data.table我想从每个分组变量的多行转换为每个分组变量一行.为简单起见,我们让它成为一个客户表,其中一些客户共享地址.

library(data.table)

# Input table:
cust <- data.table(name=c("Betty","Joe","Frank","Wendy","Sally"),
                   address=c(rep("123 Sunny Rd",2), 
                             rep("456 Cloudy Ln",2),
                                 "789 Windy Dr"))

Run Code Online (Sandbox Code Playgroud)

我希望输出具有以下格式:

# Desired output looks like this:
(out <- data.table(address=c("123 Sunny Rd","456 Cloudy Ln","789 Windy Dr"),
                   cust_1=c("Betty","Frank","Sally"),
                   cust_2=c("Joe","Wendy",NA)) )

#          address cust_1 cust_2
# 1:  123 Sunny Rd  Betty    Joe
# 2: 456 Cloudy Ln  Frank  Wendy
# 3:  789 Windy Dr  Sally     NA

Run Code Online (Sandbox Code Playgroud)

我想要cust_1 ... cust_n的列,其中n是每个地址的最大客户数.我并不关心订单 - Joe是否是cust_1而Betty是cust_2,反之亦然.

pivot-table r reshape2 data.table

C8H*_*4O2

2014 10-07

10
推荐指数

2
解决办法

6317
查看次数

Discrete SeekBar

我正在尝试为Android应用创建一个离散的搜索栏.

我知道我可以为a设置最大值和最小值SeekBar(我的理想解决方案是下面的Click示例)但是我希望条形图以特定间隔在滑块上上下移动 - 在我的情况下每10个.因此,唯一可用的选择SeekBar是;

20
三十
40
50
60
70

是否可以为标准Android定义特定值,SeekBar或者至少更改项目之间的间隔.如果没有,那么使用自定义搜索栏是否可行？我没有在网上发现任何解决此问题的内容(至少不适用于Android - 令人沮丧,因为它是Google Material设计指南中的公认组件).

android android-seekbar

Jon*_*ght

2018 01-11

10
推荐指数

2
解决办法

1万
查看次数

R:返回矩阵中最大的连续数字对

我正在尝试编写一个R代码来返回矩阵中最大的连续数字对.连续对可以是水平的,垂直的和两个对角线.

例如,如果我有矩阵:

ma = array(c(8,4,3,1,7,5,9,15,6,10,16,11,2,14,12,13), dim = c(4,4))

Run Code Online (Sandbox Code Playgroud)

(1)水平的最高连续对:16和12; (2)垂直:16和11(3)对角线():16和13; (4)对角线(/):16和15.

我怎么能在R？

r matrix

puk*_*iXD

2017 01-20

10
推荐指数

1
解决办法

354
查看次数

直方图条件填充颜色

我想做一个直方图,其中填充颜色根据bin的低端而变化.我不想手动填充.这个答案似乎很有希望,但我无法将其成功转换为直方图和双值(非渐变)颜色方案.我相信解决方案可能是一些ifelse逻辑,geom_histogram(fill= )但我不知道如何访问bin起始值.

例如,在下面的直方图中,我想将收入超过10万美元的红色显示为高收入客户.

library(ggplot2)
library(scales)

n <- 10000
cust <- data.frame(cust_id=1:n,cust_rev <- rexp(n,.00001))

# I want to use a log scale for my tick marks and bin breaks
powers <- function(base,exp) sapply(1:exp, function(exp) base^exp )

ggplot(cust, aes(cust_rev)) + 
  geom_histogram(color="black",fill="light blue", binwidth=1/3) + 
  scale_x_log10(labels=comma, breaks=powers(10,8)) +
  scale_y_continuous(labels=comma) +
  xlab("Customer Revenue") + ylab("Number of Customers") +
  ggtitle("Distribution of Customer Value")

Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

此外,我尝试使用第二个geom_histogram()进行解决方法,但未成功.

ggplot(cust, aes(x=cust_rev)) + 
  geom_histogram(color="black",fill="light blue", binwidth=1/3) + 
  geom_histogram(data=subset(cust,cust_rev>100000),
                 color="black",fill="red", binwidth=1/3) + …

Run Code Online (Sandbox Code Playgroud)

if-statement r colors histogram ggplot2

C8H*_*4O2

2017 09-22

9
推荐指数

1
解决办法

2万
查看次数

在ggplot2中设置绘图区域的大小

有没有办法来直接指定的宽度和高度绘图区有ggplot2,例如3"和4"个下面的数字？

在此输入图像描述

示例代码:

library(ggplot2)
x <- seq(-5,5,by=.1)
d <- data.frame(x=x,y=cos(x))
p <- ggplot(d) + aes(x=x,y=y) + geom_line()
ggsave(p,file='~/example.pdf')

Run Code Online (Sandbox Code Playgroud)

r ggplot2

Mar*_*pov

2015 06-05

9
推荐指数

0
解决办法

3万
查看次数

使用来自数组元组的列构建DataFrame

我正在努力构建一个基于生成的元组的值计数的DataFrame的基本任务np.unique(arr, return_counts=True),例如:

import numpy as np
import pandas as pd

np.random.seed(123)  
birds=np.random.choice(['African Swallow','Dead Parrot','Exploding Penguin'], size=int(5e4))
someTuple=np.unique(birds, return_counts = True)
someTuple
#(array(['African Swallow', 'Dead Parrot', 'Exploding Penguin'], 
#       dtype='<U17'), array([16510, 16570, 16920], dtype=int64))

Run Code Online (Sandbox Code Playgroud)

首先我试过了

pd.DataFrame(list(someTuple))
# Returns this:
#                  0            1                  2
# 0  African Swallow  Dead Parrot  Exploding Penguin
# 1            16510        16570              16920

Run Code Online (Sandbox Code Playgroud)

我也试过pd.DataFrame.from_records(someTuple),它返回同样的东西.

但我正在寻找的是:

#              birdType      birdCount
# 0     African Swallow          16510  
# 1         Dead Parrot          16570  
# 2   Exploding Penguin          16920

Run Code Online (Sandbox Code Playgroud)

什么是正确的语法？

python numpy dataframe pandas

C8H*_*4O2

2016 11-05

9
推荐指数

3
解决办法

1534
查看次数