小编MCP*_*tor的帖子

"非零退出状态"R 3.0.1'XML'和'RCurl'

我在我的Ubuntu机器13.10上安装XML和RCurl时遇到了一些麻烦.我今天进行了所有sudo更新和升级.

我正试图用R拨浪鼓.我无法安装使用拨浪鼓所需的'XML'.这与一年后在这里提出的问题几乎是同一个问题.以下是我要回复的错误消息:

> install.packages("RCurl")
Installing package into ‘/home/steven/R/x86_64-pc-linux-gnu-library/3.0’
(as ‘lib’ is unspecified)
trying URL 'http://cran.rstudio.com/src/contrib/RCurl_1.95-4.1.tar.gz'
Content type 'application/x-gzip' length 870915 bytes (850 Kb)
opened URL
==================================================
downloaded 850 Kb

* installing *source* package ‘RCurl’ ...
** package ‘RCurl’ successfully unpacked and MD5 sums checked
checking for curl-config... no
Cannot find curl-config
ERROR: configuration failed for package ‘RCurl’
* removing ‘/home/steven/R/x86_64-pc-linux-gnu-library/3.0/RCurl’
Warning in install.packages :
  installation of package ‘RCurl’ had non-zero exit status

The downloaded source packages are in …
Run Code Online (Sandbox Code Playgroud)

xml linux r rcurl install.packages

66
推荐指数
2
解决办法
5万
查看次数

使用循环绘制n个图表Python

我有一组数据,我使用pandas数据框加载到python中.我想要做的是创建一个循环,为自己的框架中的所有元素打印一个图,而不是一个.我的数据是以这种方式构建的excel文件:

Index | DATE  | AMB CO 1 | AMB CO 2 |...|AMB CO_n | TOTAL
1     | 1/1/12|  14      | 33       |...|  236    | 1600
.     | ...   | ...      | ...      |...|  ...    | ...
.     | ...   | ...      | ...      |...|  ...    | ...
.     | ...   | ...      | ...      |...|  ...    | ...
n
Run Code Online (Sandbox Code Playgroud)

这是我到目前为止的代码:

import pandas as pd
import matplotlib.pyplot as plt
ambdf = pd.read_excel('Ambulance.xlsx', 
                      sheetname='Sheet2', index_col=0, na_values=['NA'])
print type(ambdf)
print ambdf
print …
Run Code Online (Sandbox Code Playgroud)

matplotlib python-2.7 pandas

30
推荐指数
4
解决办法
12万
查看次数

在同一图表R上绘制两个图表,ggplot2 par(mfrow())

在做了一些挖掘后我感觉这可能不会起作用,我需要发现一种替代方法,但我还是会问.

我必须通过使用来绘制我想在同一图表上绘制的图表 par(mfrow=c(1,2))

我的图表代码如下:

mTotal <- mean(data$Total)
mTotal

data$valence1[data$Total >= mTotal] <- "Above Mean"
data$valence1[data$Total < mTotal] <- "Below Mean"
data$valence2[data$Delta >= 0] <- "Positive"
data$valence2[data$Delta < 0] <- "Negative"

data

par(mfrow=c(1,2))

ggplot(data,
       aes(x = Index,
           y = Total,
           fill = valence1)) +
  geom_bar(stat = "identity",
           colour = "black",
           alpha = 0.618) +
  geom_hline(yintercept = mTotal,
             linetype = "dashed",
             colour = "red") + 
  annotate("text", x = 19, y = mTotal + 50,
           label = "Problem Period") + 
  xlab("Date") + 
  ylab("Ambulance …
Run Code Online (Sandbox Code Playgroud)

plot r ggplot2

17
推荐指数
2
解决办法
3万
查看次数

获得两个计数,然后将它们分开

我试图获得两个计数,然后将这两个计数除以得到我计算的项目的比率.我在这里看到这篇文章并尝试过.我的结果中出现错误,没有错误消息只是错误的数字.我正在使用SQL-Server 2008

这是我的代码:

-- INTERNAL PEPPER REPORT
--#####################################################################

-- VARIABLE DECLARATION AND INITIALIZATION
DECLARE @SD DATETIME
DECLARE @ED DATETIME

SET @SD = '2013-01-01'
SET @ED = '2013-03-31'

-- TABLE DECLARATION ##################################################
DECLARE @TABLE1 TABLE(NUMERATOR INT, DENOMINATOR INT, RATIO INT)
--#####################################################################

-- WHAT GETS INSERTED INTO TABLE 1
INSERT INTO @TABLE1
SELECT
A.NUM, A.DENOM, A.NUM/A.DENOM 

FROM
(
-- COLUMN SELECTION. TWO NUMBERS WILL REPRESENT A NUM AND A DENOM
SELECT 
    (SELECT COUNT(DRG_NO)
        FROM smsdss.BMH_PLM_PtAcct_V
        WHERE drg_no IN (061,062,063,064,065,066)
        AND …
Run Code Online (Sandbox Code Playgroud)

sql sql-server-2008

10
推荐指数
1
解决办法
3万
查看次数

向量化 sapply 函数

我正在尝试对以下函数进行矢量化以删除 sapply 循环。我正在计算累积偏度。

cskewness <- function(.x) {
  skewness <- function(.x) {
    sqrt(length(.x)) * sum((.x - mean(.x))^3) / (sum((.x - mean(.x))^2)^(3 / 2))
  }
  sapply(seq_along(.x), function(k, z) skewness(z[1:k]), z = .x)
}
Run Code Online (Sandbox Code Playgroud)

我的代数没搞对。有这个是错误的:

skewness2 <- function(.x) {
  n <- length(.x)
  csum <- cumsum(.x)
  cmu <- csum / 1:length(.x)
  num <- cumsum(.x - cmu)^3
  den <- cumsum((.x - cmu)^2)^(3/2)
  sqrt(n) * num / den
}
Run Code Online (Sandbox Code Playgroud)

正确的代码会产生:

x <- c(1,2,4,5,8)

> cskewness(x)
[1]       NaN 0.0000000 0.3818018 0.0000000 0.4082483
> skewness2(x)
[1]      NaN 1.000000 …
Run Code Online (Sandbox Code Playgroud)

performance r vectorization

10
推荐指数
2
解决办法
238
查看次数

T-SQL中的IF,ELIF,ELSE

我在SQL Server 2008中工作并尝试IF, ELIF, ELSESELECT我的代码部分中使用语句.我想做的是以下内容:

IF BO.VALUE < BO.REFERENCELOWERLIMIT
    THEN (BO.VALUE - BO.REFERENCELOWERLIMIT) #I WANT THIS TO BE NEGATIVE
ELSE IF BO.REFERENCELOWERLIMIT <= BO.VALUE <= BO.REFERENCEUPPERLIMIT
    THEN BO.VALUE
ELSE
    (BO.REFERENCEUPPERLIMIT - BO.VALUE)
Run Code Online (Sandbox Code Playgroud)

问题是我不明白如何在SQL中执行IF,ELIF,ELSE类型的事务.我试图搜索这种类型的示例并遇到python示例...错误的语言所以我在MSDBN网站上进行了搜索,并没有看到这种工作,只是IF/ELSE.

谢谢

t-sql sql-server-2008

9
推荐指数
2
解决办法
6万
查看次数

将多个变量传递给ggtitle R.

我已经做了一些我想传递的变量ggtitle.这是我做的变量

ip_case_index <- paste("IP Only Case Index =",
                       round(mean(mdc5ip$case_index), digits = 2)
)
oa_case_index <- paste("OA Case Index",round(mean(edata$Std_Pmt_All_Clm / 
                                 edata$Pred_Amt_Renormal),
                            digits = 2)
)
sn_case_index <- paste("IP and SNF Only"
                       ,round(mean(mdc5sn$case_index), digits = 2)
)
Run Code Online (Sandbox Code Playgroud)

我想做点什么

ggtitle(ip_case_index, oa_case_index, sn_case_index)
Run Code Online (Sandbox Code Playgroud)

这当然不会返回所需的标题格式.我希望它在标题中显示的是这个

ip_case_index
oa_case_index
sn_case_index
Run Code Online (Sandbox Code Playgroud)

每个变量都在它自己的标题行上.我尝试使用\n添加新行无济于事,我尝试使用atop,这使得每个连续的行变小,因此难以看到,因为它将每个变量视为副标题,因此标题字幕副标题.

我已经使用多个也尝试过paste()的内部参数ggtitle,通过使用c(paste(), paste(), paste()),它返回第一可变.

我也尝试过以下方法:

plot.title = c(ip_case_index, oa_case_index, sn_case_index)
ggtitle(plot.title)
Run Code Online (Sandbox Code Playgroud)

这也只给了第一个.

所以我对如何从这里开始感到困惑.

任何帮助深表感谢.谢谢,

r ggplot2

7
推荐指数
1
解决办法
9822
查看次数

Excel 中的行号和分区

我在Excel中有数据,例如:

ID        | Fee
123456789 | 100
987654321 | 100
987654321 | 75
987654321 | 50
Run Code Online (Sandbox Code Playgroud)

我需要计算非最高价格的商品的费用减免。电子表格按 ID 排序,然后按所需的方式按费用排序。我不知道该怎么做是在 excel 中使用类似的 row_number() over(partition by) ,就像我通常在 SQL 中所做的那样

期望的输出是

ID        | Fee   | rn
123456789 | 100   | 1
987654321 | 100   | 1
987654321 | 75    | 2
987654321 | 50    | 3
Run Code Online (Sandbox Code Playgroud)

excel

5
推荐指数
3
解决办法
4万
查看次数

将函数和参数传递给函数并 purrr

假设我有以下功能:

\n
new_func <- function(.data, .x, .fns, ...){\n  \n  # Arguments\n  value_var_expr <- rlang::enquo(.x)\n  func <- .fns\n  func_chr <- deparse(substitute(.fns))\n  passed_args <- list(...)\n  \n  # New Param Args ----\n  # I do this because na.rm = TRUE when passed to say quantile gets\n  # converted to 1 or 100%\n  if ("na.rm" %in% names(passed_args)) {\n    tmp_args <- passed_args[!names(passed_args) == "na.rm"]\n  }\n  \n  if (!exists("tmp_args")) {\n    args <- passed_args\n  } else {\n    args <- tmp_args\n  }\n  \n  ret <- purrr::map(\n    .x = …
Run Code Online (Sandbox Code Playgroud)

r purrr

5
推荐指数
1
解决办法
123
查看次数

为什么此功能会导致最大重复错误?

我在使用codecademy.com时在python中有一个非常简单的函数.代码通过了练习,但它确实导致了最大的递归错误,我不明白为什么.这就是我所拥有的:

n = [3, 5, 7]

def double_list(x):
    for i in range(0, len(x)):
        x[i] = x[i] * 2
    return double_list(x)

print double_list(n)
Run Code Online (Sandbox Code Playgroud)

python python-2.7

4
推荐指数
1
解决办法
179
查看次数