小编oax*_*att的帖子

在R/RStudio中清除启动屏幕

我想改变我第一次打开R或实际Rstudio时获得的启动/登录屏幕.我想要的只是' > '提示而没有别的.

我知道我之前在网上看过这个,但不记得搜索短语是什么.

我应该补充一点,我使用的是Ubuntu Linux 10.04!
有什么建议?

我在RStudio的控制台

r rstudio

13
推荐指数
2
解决办法
1万
查看次数

在Ipython中使用Pylint(Jupyter-Notebook)

我想在使用Jupyter-Notebook时运行Pylint或任何等效项.有没有办法以这种方式安装和运行Pylint?

python pylint python-3.x flake8 jupyter-notebook

13
推荐指数
3
解决办法
3668
查看次数

如何将'Nigitalral Signs-#'作为列标题的一部分?

我试图读入的文件在列标题中有一个"数字符号 - #"(也就是哈希符号).当我使用read.table加载数据时,列被移动,并且哈希符号(或数字符号#)之后的列标题丢失了!

如何将"数字符号"作为列标题的一部分读入,

防爆.标题,作者,标准#,日期,原产国

r

11
推荐指数
1
解决办法
4609
查看次数

可以为自己添加data.frame吗?

我想追加或添加一个data.frame给自己...就像添加一样:

n <- n + t  
Run Code Online (Sandbox Code Playgroud)

我有一个创建data.frame的函数.
我一直在使用:

g <- function(compareA,compareB) {
    for (i in 1:1000) {
        ttr <- t.test(compareA, compareA, var.equal = TRUE)
        tt_pvalues[i] <- ttr$p.value
    }
    name_tag <- paste(nameA, nameB, sep = "_Vs_")

    tt_titles <- data.frame(name_tag, tt_titles) 
    # character vector which I want to add to a list

    ALL_pvalues <- data.frame(tt_pvalues, ALL_pvalues) 
    # adding a numeric vector of values to a larger data.frame
}
Run Code Online (Sandbox Code Playgroud)

cbind更好吗?

r list dataframe

3
推荐指数
1
解决办法
843
查看次数

在Python 2.7中格式化

我有一个列格式问题:

from math import sqrt
n = raw_input("Example Number? ")
n = float(n)
sqaureRootOfN = sqrt(n)

print '-'*50
print ' # of Decimals', '\t', 'New Root', '\t', 'Percent error'
print '-'*50
for a in range(0,10):
    preRoot = float(int(sqaureRootOfN * 10**a))
    newRoot = preRoot/10**a
    percentError = (n - newRoot**2)/n*100
    print ' ', a, '\t\t', newRoot, '\t\t', percentError, '%'
Run Code Online (Sandbox Code Playgroud)

它出来像:

在此输入图像描述

不在同一列!?!

python python-2.7

3
推荐指数
1
解决办法
9566
查看次数

功能令人困惑的错误

我有几个函数,我试图在R(工作室)中实现.我将展示最简单的一个.我试图将名称附加到矢量以供以后用作col.name.

# Initialize
headerA <- vector(mode="character",length=20)
headerA[1]="source";headerA[2]="matches"

# Function - add on new name
h <- function(df, compareA, compareB) {
   new_header <- paste(compareA,"Vs",compareB,sep="_")
   data.frame(df,new_header)
}
# Comparison 1:
compareA <-"AA"
compareB <-"BB"
headers <- (headerA, compareA, compareB)
Run Code Online (Sandbox Code Playgroud)

但我收到这个错误,这是非常令人费解的.我用谷歌搜索了它,但搜索太模糊/广泛.
跑步时我得到:

headers < - (headerA,compareA,compareB)
错误:"headers"中的意外"," - (headerA,"

另一个函数的第二个错误是类似的......

r function

2
推荐指数
1
解决办法
58
查看次数

'x'必须是数字向量:来自data.frame数字的错误

我在文件/表中的两列上运行cor.test.

tmp <- read.table(files_to_test[i], header=TRUE, sep="\t")
## Obtain Columns To Compare ##
colA <-tmp[compareA]
colB <-tmp[compareB]
# sctr = 'spearman cor.test result'
sctr <- cor.test(colA, colB, alternative="two.sided", method="spearman")
Run Code Online (Sandbox Code Playgroud)

但我得到了这个令人困惑的错误......

Error in cor.test.default(colA, colB, alternative = "two.sided", method = "spearman") : 
'x' must be a numeric vector
Run Code Online (Sandbox Code Playgroud)

列中的值是数字但是

is.numeric(colA) = FALSE 
class (colA) = data.frame
Run Code Online (Sandbox Code Playgroud)

我错过了什么?

r dataframe

2
推荐指数
1
解决办法
4万
查看次数

使用Python解析XML

我有几个大的.xml文件.我想解析文件来做几件事.

我只想退出:

  • XML-/title1并将其保存到列表A(例如)
  • XML-/title2并将其保存到列表B.
  • XML-/title3并将其保存到列表C.
  • 等等

使用Python 2.x哪个库最适合导入/使用.我该如何设置?有什么建议?

例如:

 <PubmedArticle>
    <MedlineCitation Owner="NLM" Status="MEDLINE">
        <PMID Version="1">8981971</PMID>
        <Article PubModel="Print">
            <Journal>
                <ISSN IssnType="Print">0002-9297</ISSN>
                <JournalIssue CitedMedium="Print">
                    <Volume>60</Volume>
                    <Issue>1</Issue>
                    <PubDate>
                        <Year>1997</Year>
                        <Month>Jan</Month>
                    </PubDate>
                </JournalIssue>
                <Title>American journal of human genetics</Title>
                <ISOAbbreviation>Am. J. Hum. Genet.</ISOAbbreviation>
            </Journal>
            <ArticleTitle>mtDNA and Y chromosome-specific polymorphisms in modern Ojibwa: implications about the origin of their gene pool.</ArticleTitle>
            <Pagination>
                <MedlinePgn>241-4</MedlinePgn>
            </Pagination>
            <AuthorList CompleteYN="Y">
                <Author ValidYN="Y">
                    <LastName>Scozzari</LastName>
                    <ForeName>R</ForeName>
                    <Initials>R</Initials>
                </Author>
            </AuthorList>
        <MeshHeadingList>
            <MeshHeading>
                <DescriptorName MajorTopicYN="N">Alleles</DescriptorName>
            </MeshHeading>
            <MeshHeading>
                <DescriptorName MajorTopicYN="Y">Y Chromosome</DescriptorName>
            </MeshHeading>
        </MeshHeadingList>
        <OtherID Source="NLM">PMC1712541</OtherID> …
Run Code Online (Sandbox Code Playgroud)

python xml

2
推荐指数
1
解决办法
1811
查看次数

我如何找到所有可能的离散值和出现

鉴于: yi <- c(1,2,4,4,7,7,7,8)

现在从上面的8个单元中抽取4个单元,使用简单的随机抽样进行更换.

我想找到所有(8选4 =)70组合的所有可能的离散值,并且每个离散值的数量都会出现.

例如:
t1 =(1,2,4,4)= 11,只发生一次
t2 ...

r

2
推荐指数
1
解决办法
85
查看次数

使用R,PCA和绘制累积方差时

我正在使用缩放数据集和主成分分析(princomp)与R合作.一切正常,但我想将主要成分的累积%差异绘制成整体.摘要提供此信息,但我还无法访问它.换句话说,我想从pca vs.'component#'得到y ='Cumulative Proportion'.

pca <- princomp(class5_subset_scaled)
summary(pca) # summary provides 

Importance of components:
                          Comp.1     Comp.2 ...
Standard deviation     0.0513980 0.04482971 ...
Proportion of Variance 0.2089728 0.15897513 ...
Cumulative Proportion  0.2089728 0.36794789 ...
Run Code Online (Sandbox Code Playgroud)

但是,当我看到这些名字时,我很困惑......

names(pc)
[1] "sdev" "loadings" "center" "scale" "n.obs" "scores" "call" 
Run Code Online (Sandbox Code Playgroud)

我可以从pca与x ='组件#'绘制y ='累积比例'吗?

plot r pca

2
推荐指数
1
解决办法
368
查看次数

如何使数列升为幂数

我有:

cost = c(2^(-5),2^(-3),2^(-1),2^(1),2^(3),2^(5),2^(7),2^(9),2^(11),2^(13),2^(15))
Run Code Online (Sandbox Code Playgroud)

我想要一个更优雅的命令,例如:

seq(from = 2^(-5), to = 2^(15), by = __)
Run Code Online (Sandbox Code Playgroud)

r sequence seq

2
推荐指数
1
解决办法
48
查看次数

如何使用'sed'打印只有'1'的行

我有一个文件,其中包含有关所有23对染色体(CHROM)的信息.我希望只有染色体1的所有信息写入输出文件.因此,该行的第一个字符仅为"1".

我怎样才能使用sed或(awk?)来做到这一点?

我在下面尝试了这个但是添加了行号以及其他错误...

sed -e = '/^1/' input.vcf > output_CHROM1.vcf
Run Code Online (Sandbox Code Playgroud)

示例文件:

##INFO=<ID=AA,Number=1,Type=String,Description="Ancestral Allele">
#CHROM  POS ID  REF ALT QUAL    FILTER  INFO
1   69224   COSM3677745 A   C   .   .   COSMIC_71;TSA=SNV
2   69230   COSM3677746 A   C   .   .   COSMIC_71;TSA=SNV
23  69230   COSM3677746 A   C   .   .   COSMIC_71;TSA=SNV
Run Code Online (Sandbox Code Playgroud)

bash sed

1
推荐指数
1
解决办法
71
查看次数

标签 统计

r ×8

python ×3

dataframe ×2

bash ×1

flake8 ×1

function ×1

jupyter-notebook ×1

list ×1

pca ×1

plot ×1

pylint ×1

python-2.7 ×1

python-3.x ×1

rstudio ×1

sed ×1

seq ×1

sequence ×1

xml ×1