小编Mic*_*ley的帖子

反向补体DNA

我有这个方程式反向补充python中的DNA:

def complement(s): 
    basecomplement = {'A': 'T', 'C': 'G', 'G': 'C', 'T': 'A'} 
    letters = list(s) 
    letters = [basecomplement[base] for base in letters] 
    return ''.join(letters)
def revcom(s):
    complement(s[::-1])
print("ACGTAAA")
print(complement("ACGTAAA"[::-1]))
print(revcom("ACGTAAA"))

Run Code Online (Sandbox Code Playgroud)

但是线条:

print(complement("ACGTAAA"[::-1]))
print(revcom("ACGTAAA"))

Run Code Online (Sandbox Code Playgroud)

彼此不相等.只有顶线给出答案.底部只打印"无"

任何帮助为什么这是？

python bioinformatics dna-sequence

Mic*_*ley

2013 10-24

5
推荐指数

2
解决办法

9013
查看次数

使用lapply过滤多个数据集

我试图从数据帧中筛选出行,并将生成的较短数据帧写入新文件.我可以开始处理单个文件,但尝试使用lappy在多个文件上运行此过程(并为输出文件指定不同的名称)证明是麻烦的.

我试图根据"aaSeqCDR3"中的值是否包含"_"或"*"过滤掉行

到目前为止我有:

productseq <-function(x){
#establish filter criteria
filter <- c("\\*", "_")
#Filter data set to new variable
df2 <- df[!grepl(paste(filter, collapse = "|"), df$aaSeqCDR3),]
write.delim(df2, "df2.txt", sep= " ")}

Run Code Online (Sandbox Code Playgroud)

但是尝试将其应用于包含多个数据框名称(名称)的向量

nameproduct <- lapply(names, productiveseq)

Run Code Online (Sandbox Code Playgroud)

我收到错误:

UseMethod("filter_")中的错误:没有适用于"filter_"的方法应用于类"character"的对象

我此刻非常迷失,并会欣赏任何见解.

下面是一个示例数据框:

ID  allDHitsWithScore   allJHitsWithScore   allCHitsWithScore   aaSeqCDR3
0   290 0.031402274 TGTGCCAGCGGCAGCCCCAATTCACCCCTCCACTTT    CASGSPNSPLHF
1   168 0.018191662 TGTGCTCTGAGTGATCAGAATAAGGGCAGGAGAGCACTTACTTTT   CALSDQNKGRRALTF
2   49  0.005305902 TGTGCAGTCTCCAAAGCTGCAGGCAACAAGCTAACTTTT CAVSKAAGNKLTF
3   16  0.001732539 TGCAGTGCTAGAGGGCGCTTAGCCAAAAACATTCAGTACTTC  CSARGRLAKNIQYF
4   15  0.001624256 TGTGCCTGAAGGAATGCAGGCAAATCAACCTTT   CA*RNAGKSTF
5   14  0.001515972 TGCAGTGCTAGAGTTGGACAGGGAGGGTTCTTC   CSARVGQGGFF
6   13  0.001407688 TGTGCCAGCAGTTACTTGGGACAGGGGGGAAACATTCAGTACTTC   CASSYLGQGGNIQYF
7 …

Run Code Online (Sandbox Code Playgroud)

filtering r lapply

Mic*_*ley

lucky-day

0
推荐指数

1
解决办法

272
查看次数