小编use*_*202的帖子

Python提取包含单词的句子

我试图从文本中提取包含指定单词的所有句子.

txt="I like to eat apple. Me too. Let's go buy some apples."
txt = "." + txt
re.findall(r"\."+".+"+"apple"+".+"+"\.", txt)
Run Code Online (Sandbox Code Playgroud)

但它正在归还我:

[".I like to eat apple. Me too. Let's go buy some apples."]
Run Code Online (Sandbox Code Playgroud)

代替 :

[".I like to eat apple., "Let's go buy some apples."]
Run Code Online (Sandbox Code Playgroud)

有什么帮助吗?

python regex text-segmentation

12
推荐指数
3
解决办法
2万
查看次数

getURL(来自RCurl包)无法循环工作

我有一个名为URLlist的URL列表,并在其上循环以获取每个URL的源代码:

for (k in 1:length(URLlist)){
    temp = getURL(URLlist[k])
}
Run Code Online (Sandbox Code Playgroud)

问题是一些随机URL,代码卡住了,我得到了错误消息:

Error in function (type, msg, asError = TRUE)  : 
    transfer closed with outstanding read data remaining
Run Code Online (Sandbox Code Playgroud)

但是,当我尝试使用出现问题的URL的getURL函数而不是在循环中时,它可以正常工作。

有什么帮助吗?非常感谢你

r rcurl

5
推荐指数
1
解决办法
2051
查看次数

从列表提取中删除级别到数据框架

我有这样的数据框

    df <- data.frame(letters=letters[1:5], numbers=seq(1:5))
Run Code Online (Sandbox Code Playgroud)

并且假设我想将第一列列为列表

firstColumn <- df[,1]

>  firstColumn[[1]]
[1] a
Levels: a b c d e
Run Code Online (Sandbox Code Playgroud)

Problème是我想要删除级别以获得字符串

有什么帮助吗?

谢谢

r levels dataframe

1
推荐指数
1
解决办法
6252
查看次数

标签 统计

r ×2

dataframe ×1

levels ×1

python ×1

rcurl ×1

regex ×1

text-segmentation ×1