小编use*_*472的帖子

如何删除标点符号?

在Python中使用NLTK的tokenizer .

已经在论坛上删除了标点符号的大量答案.但是,它们都没有一起解决所有以下问题:

  1. 连续多个符号.例如,句子:他说,"就是这样." 因为有一个逗号后跟引号,所以标记器不会删除."在标题中.标记器将给出''他','说',','','',','s','它. '而不是['他','说','那','s','它'].其他一些例子包括'...',' - ','!?',',''等等.
  2. 删除句子末尾的符号.即句子:Hello World.标记器将给出['Hello','World.']而不是['Hello','World'].请注意"世界"一词末尾的句号.其他一些例子包括任何字符的开头,中间或末尾的' - ',','.
  3. 删除前面和后面带符号的字符.即'*u*', '''','""'

有一种解决这两个问题的优雅方式吗?

python nlp nltk

7
推荐指数
2
解决办法
2万
查看次数

如何将interface {}转换为[] int?

我用Go编程语言编程.

假设有一个interface{}包含整数数组的变量.我如何转换interface{}[]int

我试过了

interface_variable.([]int)
Run Code Online (Sandbox Code Playgroud)

我得到的错误是:

panic: interface conversion: interface is []interface {}, not []int
Run Code Online (Sandbox Code Playgroud)

go

7
推荐指数
1
解决办法
6218
查看次数

运行ssh时更改oh-my-zsh主题

我在iterm2上安装了Oh-my-zsh.每当运行ssh时,如何使终端更改主题?如果脚本还将背景更改为导入的其中一个预设,那将是很好的.

我是一个完整的bash菜鸟.请用新手语言解释.

terminal zsh iterm2 oh-my-zsh

7
推荐指数
2
解决办法
6158
查看次数

LookupError:找不到资源'corpora/stopwords'

我正在尝试使用Flask在Heroku上运行webapp.webapp使用NLTK(自然语言工具包库)在Python中编程.

其中一个文件有以下标题:

import nltk, json, operator
from nltk.corpus import stopwords 
from nltk.tokenize import RegexpTokenizer 
Run Code Online (Sandbox Code Playgroud)

当调用带有停用词代码的网页时,会产生以下错误:

LookupError: 
**********************************************************************
  Resource 'corpora/stopwords' not found.  Please use the NLTK  
  Downloader to obtain the resource:  >>> nltk.download()  
  Searched in:  
    - '/app/nltk_data'  
    - '/usr/share/nltk_data'  
    - '/usr/local/share/nltk_data'  
    - '/usr/lib/nltk_data'  
    - '/usr/local/lib/nltk_data'  
**********************************************************************
Run Code Online (Sandbox Code Playgroud)

使用的确切代码:

#remove punctuation  
toker = RegexpTokenizer(r'((?<=[^\w\s])\w(?=[^\w\s])|(\W))+', gaps=True) 
data = toker.tokenize(data)  

#remove stop words and digits 
stopword = stopwords.words('english')  
data = [w for w in data if w not in stopword and not w.isdigit()]  
Run Code Online (Sandbox Code Playgroud)

Heroku上的webapp在stopword …

python heroku nltk flask python-2.7

3
推荐指数
2
解决办法
6514
查看次数

Golang:HTTP页面自动刷新

我有一个使用 Go 编程语言执行的 HTTP 页面。GO 中的函数如下所示:

func main(){
    ...
    http.HandleFunc("/Page", func(w http.ResponseWriter, r *http.Request) {
        t:=template.New("New template")
        child_template := t.New("New child template")
        _, _ = child_template.Parse(output)  // output is from the omitted code
        t, err = t.ParseFiles("HTML_template.html")
        _ = t.ExecuteTemplate(w, "HTML_template.html", output)
    }
}
Run Code Online (Sandbox Code Playgroud)

如何让 /Page 自行刷新?我已经尝试过以下方法,但它不起作用。

func main(){
    ...
    http.HandleFunc("/Page", func(w http.ResponseWriter, r *http.Request) {
        for{
            t:=template.New("New template")
            child_template := t.New("New child template")
            _, _ = child_template.Parse(output)  // output is from the omitted code
            t, err = t.ParseFiles("HTML_template.html")
            _ …
Run Code Online (Sandbox Code Playgroud)

go

1
推荐指数
1
解决办法
9587
查看次数

标签 统计

go ×2

nltk ×2

python ×2

flask ×1

heroku ×1

iterm2 ×1

nlp ×1

oh-my-zsh ×1

python-2.7 ×1

terminal ×1

zsh ×1