快速的问题令我感到困惑.我安装了NLTK,并且工作正常.然而,我试图得到一个语料库的bigrams并且想要基本上使用bigrams(语料库)..但它说当我从"nltk import bigrams"时我没有定义bigrams
与三元组相同.我错过了什么吗?另外,我怎么能手动从语料库中获取bigrams.
我也在计算bigrams三卦和四边形的频率,但我不确定如何解决这个问题.
我将语料库标记为"<s>"并且"</s>"在开头和结尾都适当.到目前为止的计划:
#!/usr/bin/env python
import re
import nltk
import nltk.corpus as corpus
import tokenize
from nltk.corpus import brown
def alter_list(row):
if row[-1] == '.':
row[-1] = '</s>'
else:
row.append('</s>')
return ['<s>'] + row
news = corpus.brown.sents(categories = 'editorial')
print len(news),'\n'
x = len(news)
for row in news[:x]:
print(alter_list(row))
Run Code Online (Sandbox Code Playgroud) 所以我在这里的程序将编译但是如果我创建一个类对象它会立即崩溃.我的意思是,在我的main.cpp中,如果我创建说"AVLTree obj;" 程序崩溃......如果我把它留下来,那么一切都很好......任何帮助都将不胜感激.
谢谢.//主要在下面
using namespace std;
int main()
{
cout << "******************************" << endl;
cout << " Self Balancing AVL Tree " << endl;
cout << "******************************" << endl;
/** AVLtree obj;
obj.insert(100);
obj.insert(20);
obj.insert(25);
obj.insert(200);
assert isEmpty();
obj.preOrderPrint(*root);
obj.inOrderPint(*root);
obj.postOrderPrint(*root);
obj.remove(20);
*/
return 0;
}
Run Code Online (Sandbox Code Playgroud)
HEADER
#ifndef AVLTREE_H
#define AVLTREE_H
//Moved this outside of the class trying to get things running
struct TreeNode
{
int key;
int data;
TreeNode *parent;
TreeNode *right;
TreeNode *left;
char factor; //byte
}; …Run Code Online (Sandbox Code Playgroud)