小编Che*_*ikh的帖子

朴素贝叶斯多项式NB scikit-learn/sklearn

我正在构建一个朴素贝叶斯分类器，并按照 scikit-learn 网站上的教程进行操作。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import time
import csv
import string
from sklearn.cross_validation import train_test_split
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB

# Importing dataset
data = pd.read_csv("test.csv", quotechar='"', delimiter=',',quoting=csv.QUOTE_ALL, skipinitialspace=True,error_bad_lines=False)
df2 = data.set_index("name", drop = False)



df2['sentiment'] = df2['rating'].apply(lambda rating : +1 if rating > 3 else -1)


train, test = train_test_split(df2, test_size=0.2)


count_vect = CountVectorizer()
X_train_counts = count_vect.fit_transform(traintrain['review'])
test_matrix = count_vect.transform(testrain['review'])

clf = MultinomialNB().fit(X_train_tfidf, train['sentiment'])

Run Code Online (Sandbox Code Playgroud)

第一个参数是词汇字典，它返回一个 Document-Term …

python machine-learning python-3.x pandas scikit-learn

Che*_*ikh

2018 05-25

3
推荐指数

1
解决办法

4551
查看次数

如何在Perl中检测表情符号作为unicode？

我有一个文本文件,其中包含表情符号,☹️,,,,,,,的表情符号unicode caracter.

例如,代码\ N {1F60D}对应于我使用推荐,如https://perldoc.perl.org/perluniintro.html部分创建Unicode.我的程序必须检测它们并做一些治疗,但如果我使用

open(FIC1, ">$fic");

while (<FIC>) {
my $ligne=$_;

if( $ligne=~/\N{1F60D}/  )
{print "heart ";
    }
}

Run Code Online (Sandbox Code Playgroud)

现在我这样做,它的工作

open(FIC1, ">$fic");

while (<FIC>) {
my $ligne=$_;

if( $ligne=~//  )
{print "Heart ";
    }
}

Run Code Online (Sandbox Code Playgroud)

第一个代码问候有什么问题

unicode perl emoji

Che*_*ikh

lucky-day

2
推荐指数

2
解决办法

791
查看次数

标签统计

emoji ×1

machine-learning ×1

pandas ×1

perl ×1

python ×1

python-3.x ×1

scikit-learn ×1

unicode ×1

朴素贝叶斯多项式NB scikit-learn/sklearn

如何在Perl中检测表情符号作为unicode？

标签 统计

小编Che_ikh的帖子

标签统计