小编Ang*_*Leo的帖子

如何为用户提供的国家/地区名称预测正确的国家名称

我打算对我的数据进行一些数据调整.

情况 - 我有一个有字段的数据country.它包含用户输入的国家/地区名称(可能包含拼写错误或同一国家/地区的不同国家/地区名称,例如美国/美国/美国).我有一个正确的国家/地区名称列表.

我想要的 - 预测它指的是哪个最近的国家.例如 - 如果U.S.给出,那么它将更改为USA(在我们的列表中更正国家名称).

我有什么方法可以使用Java或opennlp或任何其他方法吗？

java nlp text-mining string-matching opennlp

Ang*_*Leo

2016 02-06

6
推荐指数

1
解决办法

299
查看次数

决策树中特定类别的Sklearn决策规则

我正在创建决策树，我的数据属于以下类型

X1 |X2 |X3|.....X50|Y
_____________________________________
1  |5  |7 |.....0  |1
1.5|34 |81|.....0  |1
4  |21 |21|.... 1  |0
65 |34 |23|.....1  |1

Run Code Online (Sandbox Code Playgroud)

我正在尝试执行以下代码：

X_train = data.iloc[:,0:51]
Y_train = data.iloc[:,51]
clf = DecisionTreeClassifier(criterion = "entropy", random_state = 100,
                           max_depth=8, min_samples_leaf=15)
clf.fit(X_train, y_train)

Run Code Online (Sandbox Code Playgroud)

我想要的是可以预测特定类别的决策规则（在这种情况下为“ 0”）。例如，

when X1 > 4 && X5> 78 && X50 =100 Then Y = 0 ( Probability =84%)
When X4 = 56 && X39 < 100 Then Y = 0 ( Probability = 93%)
...

Run Code Online (Sandbox Code Playgroud)

因此，基本上我希望所有叶子节点，附加的决策规则以及Y = 0的概率到来，从而预测Class …

python machine-learning decision-tree python-3.x scikit-learn

Ang*_*Leo

lucky-day

6
推荐指数

1
解决办法

714
查看次数

标签统计

decision-tree ×1

java ×1

machine-learning ×1

nlp ×1

opennlp ×1

python ×1

python-3.x ×1

scikit-learn ×1

string-matching ×1

text-mining ×1

如何为用户提供的国家/地区名称预测正确的国家名称

决策树中特定类别的Sklearn决策规则

标签 统计

小编Ang_Leo的帖子

标签统计