如何为用户提供的国家/地区名称预测正确的国家名称

Ang*_*Leo 6 java nlp text-mining string-matching opennlp

我打算对我的数据进行一些数据调整.

情况 - 我有一个有字段的数据country.它包含用户输入的国家/地区名称(可能包含拼写错误或同一国家/地区的不同国家/地区名称,例如美国/美国/美国).我有一个正确的国家/地区名称列表.

我想要的 - 预测它指的是哪个最近的国家.例如 - 如果U.S.给出,那么它将更改为USA(在我们的列表中更正国家名称).

我有什么方法可以使用Java或opennlp或任何其他方法吗?

iNi*_*kkz 3

您可以使用盖蒂API。它将为您提供国家/地区名称的缩写。只需使用这个 API 即可。

或者

您还可以使用编辑距离来获取最接近的国家/地区名称。

试试这个。会帮助你。