我正在构建一个分类器文本.
1,有10个类别,每个类别都有更多的相对关键词.2,现在,我有一个文字.我需要将它分类为一个类别3,我使用NLTK但我不知道如何创建最佳的火车语料库,语料库
有人可以用提取功能的方法来帮助我,... tks u
例:
string1="ah ah I love you ah ah ah ah";
Run Code Online (Sandbox Code Playgroud)
更换后:
string1="ah ah I love you ah thank you ah ah";
Run Code Online (Sandbox Code Playgroud)
以上表示'啊'在第四位置应该被'谢谢'取代
我不知道如何通过PHP编写上面的任务.你能帮助我吗?