相关疑难解决方法(0)

Java文本分类问题

我有一组Books对象,类Book定义如下:

Class Book{

String title;
ArrayList<tags> taglist;

}
Run Code Online (Sandbox Code Playgroud)

标题是本书的标题,例如:使用Javascript傻瓜.

taglist是我们示例的标签列表:Javascript,jquery,"web dev",..

正如我所说,有一套书谈论不同的东西:IT,生物,历史......每本书都有一个标题和一组描述它的标签.

我必须按主题自动将这些书分类为分开的集合,例如:

IT书籍:

  • Java for dummies
  • Javascript for dummies
  • 在30天内学习闪光灯
  • C++编程

历史书:

  • 世界大战
  • 美国在1960年
  • 马丁路德金的一生

生物学书籍:

  • ....

你们知道一种分类算法/方法来申请这类问题吗?

解决方案是使用外部API来定义文本的类别,但问题在于书籍使用不同的语言:法语,西班牙语,英语.

java text-processing nlp classification machine-learning

11
推荐指数
1
解决办法
1万
查看次数