我正在寻找一个类或方法,它需要长达100多个单词和标记的字符串,删除用于IR系统的停用词和词干.
例如:
"那只肥胖的大猫,'我知道'你最有趣的家伙'给袋鼠......"
标记器将删除标点符号并返回ArrayList
单词
停用词删除器会删除"the","to"等字样
词干将减少每个词的"根",例如"最有趣"会变得有趣
提前谢谢了.
我正在寻找一种能够准确地将两种颜色之间的距离表示为数字或类似物的功能.
例如,我希望有一个HEX值或RGB数组的数组,我想在给定颜色的数组中找到最相似的颜色
例如.我传递一个RGB值的函数,并返回数组中"最接近"的颜色
有谁知道从文本正文中仅提取名词的最简单方法?
我听说过TreeTagger工具,我试过试一试,但由于某些原因无法让它工作.
有什么建议?
谢谢菲尔
编辑:
import org.annolab.tt4j.*; TreeTaggerWrapper tt = new TreeTaggerWrapper(); try { tt.setModel("/Nouns/english.par"); tt.setHandler(new TokenHandler() { void token(String token, String pos, String lemma) { System.out.println(token+"\t"+pos+"\t"+lemma); } }); tt.process(words); // words = list of words } finally { tt.destroy(); }
那是我的代码,英语是语言.我收到错误:新类型TokenHandler(){}必须实现继承的抽象方法TokenHandler.token.难道我做错了什么?
我不确定我是否正在寻找合适的地方,但基本上我正在寻找最佳方式的建议:
通过网站上的麦克风录制音频,并将音频作为Wav或MP3文件上传到服务器
有没有人对闪存有丰富的经验,难以做到这一点,目前市场上有什么东西吗?
我正在考虑将其称为Java applet,但我发现java applet abit很烦人使用,abit 1998!是否有任何工具可以做到这一点或任何人有任何指南或其他任何东西
任何建议表示赞赏
谢谢菲尔
我很不高兴不得不问这个,但我不能让它工作.目前我有一个项目:
5个src /文件夹中的类
2 JARS在根文件夹中命名为profiles.jar和classifier.jar
我想创建一个"makefile?" 还是"批处理文件?" 从WINDOWS命令行编译和运行这些类,但首先将jar添加到buildpath?我不知道我是怎么回事
当我尝试这样做时,它表示找不到类,很可能是因为我没有正确地将jar添加到构建路径中.在命令提示符下运行此命令需要使用哪些命令?
谢谢Philip
编辑
感谢您的帮助,我有很多麻烦让它工作当前我有一个项目在src文件夹中有5个类,在jar文件夹中有2个jar
以下是我正在运行的命令:
设置CLASSPATH = C:\ wamp\www \news\UserProfiling\jars\classifier.jar; C:\ wamp\www \news\UserProfiling\jars\profiles.jar
然后从根文件夹,我运行:
javac src/*.java
然后:
java -cp ./src:./jars/*src/Interaction
交互是主要的类,我得到各种noclassfound错误,我做错了什么?非常感谢菲利普
错误
java -cp ./src:./jars/*交互线程"main"中的异常java.lang.NoClassDefFoundError:交互引起:java.lang.ClassNotFoundException:java.net.URLClassLoader $ 1.run(未知来源)处的交互java.security.AccessController.doPrivileged(本机方法),位于java.lang.ClassLoader.findClass(未知来源),位于sun.misc.Launcher的$ java.lang.ClassLoader.loadClass(未知来源)$ AppClassLoader.loadClass(未知来源)at java.lang.ClassLoader.loadClassInternal(Unknown Source)中的java.lang.ClassLoader.loadClass(Unknown Source)无法找到主类:Interaction.程序将会退出.
有没有人知道一个可用的PHP函数需要一段文本,比如说几百个字长并产生一系列关键字?IE浏览器.最重要的,经常出现的独特术语?
谢谢Philip