小编Phi*_*hil的帖子

Tokenizer,停止Word删除,用Java编写

我正在寻找一个类或方法,它需要长达100多个单词和标记的字符串,删除用于IR系统的停用词和词干.

例如:

"那只肥胖的大猫,'我知道'你最有趣的家伙'给袋鼠......"

标记器将删除标点符号并返回ArrayList单词

停用词删除器会删除"the","to"等字样

词干将减少每个词的"根",例如"最有趣"会变得有趣

提前谢谢了.

java stemming tokenize stop-words

20
推荐指数
2
解决办法
5万
查看次数

PHP中颜色之间的"距离"

我正在寻找一种能够准确地将两种颜色之间的距离表示为数字或类似物的功能.

例如,我希望有一个HEX值或RGB数组的数组,我想在给定颜色的数组中找到最相似的颜色

例如.我传递一个RGB值的函数,并返回数组中"最接近"的颜色

php colors

13
推荐指数
3
解决办法
1万
查看次数

从文本中提取名词(Java)

有谁知道从文本正文中仅提取名词的最简单方法?

我听说过TreeTagger工具,我试过试一试,但由于某些原因无法让它工作.

有什么建议?

谢谢菲尔

编辑:

 import org.annolab.tt4j.*; 
TreeTaggerWrapper tt = new TreeTaggerWrapper(); 

try { tt.setModel("/Nouns/english.par"); 

tt.setHandler(new TokenHandler() { 
     void token(String token, String pos, String lemma) {    
     System.out.println(token+"\t"+pos+"\t"+lemma); } }); 
     tt.process(words); // words = list of words 

     } finally { tt.destroy(); 
} 

那是我的代码,英语是语言.我收到错误:新类型TokenHandler(){}必须实现继承的抽象方法TokenHandler.token.难道我做错了什么?

java nlp

13
推荐指数
1
解决办法
2万
查看次数

将音频和上传记录为Wav或MP3到服务器

我不确定我是否正在寻找合适的地方,但基本上我正在寻找最佳方式的建议:

通过网站上的麦克风录制音频,并将音频作为Wav或MP3文件上传到服务器

有没有人对闪存有丰富的经验,难以做到这一点,目前市场上有什么东西吗?

我正在考虑将其称为Java applet,但我发现java applet abit很烦人使用,abit 1998!是否有任何工具可以做到这一点或任何人有任何指南或其他任何东西

任何建议表示赞赏

谢谢菲尔

flash audio mp3 record

7
推荐指数
1
解决办法
1万
查看次数

在Windows命令行中将Jar文件添加到Buildpath

我很不高兴不得不问这个,但我不能让它工作.目前我有一个项目:

5个src /文件夹中的类

2 JARS在根文件夹中命名为profiles.jar和classifier.jar

我想创建一个"makefile?" 还是"批处理文件?" 从WINDOWS命令行编译和运行这些类,但首先将jar添加到buildpath?我不知道我是怎么回事

当我尝试这样做时,它表示找不到类,很可能是因为我没有正确地将jar添加到构建路径中.在命令提示符下运行此命令需要使用哪些命令?

谢谢Philip

编辑

感谢您的帮助,我有很多麻烦让它工作当前我有一个项目在src文件夹中有5个类,在jar文件夹中有2个jar

以下是我正在运行的命令:

设置CLASSPATH = C:\ wamp\www \news\UserProfiling\jars\classifier.jar; C:\ wamp\www \news\UserProfiling\jars\profiles.jar

然后从根文件夹,我运行:

javac src/*.java

然后:

java -cp ./src:./jars/*src/Interaction

交互是主要的类,我得到各种noclassfound错误,我做错了什么?非常感谢菲利普

错误

java -cp ./src:./jars/*交互线程"main"中的异常java.lang.NoClassDefFoundError:交互引起:java.lang.ClassNotFoundException:java.net.URLClassLoader $ 1.run(未知来源)处的交互java.security.AccessController.doPrivileged(本机方法),位于java.lang.ClassLoader.findClass(未知来源),位于sun.misc.Launcher的$ java.lang.ClassLoader.loadClass(未知来源)$ AppClassLoader.loadClass(未知来源)at java.lang.ClassLoader.loadClassInternal(Unknown Source)中的java.lang.ClassLoader.loadClass(Unknown Source)无法找到主类:Interaction.程序将会退出.

java command-line makefile compilation

4
推荐指数
1
解决办法
1万
查看次数

字符串的关键字

有没有人知道一个可用的PHP函数需要一段文本,比如说几百个字长并产生一系列关键字?IE浏览器.最重要的,经常出现的独特术语?

谢谢Philip

php text keyword

2
推荐指数
1
解决办法
505
查看次数