Seb*_*ian 28 algorithm open-source cjk text-segmentation
正如问题中的措辞,我正在寻找一个免费的和/或开源的中文文本分割算法,我确实理解这是一个非常难以解决的任务,因为有很多歧义.我知道有谷歌的API,但它确实是一个黑盒子,即没有太多关于它正在做什么的信息正在通过.
lsc*_*hin 30
关键字text-segmentation for Chinese应该是????中文.
良好而活跃的开源文本分割算法:
C#,SnapshotJavaC/C++, Java, C#,DemoC, PHP, PostgreSQL ICTCLAS,DemoJavaJava,DemoPython, Java,Demopython 其他
样品
谷歌浏览器(铬):src,cc_cedict.txt (73,145 Chinese words/pharases)
在text field或textarea的谷歌浏览器与中国的句子,按
Ctrl+ ←或Ctrl+→
Double click 上 ?????????????????????????