我有一个包含1000万个域名的列表,并且希望能够以编程方式将域中的英语单词分开,例如:
getheadphones.com导致"获取耳机"
我知道当我把getheadphones放在谷歌时,我得到"拿耳机",但不知道他们是如何做到这一点的,以及他们怎么知道这不是"拿到手机"
有任何想法吗?最好在php中.
谷歌以其拼写检查器而闻名,它可以做更多的事情来弄清楚你要搜索的内容,但是这个问题已经在这个问题中得到了解决
要获取 OSX 和一些 Linux 机器中的英语单词列表,可以使用以下一个:/usr/share/dict/words,否则你可以从 ( sourceforge )获取一个