计算文件中的唯一单词?良好的线性搜索替代?

Jul*_*ues 1 c string algorithm search unique

我正在使用一种天真的方法解决这个问题,我将这些单词放在一个链表中,然后对它进行线性搜索.但它在大文件中花费了太多时间.

我在考虑使用二进制搜索树,但我不知道它是否适用于字符串.还听说过Skip Lists,还没有真正学到它.

而且我还必须使用C语言......

Jam*_*lis 5

您可以将所有单词放入trie中,然后在处理完整个文件后计算单词数.

  • @James:"实施很简单." 只有浪费记​​忆是可以接受的或者只能使用拉丁字母.否则,很快就会发现使用原始位的所有*乐趣*.我认为在C中链接到一些可用的trie实现肯定会有所帮助.至少不要让人们立刻重新发明轮子. (2认同)