拉丁变形:

caw*_*caw 7 parsing latin inflection

我不知道这里是否有人能说(或写)拉丁文的"死语".但也许你甚至可以在不懂这种语言的情况下帮助我......

我有一个单词数据库(包括名词和动词).现在我想生成那些名词和动词的所有不同(变形)形式.这样做的最佳策略是什么?

拉丁语是一种高度变化的语言,有:

a)名词的变形

b)动词的结合

有关动词的共轭("mandare")的示例,请参阅此翻译页面:共轭

我不想手动输入所有这些单词的形式.那么如何自动生成它们呢?什么是最好的方法?

  • 如何反映所有单词的复杂规则列表
  • 贝叶斯方法
  • ...

非常感谢你提前!

编辑(可能的解决方案?):

我现在发现有一个名为"威廉·惠特克的话"的节目.它也会为拉丁语单词创建变形,所以它正是我想要做的事情.

维基百科称该程序的工作原理如下:"单词使用一组基于自然前置,入内和后缀,变换和共轭的规则来确定进入的可能性.这种分析结构的方法的结果言语,不能保证这些词语曾被用于拉丁文学或言语,即使该程序找到了某个词的可能含义."

该程序的来源也可在此处获得.但我真的不明白这是如何工作的.你能帮助我吗?也许这将是我的问题的解决方案......

Cha*_*net 5

你可以做类似于hunspell字典格式的东西(参见http://www.manpagez.com/man/4/hunspell/)

您定义了2个表.一个包含单词的根(永不改变的部分),另一个包含给定类的修改.对于给定的类,对于每个变量(或共轭),它告诉在根的结尾(或开头)添加哪些字符.它甚至可以指定替换给定数量的字符.现在,为了得到一个特定的变元,你取根,从它所属的类中应用变换,然后vo!

例如,对于mandare,根将是mand,并且类将包含诸如o,as,ate,amous,atis等后缀,用于有效指示性存在.