Iam*_*MAN 1 nlp cross-language
在我的网络应用程序中,我使用两种不同的语言,即英语和阿拉伯语.
我有一个搜索框,在我的web应用程序中,如果我们通过名称或名称的一部分进行搜索,那么它会通过比较检索DB值"故乡"的用户
说明:
就像如果一个用户属于故乡"加州",他搜索一个名字说"维克多"然后我的查询将首先看到谁是具有人一样的故乡"加利福尼亚",并在人的名单谁拥有"加州"为家乡将搜索"Victor"*name*,并检索将"California"作为其家乡的用户以及名称或部分名称中的" victor ".
该问题是,如果家乡"加利福尼亚"被保存在英国会比较和检索值.但"加利福尼亚"将用阿拉伯语保存为"كاليفورنيا".在这种情况下,家乡比较失败,它无法检索值.
我希望我的查询应该找到两个相同的家乡并检索值.可能吗?
对于这种比较逻辑,我应该考虑什么样的替代方案.我很迷惑.有什么建议吗?
编辑: *我有一个想法,如果有家乡,那么可以使用谷歌翻译或音译,并将家乡改为另一种语言.如果是英语,那么阿拉伯语或者如果是英语,那么阿拉伯语,并给搜索结果加入两者.有什么建议吗?*
您遇到的问题是您希望/需要2种或更多语言的信息,并且您希望应用程序的用户能够使用这两种语言.一种可能的方法是为每个项目保留多个记录,并将语言代码作为主键的一部分,例如,如果您的记录是
id hometown name
001 California Victor
Run Code Online (Sandbox Code Playgroud)
你可以介绍语言代码和商店
id lang hometown name
001 en California Victor
001 ar ?????????? Victor
Run Code Online (Sandbox Code Playgroud)
然后你的搜索将匹配"加利福尼亚"或"كاليفورنيا"给你id 001,然后你可以使用它来加载你的数据的所有翻译(或只是当前输出语言的数据.)这个sceme可以用于任何语言数量,并且具有额外的优势,您无需预填表.您可以在记录成为已知时添加新的翻译.
(警告:我只是重复了你的阿拉伯语字符串,我无法阅读它,也'ar'很可能不是正确的语言代码,但你明白了.)