小编Sha*_*ane的帖子

使用perl或python将阿拉伯字符"ا"替换为一个单词中的"a",但将"ә"替换为另一个单词

我需要将纯文本UTF8文档从R语言更改为L语言到拉丁语言.不幸的是,它并不像角色字符音译那么容易.
例如,取决于单词构成,R到L语言(ا)中的"a"可以是"a"或"ә".

在使用ag,k,e或hamza(گ,ك,ە,ء)的单词中,
我需要将所有a,o,i,u(ا,و,ى,ۇ)更改为拉丁语ә,ѳ,i, ü(称为"软"元音).
例如.سالەم成为sәlêm,ءۇي变成üy,سوزمەن成为sѳzmên

在没有ag,k,e或hamza(گ,ك,ە,ء)
的单词中,a,o,i,u变为拉丁字符a,o,i,u(称为"硬"元音).
例如.الما成为alma,becomes成为ul,ورتا成为orta.

实质上,
g,k,e或hamza充当阿拉伯语脚本中的发音指南.
在拉丁语中,我需要两组不同的元音,具体取决于阿拉伯语脚本中的原始单词.

我想我可能需要将"软"元音词作为第一步,然后对文档的其余部分进行单独的查找和替换.但是,如何使用perl或python进行这样的查找和替换呢?

这是一个unicode示例:\ U + 0633\U + 0627\U + 0644\U + 06D5\U + 0645\U + 0648\U + 0631\U + 062A\U + 0627\U + 0674\U + 06C7\U + 064A\U + 0633\U + 0648\U + 0632\U + 0645\U + 06D5\U + 0645\U + 0627\U + 0644\U + 0645\U + 0627\U + 06C7\U +0644\U + 0645\U + 06D5\U + 0646\U + 0649\U + 06AD\U + 0627\U + 062A\U + 0649\U + 0645\U …

python regex perl arabic

9
推荐指数
1
解决办法
1692
查看次数

标签 统计

arabic ×1

perl ×1

python ×1

regex ×1