朋友们,
我正在分析一些文本.我的要求是对用不同母语的英文字母书写的地址进行地理编码.
Ex: chandpur market ke paas, village gorthaniya, UP, INDIA
Run Code Online (Sandbox Code Playgroud)
在上面的句子中,"ke paas" - >是一个HINDI词(印度民族语言),在英语中意为"近",而"chandapur market"是一个名词(可以忽略转换)
现在我的挑战是将成千上万的单词转换为英语并识别街道名称和地理代码.不幸的是,我没有邮政编码或确切的地址.
你能帮忙吗?
提前致谢 !!
我的数据如下所示,
df=data.frame("X1" = c(1, 0, 0), "X2" = c(0, 0, 1), "X3" = c(0, 1, 0),
"T1" = c(21, 20, 15), "T2" = c(35, 16, 19), "T3" = c(22, 32, 16))
X1 X2 X3 T1 T2 T3
1 0 0 **21** 35 22
0 0 1 20 16 **32**
0 1 0 15 **19** 16
Run Code Online (Sandbox Code Playgroud)
我期待产量如下
X1 X2 X3 T
1 0 0 21
0 0 1 32
0 1 0 19
Run Code Online (Sandbox Code Playgroud)
如您所见,从T1,T2和T3仅根据X1,X2和X3中的布尔值选择这些值.
我用for循环写了一个愚蠢的代码,寻找最好的方法..