我有一个包含100个句子的文本文件.我想编写一个python脚本,它将计算包含100个句子的文本文件中的平均句子长度(以单词表示).谢谢
检测文本(特别是Instagram评论)是非英语的最准确方法是什么?我很乐意使用任何高级语言,例如Python,PHP等.
$ sudo pip2 install guess_language
>>> from guess_language import guessLanguage
>>> guessLanguage('la vita e bella')
'UNKNOWN'
>>> guessLanguage('today is a good day')
'UNKNOWN'
>>> guessLanguage('????????????????(???)')
'ja'
Run Code Online (Sandbox Code Playgroud)
与
$ sudo apt-get install php5.6-mbstring
if(strlen($comment->text) == mb_strlen($comment->text, 'utf-8')) {
echo '- '.$comment->text."\n";
}
Run Code Online (Sandbox Code Playgroud)
我得到许多不是英文的英文字符:例子:
- Khoda be khanevadehashon sabr bede tahamol konan
- Akhey...
- Eshghi
- K
- :-)
- Ey khodaa
- ...
- @samaneaghazamani1990 vaaaaay khoda chejoori payam dadan?
- :(
- Elahiiiii
- May Allah please with …
Run Code Online (Sandbox Code Playgroud) 我想从给定的文本中提取原点和目的地.
例如,
I am travelling from London to New York.
I am flying to Sydney from Singapore.
Run Code Online (Sandbox Code Playgroud)
起源 - >伦敦,新加坡.目的地 - >悉尼,纽约.
NER只提供位置名称,但无法获取原点和目的地.
是否可以训练神经模型来检测它?
我试过训练神经网络来对文本进行分类,比如
{"tag": "Origin",
"patterns": ["Flying from ", "Travelling from ", "My source is", ]
Run Code Online (Sandbox Code Playgroud)
通过这种方式,我们可以将文本分类为原点,但我也需要获取值(在这种情况下,伦敦,新加坡).
反正我们能做到吗?
我正在聊天机器人,机器人将与客户互动.我想构建一个智能的,类似AI的机器人.
我做了一点但我很感激有关改进的建议.
如果客户输入:
A) I want to know the cost of XXX car.
B) Send me the price of car XXX.
C) What is the cost of XXX car?
D) Specifications of XXX car
Run Code Online (Sandbox Code Playgroud)
我如何建立一个机器人,以便它可以恢复这些答案?如果我匹配一个完整的句子,那么它将无法工作.
我的客户可以写任何东西,可以提问.请问,有人可以帮助确保机器人能够理解同一查询的不同用法吗?
提前致谢.