标签: nlp

如何计算文本文件中的平均句子长度(单词)包含使用python的100个句子

我有一个包含100个句子的文本文件.我想编写一个python脚本,它将计算包含100个句子的文本文件中的平均句子长度(以单词表示).谢谢

python nlp python-2.7

作者

lucky-day

-5
推荐指数

1
解决办法

8748
查看次数

检测文本是否为非英语

检测文本(特别是Instagram评论)是非英语的最准确方法是什么？我很乐意使用任何高级语言,例如Python,PHP等.

$ sudo pip2 install guess_language
>>> from guess_language import guessLanguage
>>> guessLanguage('la vita e bella')
'UNKNOWN'
>>> guessLanguage('today is a good day')
'UNKNOWN'
>>> guessLanguage('????????????????(???)')
'ja'

Run Code Online (Sandbox Code Playgroud)

与

$ sudo apt-get install php5.6-mbstring

      if(strlen($comment->text) == mb_strlen($comment->text, 'utf-8')) {
         echo '- '.$comment->text."\n";
    }

Run Code Online (Sandbox Code Playgroud)

我得到许多不是英文的英文字符:例子:

- Khoda be khanevadehashon sabr bede tahamol konan
- Akhey...
- Eshghi
- K
- :-)
- Ey khodaa
- ...
- @samaneaghazamani1990 vaaaaay khoda chejoori payam dadan?
- :(
- Elahiiiii
- May Allah please with …

Run Code Online (Sandbox Code Playgroud)

php python text nlp language-detection

Mon*_*lal

2017 03-08

-5
推荐指数

1
解决办法

817
查看次数

如何使用神经模型从消息中检测源和目的地

我想从给定的文本中提取原点和目的地.

例如,

I am travelling from London to New York.
I am flying to Sydney from Singapore.

Run Code Online (Sandbox Code Playgroud)

起源 - >伦敦,新加坡.目的地 - >悉尼,纽约.

NER只提供位置名称,但无法获取原点和目的地.

是否可以训练神经模型来检测它？

我试过训练神经网络来对文本进行分类,比如

{"tag": "Origin",
     "patterns": ["Flying from ", "Travelling from ", "My source is", ]

Run Code Online (Sandbox Code Playgroud)

通过这种方式,我们可以将文本分类为原点,但我也需要获取值(在这种情况下,伦敦,新加坡).

反正我们能做到吗？

python nlp neural-network text-classification ner

vig*_*esh

2018 05-05

-5
推荐指数

1
解决办法

226
查看次数

Chatbots中的人工智能

我正在聊天机器人,机器人将与客户互动.我想构建一个智能的,类似AI的机器人.

我做了一点但我很感激有关改进的建议.

如果客户输入:

A) I want to know the cost of XXX car.
B) Send me the price of car XXX.
C) What is the cost of XXX car?
D) Specifications of XXX car

Run Code Online (Sandbox Code Playgroud)

我如何建立一个机器人,以便它可以恢复这些答案？如果我匹配一个完整的句子,那么它将无法工作.

我的客户可以写任何东西,可以提问.请问,有人可以帮助确保机器人能够理解同一查询的不同用法吗？

提前致谢.

nlp artificial-intelligence bots machine-learning

N S*_*rma

2016 07-30

-8
推荐指数

1
解决办法

689
查看次数

标签统计

nlp ×4

python ×3

artificial-intelligence ×1

bots ×1

language-detection ×1

machine-learning ×1

ner ×1

neural-network ×1

php ×1

python-2.7 ×1

text ×1

text-classification ×1

如何计算文本文件中的平均句子长度(单词)包含使用python的100个句子

检测文本是否为非英语

如何使用神经模型从消息中检测源和目的地

Chatbots中的人工智能

标签 统计

标签统计