Dar*_*eam 2 wikipedia text-extraction data-extraction python-3.x
我正在开发一个文档摘要 NLP 项目,因此我想从维基百科中提取埃隆·马斯克的简介。我尝试在维基百科库(API)的帮助下提取它,
我第一次尝试使用页面标题(即,埃隆·马斯克),但它给了我一个页面错误,PageError: Page id "e on musk" does not match any pages. Try another id!你注意到它显示的页面 ID了吗"e on musk",然后我尝试使用它的页面 ID 号(即 Q317521),它输出了有关某些植物的结果'Matthiola incana'
这是我的代码
import wikipedia
elon = wikipedia.page('Elon Musk').content
elon
# outputs
PageError: Page id "e on musk" does not match any pages. Try another id!
elon = wikipedia.page('Q317521').content
elon
# outputs (shorted)
Matthiola incana is a species of flowering plant in the cabbage family Brassicaceae. Common names include Brompton stock,
Run Code Online (Sandbox Code Playgroud)
我尝试了艾伦旋转,但不起作用,还尝试了阿尔伯特_爱因斯坦,它显示出奇怪的输出,就像埃隆·马斯克一样。
然而,它与尼古拉·特斯拉、加来道雄、纳伦德拉·莫迪等人合作,这表明我没有做错。
| 归档时间: |
|
| 查看次数: |
974 次 |
| 最近记录: |