我有一个我试图分类的产品列表。它们将用不完整的句子来描述,例如:
“固态硬盘外壳”
“硬盘电缆”
“1TB 硬盘”
“500GB 硬盘,制造商翻新”
我如何使用 python 和 NLP 来获得像“住房、电缆、驱动器、驱动器”这样的输出,或者描述哪个词正在修改哪个的树?先感谢您
我想从一个句子中找到主题Spacy.下面的代码工作正常并给出依赖树.
import spacy
from nltk import Tree
en_nlp = spacy.load('en')
doc = en_nlp("The quick brown fox jumps over the lazy dog.")
def to_nltk_tree(node):
if node.n_lefts + node.n_rights > 0:
return Tree(node.orth_, [to_nltk_tree(child) for child in node.children])
else:
return node.orth_
[to_nltk_tree(sent.root).pretty_print() for sent in doc.sents]
Run Code Online (Sandbox Code Playgroud)
从这个依赖树代码,我可以找到这句话的主题吗?