我正在尝试使用 FAQ 数据集进行数据增强。我用最相似的词来改变词,特别是名词,Wordnet检查与 Spacy 的相似性。我使用多个 for 循环来浏览我的数据集。
import spacy
import nltk
from nltk.corpus import wordnet as wn
import pandas as pd
nlp = spacy.load('en_core_web_md')
nltk.download('wordnet')
questions = pd.read_csv("FAQ.csv")
list_questions = []
for question in questions.values:
list_questions.append(nlp(question[0]))
for question in list_questions:
for token in question:
treshold = 0.5
if token.pos_ == 'NOUN':
wordnet_syn = wn.synsets(str(token), pos=wn.NOUN)
for syn in wordnet_syn:
for lemma in syn.lemmas():
similar_word = nlp(lemma.name())
if similar_word.similarity(token) != 1. and similar_word.similarity(token) > treshold:
good_word = similar_word
treshold …Run Code Online (Sandbox Code Playgroud) 我正在尝试更改我的 VScode 终端。我遵循了本教程。
我尝试在 VScode 中编辑我的 settings.json 文件,如下所示:
{
"terminal.external.osxExec": "iTerm.app",
"terminal.integrated.shell.osx": "/bin/zsh",
"terminal.integrated.fontFamily": "'SourceCodePro+Powerline+Awesome Regular'"
}
Run Code Online (Sandbox Code Playgroud)
但我得到了不同的结果:
我不明白为什么参数不一样,有些图像没有在 VScode 中传递。