我正在构建一个 python 包,并且正在使用 Spacy 库和 Spacy 模型 en_core_web_md。无法使用 pip 安装。你可以这样安装
python -m spacy download en_core_web_md
Run Code Online (Sandbox Code Playgroud)
我已将 en_core_web_md 文件夹放入我的 Python 包中。
简单的EDA
测试
安装程序.py
自述文件.md
执照
我可以成功安装包,但是当我导入时,它给了我这个错误。
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/home/shahid/anaconda3/envs/eda_test_6/lib/python3.5/site-packages/simple_nlp/__init__.py", line 1, in <module>
from simple_nlp.simple_nlp import SimpleNLP
File "/home/shahid/anaconda3/envs/eda_test_6/lib/python3.5/site-packages/simple_nlp/simple_nlp.py", line 22, in <module>
nlp = spacy.load("en_core_web_md")
File "/home/shahid/anaconda3/envs/eda_test_6/lib/python3.5/site-packages/spacy/__init__.py", line 30, in load
return util.load_model(name, **overrides)
File "/home/shahid/anaconda3/envs/eda_test_6/lib/python3.5/site-packages/spacy/util.py", line 175, in load_model
raise IOError(Errors.E050.format(name=name))
OSError: [E050] Can't find …Run Code Online (Sandbox Code Playgroud) 嗨,我想生成两个随机数,以使它们的平方和等于1。
我已经写了这段代码。它们的平方和可能不完全等于1,但应该接近0.999。我也用过,if(math.isclose(abs(gene_value_1)**2 + abs(gene_value_2)**2, 1))但是不起作用。
gene_value_1 = random.uniform(0, 1)
gene_value_2 = random.uniform(0, 1)
if(abs(gene_value_1)**2 + abs(gene_value_2)**2) == 1:
print(added)
Run Code Online (Sandbox Code Playgroud)
我想生成两个随机数,其平方和几乎等于1。
我已经尝试过,但它对我不起作用。我正在使用这个Git 存储库。我正在构建一个桌面应用程序,不希望用户下载模型。我想通过构建来运送模型。我知道 Transformers 库会寻找cache/torch/transformers. 如果不存在,请下载它。我还知道你可以cache_dir在 中传递参数pre_trained。我正在尝试这个。
cache = os.path.join(os.path.abspath(os.getcwd()), 'Transformation/Annotators/New Sentiment Analysis/transformers')
os.environ['TRANSFORMERS_CACHE'] = cache
if args.model_name_or_path is None:
args.model_name_or_path = 'barissayil/bert-sentiment-analysis-sst'
#Configuration for the desired transformer model
config = AutoConfig.from_pretrained(args.model_name_or_path, cache_dir=cache)
Run Code Online (Sandbox Code Playgroud)
我已经尝试了上述问题中的解决方案,并尝试了cache_dir。Transformer 文件夹与analyze.py 位于同一目录中。整个存储库和转换器文件夹位于 New Sentiment Analysis 目录中。
我正在尝试用 python 读取.doc文件,但由于操作系统依赖性,我不想使用 texttract 。另外我不想使用,docx2txt因为据我了解它不读取.doc而只.docx读取文件。
是否有类似的模块,或者甚至可以在没有库支持的情况下实现?
我正在编写这个函数,首先我使用的是循环。循环需要时间,因为我尝试了列表理解。它没有用。此功能允许 10 秒。请检查一下。该函数返回公司的排序列表,其中公司的比率为 5% 或更高。
def mostActive(customers):
# Write your code here
tot = len(customers)
set_cust = set(customers)
cust_dict = {i: customers.count(i)/tot for i in set_cust}
cus_list = [i for i in list(cust_dict) if cust_dict[i] >= 0.05]
return sorted(cus_list)
Run Code Online (Sandbox Code Playgroud)
Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Beta
Run Code Online (Sandbox Code Playgroud)
预期输出:
Alpha
Beta
Omega
Run Code Online (Sandbox Code Playgroud)