小编sha*_*dam的帖子

如何将Spacy en_core_web_md模型放入Python包中

我正在构建一个 python 包,并且正在使用 Spacy 库和 Spacy 模型 en_core_web_md。无法使用 pip 安装。你可以这样安装

python -m spacy download en_core_web_md
Run Code Online (Sandbox Code Playgroud)

我已将 en_core_web_md 文件夹放入我的 Python 包中。

  • 简单的EDA

    • 初始化.py
    • simple_eda.py
    • en_core_web_md
  • 测试

  • 安装程序.py

  • 自述文件.md

  • 执照

我可以成功安装包,但是当我导入时,它给了我这个错误。

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/home/shahid/anaconda3/envs/eda_test_6/lib/python3.5/site-packages/simple_nlp/__init__.py", line 1, in <module>
    from simple_nlp.simple_nlp import SimpleNLP
  File "/home/shahid/anaconda3/envs/eda_test_6/lib/python3.5/site-packages/simple_nlp/simple_nlp.py", line 22, in <module>
    nlp = spacy.load("en_core_web_md")
  File "/home/shahid/anaconda3/envs/eda_test_6/lib/python3.5/site-packages/spacy/__init__.py", line 30, in load
    return util.load_model(name, **overrides)
  File "/home/shahid/anaconda3/envs/eda_test_6/lib/python3.5/site-packages/spacy/util.py", line 175, in load_model
    raise IOError(Errors.E050.format(name=name))
OSError: [E050] Can't find …
Run Code Online (Sandbox Code Playgroud)

python pip pypi spacy python-packaging

7
推荐指数
1
解决办法
6175
查看次数

生成两个平方和== 1的随机数

嗨,我想生成两个随机数,以使它们的平方和等于1。

我已经写了这段代码。它们的平方和可能不完全等于1,但应该接近0.999。我也用过,if(math.isclose(abs(gene_value_1)**2 + abs(gene_value_2)**2, 1))但是不起作用。

gene_value_1 = random.uniform(0, 1)
gene_value_2 = random.uniform(0, 1)
if(abs(gene_value_1)**2 + abs(gene_value_2)**2) == 1:
    print(added)
Run Code Online (Sandbox Code Playgroud)

我想生成两个随机数,其平方和几乎等于1。

python random geometry numpy

3
推荐指数
1
解决办法
147
查看次数

Transformer库缓存路径没有改变

我已经尝试过但它对我不起作用。我正在使用这个Git 存储库。我正在构建一个桌面应用程序,不希望用户下载模型。我想通过构建来运送模型。我知道 Transformers 库会寻找cache/torch/transformers. 如果不存在,请下载它。我还知道你可以cache_dir在 中传递参数pre_trained。我正在尝试这个。

cache = os.path.join(os.path.abspath(os.getcwd()), 'Transformation/Annotators/New Sentiment Analysis/transformers')
os.environ['TRANSFORMERS_CACHE'] = cache


if args.model_name_or_path is None:
    args.model_name_or_path = 'barissayil/bert-sentiment-analysis-sst'
#Configuration for the desired transformer model
config = AutoConfig.from_pretrained(args.model_name_or_path, cache_dir=cache)
Run Code Online (Sandbox Code Playgroud)

我已经尝试了上述问题中的解决方案,并尝试了cache_dir。Transformer 文件夹与analyze.py 位于同一目录中。整个存储库和转换器文件夹位于 New Sentiment Analysis 目录中。

python sentiment-analysis huggingface-transformers

3
推荐指数
1
解决办法
3338
查看次数

如何使用 python 而不是 Docx 读取 doc 文件

我正在尝试用 python 读取.doc文件,但由于操作系统依赖性,我不想使用 texttract 。另外我不想使用,docx2txt因为据我了解它不读取.doc而只.docx读取文件。

是否有类似的模块,或者甚至可以在没有库支持的情况下实现?

python doc

2
推荐指数
1
解决办法
4487
查看次数

有什么办法可以让这个功能更快

我正在编写这个函数,首先我使用的是循环。循环需要时间,因为我尝试了列表理解。它没有用。此功能允许 10 秒。请检查一下。该函数返回公司的排序列表,其中公司的比率为 5% 或更高。

def mostActive(customers):
    # Write your code here
    tot = len(customers)
    set_cust = set(customers)
    cust_dict = {i: customers.count(i)/tot for i in set_cust}
    cus_list = [i for i in list(cust_dict) if cust_dict[i] >= 0.05]
    return sorted(cus_list)
Run Code Online (Sandbox Code Playgroud)

样本输入和输出

Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Beta
Run Code Online (Sandbox Code Playgroud)

预期输出:

Alpha
Beta
Omega
Run Code Online (Sandbox Code Playgroud)

python loops list-comprehension

-1
推荐指数
1
解决办法
56
查看次数