小编sha*_*dam的帖子

如何将Spacy en_core_web_md模型放入Python包中

我正在构建一个 python 包，并且正在使用 Spacy 库和 Spacy 模型 en_core_web_md。无法使用 pip 安装。你可以这样安装

python -m spacy download en_core_web_md

Run Code Online (Sandbox Code Playgroud)

我已将 en_core_web_md 文件夹放入我的 Python 包中。

简单的EDA
- 初始化.py
- simple_eda.py
- en_core_web_md
测试
安装程序.py
自述文件.md
执照

我可以成功安装包，但是当我导入时，它给了我这个错误。

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/home/shahid/anaconda3/envs/eda_test_6/lib/python3.5/site-packages/simple_nlp/__init__.py", line 1, in <module>
    from simple_nlp.simple_nlp import SimpleNLP
  File "/home/shahid/anaconda3/envs/eda_test_6/lib/python3.5/site-packages/simple_nlp/simple_nlp.py", line 22, in <module>
    nlp = spacy.load("en_core_web_md")
  File "/home/shahid/anaconda3/envs/eda_test_6/lib/python3.5/site-packages/spacy/__init__.py", line 30, in load
    return util.load_model(name, **overrides)
  File "/home/shahid/anaconda3/envs/eda_test_6/lib/python3.5/site-packages/spacy/util.py", line 175, in load_model
    raise IOError(Errors.E050.format(name=name))
OSError: [E050] Can't find …

Run Code Online (Sandbox Code Playgroud)

python pip pypi spacy python-packaging

sha*_*dam

2020 09-27

7
推荐指数

1
解决办法

6175
查看次数

生成两个平方和== 1的随机数

嗨，我想生成两个随机数，以使它们的平方和等于1。

我已经写了这段代码。它们的平方和可能不完全等于1，但应该接近0.999。我也用过，if(math.isclose(abs(gene_value_1)**2 + abs(gene_value_2)**2, 1))但是不起作用。

gene_value_1 = random.uniform(0, 1)
gene_value_2 = random.uniform(0, 1)
if(abs(gene_value_1)**2 + abs(gene_value_2)**2) == 1:
    print(added)

Run Code Online (Sandbox Code Playgroud)

我想生成两个随机数，其平方和几乎等于1。

python random geometry numpy

sha*_*dam

2019 05-09

3
推荐指数

1
解决办法

147
查看次数

Transformer库缓存路径没有改变

我已经尝试过，但它对我不起作用。我正在使用这个Git 存储库。我正在构建一个桌面应用程序，不希望用户下载模型。我想通过构建来运送模型。我知道 Transformers 库会寻找cache/torch/transformers. 如果不存在，请下载它。我还知道你可以cache_dir在中传递参数pre_trained。我正在尝试这个。

cache = os.path.join(os.path.abspath(os.getcwd()), 'Transformation/Annotators/New Sentiment Analysis/transformers')
os.environ['TRANSFORMERS_CACHE'] = cache


if args.model_name_or_path is None:
    args.model_name_or_path = 'barissayil/bert-sentiment-analysis-sst'
#Configuration for the desired transformer model
config = AutoConfig.from_pretrained(args.model_name_or_path, cache_dir=cache)

Run Code Online (Sandbox Code Playgroud)

我已经尝试了上述问题中的解决方案，并尝试了cache_dir。Transformer 文件夹与analyze.py 位于同一目录中。整个存储库和转换器文件夹位于 New Sentiment Analysis 目录中。

python sentiment-analysis huggingface-transformers

sha*_*dam

2020 09-26

3
推荐指数

1
解决办法

3338
查看次数

如何使用 python 而不是 Docx 读取 doc 文件

我正在尝试用 python 读取.doc文件，但由于操作系统依赖性，我不想使用 texttract 。另外我不想使用，docx2txt因为据我了解它不读取.doc而只.docx读取文件。

是否有类似的模块，或者甚至可以在没有库支持的情况下实现？

python doc

sha*_*dam

2021 01-18

2
推荐指数

1
解决办法

4487
查看次数

有什么办法可以让这个功能更快

我正在编写这个函数，首先我使用的是循环。循环需要时间，因为我尝试了列表理解。它没有用。此功能允许 10 秒。请检查一下。该函数返回公司的排序列表，其中公司的比率为 5% 或更高。

def mostActive(customers):
    # Write your code here
    tot = len(customers)
    set_cust = set(customers)
    cust_dict = {i: customers.count(i)/tot for i in set_cust}
    cus_list = [i for i in list(cust_dict) if cust_dict[i] >= 0.05]
    return sorted(cus_list)

Run Code Online (Sandbox Code Playgroud)

样本输入和输出

Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Alpha
Omega
Beta

Run Code Online (Sandbox Code Playgroud)

预期输出：

Alpha
Beta
Omega

Run Code Online (Sandbox Code Playgroud)

python loops list-comprehension

sha*_*dam

2020 09-08

-1
推荐指数

1
解决办法

56
查看次数

标签统计

python ×5

doc ×1

geometry ×1

huggingface-transformers ×1

list-comprehension ×1

loops ×1

numpy ×1

pip ×1

pypi ×1

python-packaging ×1

random ×1

sentiment-analysis ×1

spacy ×1

如何将Spacy en_core_web_md模型放入Python包中

生成两个平方和== 1的随机数

Transformer库缓存路径没有改变

如何使用 python 而不是 Docx 读取 doc 文件

有什么办法可以让这个功能更快

样本输入和输出

标签 统计

小编sha_dam的帖子

标签统计