小编per*_*one的帖子

layoutparser 给出错误“模块layoutparser 没有属性 ocr”

我正在尝试使用新的layoutparser 包来做一些OCR。然而,由于我有 R 背景,我很难启动并运行它。

我通过以下方式安装了它(工作正常):

pip install layoutparser
pip install "layoutparser[ocr]"
Run Code Online (Sandbox Code Playgroud)

现在,当我运行以下命令时,出现错误:

import layoutparser as lp

import matplotlib.pyplot as plt

import pandas as pd
import numpy as np
import cv2

ocr_agent = lp.ocr.TesseractAgent()
Run Code Online (Sandbox Code Playgroud)
AttributeError: module layoutparser has no attribute ocr
Run Code Online (Sandbox Code Playgroud)

python ocr

4
推荐指数
1
解决办法
6956
查看次数

在 VS Code/R 中选择代码块或段落

我想通过快捷方式选择 R 代码块。

目前我正在使用CTRL+L选择当前行并CTRL+ALT+UP/DOWN扩大选择范围。然而,这很麻烦。

有没有办法告诉 VS Code 选择段落中的所有内容?

例子:

library(dplyr)

starwars %>% 
  filter(species == "Droid")

starwars %>% 
  |mutate(name, bmi = mass / ((height / 100)  ^ 2)) %>% # <- The cursor is where "|" is for example
  select(name:mass, bmi)

Run Code Online (Sandbox Code Playgroud)

在此示例中应选择以下内容:

starwars %>% 
  mutate(name, bmi = mass / ((height / 100)  ^ 2)) %>%
  select(name:mass, bmi)
Run Code Online (Sandbox Code Playgroud)

r visual-studio-code

4
推荐指数
1
解决办法
385
查看次数

mlr3 正确设置并行化

假设我有一台 32 个核心的机器,并且希望尽可能高效地执行 5 个外折叠和 3 个内折叠的嵌套 CV。

在外层,我对两个或多个学习器进行基准测试,在内层,我为一个或 nk 个学习器调整超参数。

如何设置batch_size和future::plan()?

term_eval 如何取决于批量大小?

这明智吗?我的直觉是更好地并行运行内部循环。但我不确定 term_evals 和 batch_size。

lrn1 <- auto_tuner(
  method = "random_search",
  learner = lrn1,
  resampling = rsmp("cv", folds = 3),
  measure = msr("classif.auc"),
  term_evals = 100,
  batch_size = 10,
  store_models = TRUE
)

design = benchmark_grid(task = task, learner = c(lrn1, lrn2), resampling = rsmp("cv", folds = 5))

# Runs the inner loop in parallel and the outer loop sequentially
future::plan(list("sequential", "multisession"))

bmr = benchmark(design, store_models = …
Run Code Online (Sandbox Code Playgroud)

r machine-learning mlr3

2
推荐指数
1
解决办法
256
查看次数

标签 统计

r ×2

machine-learning ×1

mlr3 ×1

ocr ×1

python ×1

visual-studio-code ×1