小编hch*_*am1的帖子

用R做OCR

我一直在尝试在R中进行OCR(读取数据作为扫描图像的PDF数据).一直在读这个@ http://electricarchaeology.ca/2014/07/15/doing-ocr-within-r/

这是一篇非常好的帖子.

有效3个步骤:

  1. 将pdf转换为ppm(图像格式)
  2. 将ppm转换为tif准备好tesseract(使用ImageMagick进行转换)
  3. 将tif转换为文本文件

根据链接帖子的上述3个步骤的有效代码:

lapply(myfiles, function(i){
  # convert pdf to ppm (an image format), just pages 1-10 of the PDF
  # but you can change that easily, just remove or edit the 
  # -f 1 -l 10 bit in the line below
  shell(shQuote(paste0("F:/xpdf/bin64/pdftoppm.exe ", i, " -f 1 -l 10 -r 600 ocrbook")))
  # convert ppm to tif ready for tesseract
  shell(shQuote(paste0("F:/ImageMagick-6.9.1-Q16/convert.exe *.ppm ", i, ".tif")))
  # convert tif to text file
  shell(shQuote(paste0("F:/Tesseract-OCR/tesseract.exe ", i, ".tif …
Run Code Online (Sandbox Code Playgroud)

pdf ocr shell tesseract r

11
推荐指数
2
解决办法
3989
查看次数

Azure自动扩展数据库

我将Azure云服务与单个Azure数据库一起使用.我将定价层设置为S4,这给了我200个DTU和250GB.问题是我的所有工作者和Web角色都设置为使用除数据库之外的加载进行自动扩展.当我进行负载测试时,所有内容都会自动向上扩展,直到数据库开始阻塞导致瓶颈的查询.

我找不到数据库的任何自动缩放选项.我从Microsoft发现了这个视频: Azure SQL数据库动态扩展或缩小

但它基本上表示您需要转到Azure门户并手动扩展到更大的定价层.它没有提到任何有关自动放大或缩小的内容.

我也查看了弹性池,但这些似乎更多的是同时使用许多数据库,而不仅仅是1个数据库.

所以我的问题是:

如何自动扩展和缩小单个Azure数据库?

azure azure-sql-database

6
推荐指数
2
解决办法
2311
查看次数

标签 统计

azure ×1

azure-sql-database ×1

ocr ×1

pdf ×1

r ×1

shell ×1

tesseract ×1