我们的办公室会扫描数据输入表格,而且我们缺少能够进行自动双重输入的专有软件(当然,主要输入是手工完成的).我们希望为研究人员提供一种工具,以突出表格上的区域,并使用扫描版本来确定参与者的参赛作品.
要做到这一点,我需要进行非常粗略的尝试是将PDF文件作为光栅文件读取的文件,坐标为X,Y分量,B&W白色"强度"为Z轴.
我们主要使用R进行统计分析和数据管理,因此R中的选项会很棒.
您可以使用R中的光栅包.但是,它不支持.pdf文件,但.tif,.jpg,.png(以及其他许多文件).但是将你的pdf转换为png应该不是一个大问题:在这里查看更多信息.
准备好png文件后,您可以执行以下操作:
png <- raster("your/png/file.png")
Run Code Online (Sandbox Code Playgroud)
然后使用该extract()函数从图片中获取您的brigthness值.也就是说你的png是200x200px并且你想从第100行和第150列中提取一个像素值:
value <- extract(png, c(150,100))
Run Code Online (Sandbox Code Playgroud)