标签: extraction

高效的TIFF瓦片提取C++

我正在处理大约20000 x 20000像素的1gb大tiff图像.我需要在随机位置从图像中提取几个图块(大约300x300像素).

我尝试了以下解决方案:

  • Libtiff(我能找到的唯一低级库)提供了TIFFReadline(),但这意味着可以读取大约19700个不必要的像素.

  • 我实现了自己的tiff阅读器,它从图像中提取出一块瓷砖,而不需要读取不必要的像素.我预计它会更快,但对瓷砖的每一行进行搜索会使它变得非常慢.我也尝试读取包含我的磁贴的文件的所有行的缓冲区,然后从缓冲区中提取磁贴,但结果或多或少相同.

我想收到改善我的瓷砖提取工具的建议!

一切都是受欢迎的,也许你可以提出一个我可以使用的更高效的库,一些关于C/C++ I/O的技巧,一些针对我的需求的更高级别的策略等等.

问候,胡安

c++ tiff extraction tile libtiff

8
推荐指数
1
解决办法
3555
查看次数

Python - 从pdf中提取格式化文本(即粗体,斜体,颜色)

是否有任何Python库允许从PDF中提取文本,但保留格式(即粗体,斜体,下划线,颜色等)?

我已经研究过各种选项,pdfminer但据我所知,他们只提取原始文本.

python pdf formatting extraction

8
推荐指数
0
解决办法
2536
查看次数

监控ZIP文件提取Python

我需要解压缩.ZIP存档.我已经知道如何解压缩它,但它是一个巨大的文件,需要一些时间来解压缩.如何打印提取的完成百分比?我想要这样的东西:

Extracting File
1% Complete
2% Complete
etc, etc
Run Code Online (Sandbox Code Playgroud)

python zip progress monitor extraction

7
推荐指数
2
解决办法
3795
查看次数

提取包含特定名称的列

我正在尝试使用它来处理大型文本文件中的数据.

我有一个包含超过2000列的txt文件,其中约三分之一的标题包含"Net"一词.我想只提取这些列并将它们写入新的txt文件.有关如何做到这一点的任何建议?

我搜索了一下但是找不到能帮助我的东西.如果之前已经提出并解决了类似的问题,请道歉.

编辑1:谢谢大家!在写作的那一刻,3位用户提出了解决方案,他们都运作良好.老实说,我不认为人们会回答所以我没有检查一两天,并对此感到高兴.我印象非常深刻.

编辑2:我添加了一张图片,显示原始txt文件的一部分可能是什么样子,以防它将来会帮助任何人:

来自原始txt文件的示例

python extraction text-files

7
推荐指数
2
解决办法
2023
查看次数

R,tm转换错误-丢弃文档

我想根据文字中关键字的权重创建一个网络。然后在运行与tm_map相关的代码时出现错误:

library (tm)
library(NLP)
lirary (openNLP)

text = c('.......')
corp <- Corpus(VectorSource(text))
corp <- tm_map(corp, stripWhitespace)

Warning message:
In tm_map.SimpleCorpus(corp, stripWhitespace) :
transformation drops documents

corp <- tm_map(corp, tolower)

Warning message:
In tm_map.SimpleCorpus(corp, tolower) : transformation drops documents
Run Code Online (Sandbox Code Playgroud)

这些代码已经在2个月前开始工作,现在我正在尝试获取新数据,但现在不再工作。有人请告诉我我哪里错了。谢谢。我什至尝试使用下面的命令,但是它也不起作用。

corp <- tm_map(corp, content_transformer(stripWhitespace))
Run Code Online (Sandbox Code Playgroud)

r extract keyword extraction tm

7
推荐指数
1
解决办法
7512
查看次数

如何从PDF中提取数据?

我的公司通过Excel从外部公司接收数据.我们将其导出到SQL Server以运行数据报告.他们现在正在改为PDF格式,有没有办法可靠地从PDF中移植数据并将其插入我们的SQL Server 2008数据库?

这需要编写应用程序还是有自动执行此操作的方法?

pdf extraction sql-server-2008

6
推荐指数
2
解决办法
4万
查看次数

以编程方式从域名中提取关键字

假设我有一个我想分析的域名列表.除非域名是连字符,否则我看不到一种特别简单的方法来"提取"域中使用的关键字.但我看到它在DomainTools.com,Estibot.com等网站上完成.例如:

ilikecheese.com becomes "i like cheese"
sanfranciscohotels.com becomes "san francisco hotels"
...
Run Code Online (Sandbox Code Playgroud)

有效和有效地实现这一目标的任何建议?

编辑:我想用PHP编写.

php string dns keyword extraction

6
推荐指数
1
解决办法
3483
查看次数

自解压Delphi程序

我正在Delphi7中编写一个更新程序,它将运行一次,但需要运行许多文件.

我想要的成就:

  1. 用户运行exe
  2. exe解包文件,运行更新程序
  3. 如果updater检测到并出现错误,则提示用户发送登录电子邮件
  4. 运行更新程序后,将删除临时文件(其中一些文件是更新程序使用的dll,因此必须先关闭更新程序才能删除文件)

有谁能推荐一个好的解决方案?我已经考虑过使用Inno Setup(对于这么简单的任务来说太复杂)或使用自解压zip文件(但之后如何删除文件)?

谢谢!

delphi extraction

6
推荐指数
2
解决办法
1900
查看次数

如何使用Lua从zip文件中提取文件?

如何使用Lua提取文件?

更新:我现在有以下代码,但每次到达函数末尾时都会崩溃,但它成功提取所有文件并将它们放在正确的位置.

require "zip"

function ExtractZipAndCopyFiles(zipPath, zipFilename, destinationPath)
    local zfile, err = zip.open(zipPath .. zipFilename)

    -- iterate through each file insize the zip file
    for file in zfile:files() do
        local currFile, err = zfile:open(file.filename)
        local currFileContents = currFile:read("*a") -- read entire contents of current file
        local hBinaryOutput = io.open(destinationPath .. file.filename, "wb")

        -- write current file inside zip to a file outside zip
        if(hBinaryOutput)then
            hBinaryOutput:write(currFileContents)
            hBinaryOutput:close()
        end
    end

    zfile:close()
end
-- call the function
ExtractZipAndCopyFiles("C:\\Users\\bhannan\\Desktop\\LUA\\", "example.zip", "C:\\Users\\bhannan\\Desktop\\ZipExtractionOutput\\")
Run Code Online (Sandbox Code Playgroud)

为什么每次到达时都会崩溃?

zip lua extraction

6
推荐指数
1
解决办法
8151
查看次数

使用map提取匹配指定值的(key,value)哈希集

我一直在寻找一种使用perl函数执行以下操作的方法map:给定一个哈希,我想提取值等于或匹配指定参数的对(键,值).

在我的例子我想从哪里提取(键,值)对value = failed,但它也可能是一个表达式(即以A开头的字符串或正则表达式).这就是为什么我想要一个哈希值,而不仅仅是一个与值匹配的键表.

my %strings = (
    bla => "success",
    ble => "failed",
    bli => "failed",
    foo => "success",
    blo => "failed",
    bar => "failed",
    blu => "success"
);

my %failed_s = ();

while (my ($k, $v) = each %strings) {
    if ( $v eq 'failed' ) {$failed_s{$k} = $v};
};
Run Code Online (Sandbox Code Playgroud)

我尝试了几种方法,但没有很好的结果,所以我觉得我对引用,矫揉造作,结果等感到困惑.

my %failed_s = 
    map { { $_ => $strings{$_} } 
    if ( $strings{$_}./failed/ ) } 
    keys %strings;
my %failed_s = 
    map { ( …
Run Code Online (Sandbox Code Playgroud)

perl map extraction

6
推荐指数
2
解决办法
1万
查看次数

标签 统计

extraction ×10

python ×3

keyword ×2

pdf ×2

zip ×2

c++ ×1

delphi ×1

dns ×1

extract ×1

formatting ×1

libtiff ×1

lua ×1

map ×1

monitor ×1

perl ×1

php ×1

progress ×1

r ×1

sql-server-2008 ×1

string ×1

text-files ×1

tiff ×1

tile ×1

tm ×1