标签: extraction

从zip文件中提取文件并在Windows 7上保留mod date-Python 2.7.1

我正在尝试使用Python 2.7.1(在Windows上,fyi)从zip文件中提取文件,我的每次尝试都显示提取的文件,其中包含Modified Date =提取时间(这是不正确的).

import os,zipfile
outDirectory = 'C:\\_TEMP\\'
inFile = 'test.zip'
fh = open(os.path.join(outDirectory,inFile),'rb') 
z = zipfile.ZipFile(fh)
for name in z.namelist():
    z.extract(name,outDirectory)
fh.close()
Run Code Online (Sandbox Code Playgroud)

我也尝试使用.extractall方法,结果相同.

import os,zipfile
outDirectory = 'C:\\_TEMP\\'
inFile = 'test.zip'
zFile = zipfile.ZipFile(os.path.join(outDirectory,inFile))        
zFile.extractall(outDirectory)
Run Code Online (Sandbox Code Playgroud)

谁能告诉我我做错了什么?

我想认为这是可能的,而不必每postcorrect的修改时间在这里

python zip extraction

19
推荐指数
4
解决办法
6125
查看次数

如何从MP3获取音频数据?

我正在处理一个必须处理音频文件的应用程序.使用mp3文件时,我不知道如何处理数据(我感兴趣的数据是音频字节,代表我们听到的音频字节).

如果我使用的是wav文件,我知道我有一个44字节的标题,然后是数据.说到mp3,我读到它们是由帧组成的,每帧都包含一个标题和音频数据.是否可以从mp3文件中获取所有音频数据?

我正在使用java(我添加了MP3SPI,Jlayer和Tritonus)并且我能够从文件中获取字节,但我不确定这些字节代表什么或如何处理.

java audio mp3 extraction

17
推荐指数
1
解决办法
3万
查看次数

笔画宽度变换(SWT)实现(Java,C#...)

我最近发现了笔画宽度变换,如以下研究论文所述:

该算法用于从自然场景中检测和提取文本.

但是,我找不到任何实现,从文章中我发现很难确定算法的所有细节,所以我可以在实践中实现它.有谁知道这个算法是否在系统中实现并在实践中使用?是否有C#或Java实现?

c# java ocr image-processing extraction

16
推荐指数
2
解决办法
2万
查看次数

从R中的lsmeans包中提取lsmobj的元素

我想知道如何lsmobjlsmeans包中获取元素R.

require(lsmeans)
fiber.lm <- lm(strength ~ diameter + machine, data = fiber)
fiber.lsm <- lsmeans (fiber.lm, "machine")
fiber.lsm
machine   lsmean        SE df lower.CL upper.CL
 A       40.38241 0.7236252 11 38.78972 41.97510
 B       41.41922 0.7444169 11 39.78077 43.05767
 C       38.79836 0.7878785 11 37.06426 40.53247

Confidence level used: 0.95 


str(fiber.lsm)
'lsmobj' object with variables:
    machine = A, B, C
Run Code Online (Sandbox Code Playgroud)

我想要fiber.lsm的提取物lsmeansSE列.任何帮助将受到高度赞赏.在此先感谢您的帮助.

r extraction lsmeans

15
推荐指数
1
解决办法
5213
查看次数

如何从Mac上的*.jar文件中提取源代码?

我很困惑.我下载了*.jar文件作为一些软件.所以,我想提取源代码来查看它

我用了这个命令 jar xf filename.jar

它返回了另外两个*.jar文件和一个*.class文件.我仍然无法使用标准文本编辑器在终端中打开它们.

也许这不是开源软件?有没有办法看看这里做了什么?

java jar extraction

15
推荐指数
1
解决办法
2万
查看次数

从静态库中提取函数名称

我有一个静态库static_library.a

如何列出那里实现的功能和方法.或者至少如何看待"FUNCTION_NAME"实现的具体功能?

unix static-libraries extraction

14
推荐指数
2
解决办法
2万
查看次数

拉出SD卡的速度非常慢.我该如何优化性能?

我的应用程序下载了大约350个文件的zip.混合了JPG和HTML文件.我写的功能做得很好,但解压缩需要永远.起初我认为原因可能是写入SD卡很慢.但是当我用手机上的其他应用程序解压缩相同的拉链时,它的工作速度要快得多.我能做些什么来优化它?

这是代码:

private void extract() {

    try {
        FileInputStream inStream = new FileInputStream(targetFilePath);
        ZipInputStream zipStream = new ZipInputStream(new BufferedInputStream(inStream));
        ZipEntry entry;
        ZipFile zip = new ZipFile(targetFilePath);

                    //i know the contents for the zip so i create the dirs i need in advance
        new File(targetFolder).mkdirs();
        new File(targetFolder + "META-INF").mkdir();
        new File(targetFolder + "content").mkdir();

        int extracted = 0;

        while((entry = zipStream.getNextEntry()) != null) {
            if (entry.isDirectory()) {
                new File(targetFolder + entry.getName()).mkdirs();
            } else {
                FileOutputStream outStream = new FileOutputStream(targetFolder + entry.getName());
                for …
Run Code Online (Sandbox Code Playgroud)

zip android extraction

14
推荐指数
1
解决办法
4181
查看次数

关键字提取软件

我正在寻找一个软件,给定一些文本,将提取"有意义"的关键字.例如,在句子中:

StackExchange is an online community.
Run Code Online (Sandbox Code Playgroud)

我希望将"StackExchange"和"在线社区"作为具有语义意义的关键词挑选出来,而不是"是"或"一个".

一些研究导致了Alchemy API,它可以很好地完成工作.还有其他解决方案,尤其是开源解决方案吗?

keyword extraction

13
推荐指数
1
解决办法
8401
查看次数

将部分匹配模式保存到变量

我想提取一个匹配模式的子字符串并将其保存到文件中.示例字符串:

Apr 12 19:24:17 PC_NMG kernel: sd 11:0:0:0: [sdf] Attached SCSI removable disk
Run Code Online (Sandbox Code Playgroud)

在这种情况下,我想在括号之间提取部分[sdf].

我试图grep -e '[$subtext]'将括号中的文本保存到变量.当然它不起作用,但我正在寻找类似于此的方法.在这样的正则表达式中包含变量会非常优雅.我能做什么最好的?

谢谢!

regex variables bash extraction

12
推荐指数
2
解决办法
3万
查看次数

PDF表格提取

我有(相同)数据保存为GIF图像文件和PDF文件,我想将其解析为HTML或XML.这些数据实际上是我大学食堂的菜单.这意味着有一个新版本的文件必须每周解析!通常,这些文件包含一些页眉和页脚文本,以及一个充满其他数据的表.我已经阅读了有关stackoverflow的一些帖子,我也开始尝试将表数据解析为HTML/XML:

PDF

  • PDFBox || iText(Java)
  • Google文档导入
  • PDF2HTML || PDF2Table

GIF

  • 正方体-OCR

通过使用PDFBox解析PDF文件,我得到了最好的结果,但仍然(因为菜单每周更改),它不够可靠.我收到的HTML有时包含更多,有时更少的"段落"(<p>),因此我无法对数据进行足够的解析.

这就是为什么我想知道是否有其他方法可以做到这一点?

pdf extraction pdfbox

12
推荐指数
4
解决办法
2万
查看次数

标签 统计

extraction ×10

java ×3

zip ×2

android ×1

audio ×1

bash ×1

c# ×1

image-processing ×1

jar ×1

keyword ×1

lsmeans ×1

mp3 ×1

ocr ×1

pdf ×1

pdfbox ×1

python ×1

r ×1

regex ×1

static-libraries ×1

unix ×1

variables ×1