标签: extract

如何使用Python提取硬件ID?

如何使用python脚本提取HD和Bios唯一ID?

python hardware extract

6
推荐指数
1
解决办法
6744
查看次数

用于从音频流中提取单词(语音)的库?

我有一个音频流,我会从中提取单词(语音).所以例如有audio.wav我会得到001.wav,002.wav,003.wav等,其中每个XXX.wav是一个单词.

我正在寻找一个库或程序来做 - 平台没关系,但我更喜欢开源解决方案.

提前感谢您的帮助.

audio extract speech

6
推荐指数
1
解决办法
3122
查看次数

在Java中,有一些URL解析器?

我知道Java中有一个URL类,但我需要方法来获取页面的文件扩展名(html,php,asp等),域名的国家(ca,au,br,jp,fr等) ,页面的类型(.net,.org,.gov等)和其他.其中一些方法,我使用了字符串处理,但我认为只为此完成的类可以更容易理解.

java url parsing extract

6
推荐指数
2
解决办法
1万
查看次数

访问PDF中的字体文件

我们目前正与一些出版商合作,通过他们的PDF生成在线图书.我们的遗留应用程序使用flex,因此我们正在使用SWFToolsPDF2SWF将PDF转换为SWF文件.

我们遇到的问题是,当用户执行搜索时,我们的弹性阅读器不会突出显示SWF文档中的文本.经过快速调查后,我们发现在提取文本时我们需要嵌入PDF文档使用的字体:

http://wiki.swftools.org/wiki/How_do_I_highlight_text_in_the_SWF%3F

pdf2swf -F $YOUR_FONTS_DIR$ -f input.pdf -o output.swf
Run Code Online (Sandbox Code Playgroud)

从上面的代码中可以看出,我们需要一个包含该PDF中字体的字体目录的路径.

由于我们将转换大量PDF,是否可以直接通过PDF访问字体文件而不是在我们的应用程序中存储大量字体?

附加信息

我们的应用程序是用Java编写的.

我们目前在应用程序中使用PDFBox和Ghostscript,因此如果任何解决方案使用这些库,那么这将是首选,但我们对所有想法持开放态度.

java pdf fonts extract pdfbox

6
推荐指数
1
解决办法
1100
查看次数

将webarchive转换为html

我设法将一个复杂网站的行为收集到一个webarchive中。此后,我想将该webarchive转换为一组html嵌套目录。但是,当我同时使用Waf和在Apple商店购买的商业软件进行此操作时,我得到的只是嵌套目录,底部带有html页面,没有图像,也没有CSS或工作链接。如果您对webarchive文档感兴趣,请访问:

http://www.miafoto.it/it/GiroMilano.webarchive

而提取的弱乘积为:

http://www.miafoto.it/it/Giromilano/Pagine/default.aspx

以及上面的空目录。除了外观不同外,Web归档文件还显示与官方网站相同的行为-选择列表框并按下按钮时-提取的版本会通过加载自身而不是官方页面来生成不包含任何内容的页面。您可能会看到,Web归档文件超过1MB,而提取文件仅超过1 KB。

它有什么问题,我如何才能完成如此看似微不足道的业务并获得可用的结果?

谢谢,

html extract webarchive

6
推荐指数
2
解决办法
1万
查看次数

从字节缓冲区中提取数据包

我有一个长度为256的缓冲区,它接收来自蓝牙的字节序列.我需要提取的实际数据包是以字节开头和结尾126.我想使用LINQ在缓冲区中提取最新的数据包.

我现在正在做的是检查最后一个索引,126然后向后计数,直到我到达另一个126.还存在一些缺陷,例如,两个相邻的数据包可能导致两个字节126紧挨着.

这是缓冲区的示例:

126   6 0   5   232 125 93  126 126 69  0 
0   1   0   2   2   34  6   0   5   232 125 
93  126 126 69  0   0   1   0   2   2   34 
6   0   5   232 125 93  126 126 69  0   0 
1   0   2   2   34  6   0   5   232 125 93 
126 126 69  0   0

所以我的信息是:

  • 数据包以字节值126开始和结束
  • 起始索引之后的下一个字节的值为69
  • 在126的结束字节右边的最后3个字节是我知道如何计算的整个数据包的CRC,所以在提取数据包之后我可以检查这个CRC以查看我是否有正确的数据包

所以最后我希望有一个包含正确数据包的数组或列表.例如:

126 …
Run Code Online (Sandbox Code Playgroud)

c# linq arrays extract list

6
推荐指数
1
解决办法
2711
查看次数

从给定另一个值的数组中选择条目

我有一个文本文件格式(日期,时间,阻力):

12/11/2013  13:20:38    28.321930E+3
...         ...             ...
Run Code Online (Sandbox Code Playgroud)

我需要在第一次数据输入后每6秒提取一次阻力值(第三列).首先,我想使用以下方法导入文本文件:

date, time, resistance = loadtxt('Thermometers.txt', unpack=True, usecols=[0,1,2])
Run Code Online (Sandbox Code Playgroud)

然而,在我几乎没有开始我的程序之前,我得到错误:

ValueError:float()的无效文字:12/11/2013

-也-

我不知道如何在日期变化的情况下迭代时间,因为它是一个过夜的数据运行.我的问题的优雅解决方案将非常感激.

python text extract text-files

6
推荐指数
1
解决办法
124
查看次数

如何减少提取文件所需的时间?

我在C#中创建了一个程序,它处理了大约30个压缩文件夹,总共有35000个文件.我的目的是读取每个文件以处理其信息.截至目前,我的代码提取所有文件夹,然后读取文件.这个过程的问题是它需要大约15-20分钟,这是很多.

我使用以下代码来提取文件:

void ExtractFile(string zipfile, string path)
{
    ZipFile zip = ZipFile.Read(zipfile);
    zip.ExtractAll(path);
}
Run Code Online (Sandbox Code Playgroud)

提取部分是花费最多时间处理的部分.我需要减少这个时间.有没有办法我可以读取压缩文件夹中的文件内容而不提取它们?或者,如果有人知道任何其他方式可以帮助我减少此代码的时间?

提前致谢

c# extract zipfile dotnetzip

6
推荐指数
1
解决办法
934
查看次数

在某些条件下从列表中提取数据

基本上,我正在尝试添加两个midi文件,互联网上没有太多关于它的信息,所以我正在尝试自己的.

到目前为止我所做的是我添加了两个midi的消息(midi的数据类型),我有两个midi消息的列表.这意味着我现在需要合并两个midi的所有数据.问题是我无法以特定格式添加数据.

所以我的代码是:

  from mido import MidiFile, MidiTrack

mid = MidiFile('har.mid')
mid2 = MidiFile('har2.mid')

l = [msg for track in mid.tracks for msg in track]
l.pop()
ka = [msg for track in mid2.tracks for msg in track]
ka.pop()

result = l + ka

for messagess in result:
    print(messagess)
Run Code Online (Sandbox Code Playgroud)

我得到这个输出:

note_on channel=0 note=59 velocity=40 time=0
note_on channel=0 note=60 velocity=40 time=0
note_on channel=0 note=64 velocity=40 time=0
note_off channel=0 note=59 velocity=0 time=55
note_off channel=0 note=64 velocity=0 time=0
note_on channel=0 note=52 velocity=40 time=0
note_off …
Run Code Online (Sandbox Code Playgroud)

python extract list machine-learning python-3.x

6
推荐指数
1
解决办法
205
查看次数

我可以在没有扩展名的zip文件上使用PowerShell`Express-Archive`

我正在编写一个PowerShell脚本,我必须从.zip存档中提取内容,删除扩展名,因此,存档的名称可以说不是,test.zip而是将test其压缩为.zip存档.我正在尝试使用PowerShell cmdlet,Expand-Archive如下所示:

Expand-Archive -LiteralPath "Path to the archive" -DestinationPath "Extraction Path"
Run Code Online (Sandbox Code Playgroud)

但是,它似乎不起作用,是否有可能使用PowerShell提取此存档的内容,或者最好使用类似7zip命令行工具或类似的工作?

powershell extract archive

6
推荐指数
1
解决办法
703
查看次数