我有一个音频流,我会从中提取单词(语音).所以例如有audio.wav我会得到001.wav,002.wav,003.wav等,其中每个XXX.wav是一个单词.
我正在寻找一个库或程序来做 - 平台没关系,但我更喜欢开源解决方案.
提前感谢您的帮助.
我知道Java中有一个URL类,但我需要方法来获取页面的文件扩展名(html,php,asp等),域名的国家(ca,au,br,jp,fr等) ,页面的类型(.net,.org,.gov等)和其他.其中一些方法,我使用了字符串处理,但我认为只为此完成的类可以更容易理解.
我们目前正与一些出版商合作,通过他们的PDF生成在线图书.我们的遗留应用程序使用flex,因此我们正在使用SWFTools的PDF2SWF将PDF转换为SWF文件.
我们遇到的问题是,当用户执行搜索时,我们的弹性阅读器不会突出显示SWF文档中的文本.经过快速调查后,我们发现在提取文本时我们需要嵌入PDF文档使用的字体:
http://wiki.swftools.org/wiki/How_do_I_highlight_text_in_the_SWF%3F
pdf2swf -F $YOUR_FONTS_DIR$ -f input.pdf -o output.swf
Run Code Online (Sandbox Code Playgroud)
从上面的代码中可以看出,我们需要一个包含该PDF中字体的字体目录的路径.
由于我们将转换大量PDF,是否可以直接通过PDF访问字体文件而不是在我们的应用程序中存储大量字体?
附加信息
我们的应用程序是用Java编写的.
我们目前在应用程序中使用PDFBox和Ghostscript,因此如果任何解决方案使用这些库,那么这将是首选,但我们对所有想法持开放态度.
我设法将一个复杂网站的行为收集到一个webarchive中。此后,我想将该webarchive转换为一组html嵌套目录。但是,当我同时使用Waf和在Apple商店购买的商业软件进行此操作时,我得到的只是嵌套目录,底部带有html页面,没有图像,也没有CSS或工作链接。如果您对webarchive文档感兴趣,请访问:
http://www.miafoto.it/it/GiroMilano.webarchive
而提取的弱乘积为:
http://www.miafoto.it/it/Giromilano/Pagine/default.aspx
以及上面的空目录。除了外观不同外,Web归档文件还显示与官方网站相同的行为-选择列表框并按下按钮时-提取的版本会通过加载自身而不是官方页面来生成不包含任何内容的页面。您可能会看到,Web归档文件超过1MB,而提取文件仅超过1 KB。
它有什么问题,我如何才能完成如此看似微不足道的业务并获得可用的结果?
谢谢,
我有一个长度为256的缓冲区,它接收来自蓝牙的字节序列.我需要提取的实际数据包是以字节开头和结尾126.我想使用LINQ在缓冲区中提取最新的数据包.
我现在正在做的是检查最后一个索引,126然后向后计数,直到我到达另一个126.还存在一些缺陷,例如,两个相邻的数据包可能导致两个字节126紧挨着.
这是缓冲区的示例:
126 6 0 5 232 125 93 126 126 69 0 0 1 0 2 2 34 6 0 5 232 125 93 126 126 69 0 0 1 0 2 2 34 6 0 5 232 125 93 126 126 69 0 0 1 0 2 2 34 6 0 5 232 125 93 126 126 69 0 0
所以我的信息是:
所以最后我希望有一个包含正确数据包的数组或列表.例如:
126 …Run Code Online (Sandbox Code Playgroud) 我有一个文本文件格式(日期,时间,阻力):
12/11/2013 13:20:38 28.321930E+3
... ... ...
Run Code Online (Sandbox Code Playgroud)
我需要在第一次数据输入后每6秒提取一次阻力值(第三列).首先,我想使用以下方法导入文本文件:
date, time, resistance = loadtxt('Thermometers.txt', unpack=True, usecols=[0,1,2])
Run Code Online (Sandbox Code Playgroud)
然而,在我几乎没有开始我的程序之前,我得到错误:
ValueError:float()的无效文字:12/11/2013
-也-
我不知道如何在日期变化的情况下迭代时间,因为它是一个过夜的数据运行.我的问题的优雅解决方案将非常感激.
我在C#中创建了一个程序,它处理了大约30个压缩文件夹,总共有35000个文件.我的目的是读取每个文件以处理其信息.截至目前,我的代码提取所有文件夹,然后读取文件.这个过程的问题是它需要大约15-20分钟,这是很多.
我使用以下代码来提取文件:
void ExtractFile(string zipfile, string path)
{
ZipFile zip = ZipFile.Read(zipfile);
zip.ExtractAll(path);
}
Run Code Online (Sandbox Code Playgroud)
提取部分是花费最多时间处理的部分.我需要减少这个时间.有没有办法我可以读取压缩文件夹中的文件内容而不提取它们?或者,如果有人知道任何其他方式可以帮助我减少此代码的时间?
提前致谢
基本上,我正在尝试添加两个midi文件,互联网上没有太多关于它的信息,所以我正在尝试自己的.
到目前为止我所做的是我添加了两个midi的消息(midi的数据类型),我有两个midi消息的列表.这意味着我现在需要合并两个midi的所有数据.问题是我无法以特定格式添加数据.
所以我的代码是:
from mido import MidiFile, MidiTrack
mid = MidiFile('har.mid')
mid2 = MidiFile('har2.mid')
l = [msg for track in mid.tracks for msg in track]
l.pop()
ka = [msg for track in mid2.tracks for msg in track]
ka.pop()
result = l + ka
for messagess in result:
print(messagess)
Run Code Online (Sandbox Code Playgroud)
我得到这个输出:
note_on channel=0 note=59 velocity=40 time=0
note_on channel=0 note=60 velocity=40 time=0
note_on channel=0 note=64 velocity=40 time=0
note_off channel=0 note=59 velocity=0 time=55
note_off channel=0 note=64 velocity=0 time=0
note_on channel=0 note=52 velocity=40 time=0
note_off …Run Code Online (Sandbox Code Playgroud) 我正在编写一个PowerShell脚本,我必须从.zip存档中提取内容,删除扩展名,因此,存档的名称可以说不是,test.zip而是将test其压缩为.zip存档.我正在尝试使用PowerShell cmdlet,Expand-Archive如下所示:
Expand-Archive -LiteralPath "Path to the archive" -DestinationPath "Extraction Path"
Run Code Online (Sandbox Code Playgroud)
但是,它似乎不起作用,是否有可能使用PowerShell提取此存档的内容,或者最好使用类似7zip命令行工具或类似的工作?