标签: extract

sed提取数字

我尝试用sed提取数字:

echo hgdfjg678gfdg kjg45nn | sed 's/.*\([0-9]\+\).*/\1/g'
Run Code Online (Sandbox Code Playgroud)

但结果是:5如何提取:678和45?提前致谢!

sed extract digits

8
推荐指数
2
解决办法
2万
查看次数

使用Python提取ZipFile,显示进度百分比?

我知道如何使用Python提取zip存档,但我究竟如何以百分比显示该提取的进度?

python extract progress ziparchive

7
推荐指数
2
解决办法
3622
查看次数

PHP String Manipulation:提取hrefs

我有一个HTML字符串,我想检查它是否有任何内部链接,如果是这样,提取它们并将它们放在一个数组中.我可以使用其选择器的简单性在jQuery中执行此操作,但我找不到在PHP中使用的正确方法.

例如,字符串可能如下所示:

<h1>Doctors</h1>
<a title="C - G" href="linkl.html">C - G</a>
<a title="G - K" href="link2.html">G - K</a>
<a title="K - M" href="link3.html">K - M</a>
Run Code Online (Sandbox Code Playgroud)

如何(在PHP中)我可以把它变成一个看起来像这样的数组:

[1]=>"link1.html"
[2]=>"link2.html"
[3]=>"link3.html"
Run Code Online (Sandbox Code Playgroud)

谢谢,伊恩

php string extract href

7
推荐指数
1
解决办法
6550
查看次数

从URL中提取HTML

我正在使用Boilerpipe从url中提取文本,使用以下代码:

URL url = new URL("http://www.example.com/some-location/index.html");
String text = ArticleExtractor.INSTANCE.getText(url);
Run Code Online (Sandbox Code Playgroud)

String text只包含html页面的文本,但我需要从中提取整个html代码.

是否有人使用此库并知道如何提取HTML代码?

您可以查看演示页面以获取有关库的更多信息.

html java string url extract

7
推荐指数
1
解决办法
1万
查看次数

有没有Ruby相当于PHP的提取?

我可以创建一个块来提取哈希元素并将它们转换为局部变量,但我想知道本机方法是否已经存在.像这样的东西:

extract({ :foo => 'bar', :foo2 => 'bar2' })
puts foo  # 'bar'
puts foo2 # 'bar2'
Run Code Online (Sandbox Code Playgroud)

请注意,密钥是私有的,并且范围需要保持在本地.

php ruby hash extract

7
推荐指数
1
解决办法
1053
查看次数

使用给定目录中的目录路径提取所有文件

我有一个tar存档,我有一个目录,我需要在给定的目录中提取.例如:我有一个目录

TarPrefix/X/Y/Z

在tar存档中我想在给定的目标目录中提取它,例如:extract/a/this目录应该包含目录TarPrefix/x/y/z中包含的所有文件和目录.

subdir_and_files = [  tarinfo for tarinfo in tar.getmembers()
                      if tarinfo.name.startswith("subfolder/")
                   ]
Run Code Online (Sandbox Code Playgroud)

获取目录路径"子文件夹/"中所有成员的列表然后我使用tar.extractall(extracted/a,subdir_and_files) 它提取它,但它提取所有成员及其目录路径例如,这导致提取/ a/x/y/z.你能帮我解压一下给定文件夹中的这些文件吗?

python extract tar

7
推荐指数
1
解决办法
1万
查看次数

使用具有相应帧编号的ffmpeg提取帧

我试图使用FFMPEG使用以下命令提取帧:

 ffmpeg.exe ' -i ' videoFile ' -r 1/5 ' imgsFolder '\%5d.png'
Run Code Online (Sandbox Code Playgroud)

它以连续的方式提取帧并分配帧名,例如0,1 ......

是否可以将实际帧编号指定为提取的一部分?

例如,如果ffmpeg提取第10帧,第20帧......它应该命名为img00010,img00020而不是img00000,img00001 ....

ffmpeg extract frame

7
推荐指数
1
解决办法
1286
查看次数

OpenCV:基于高斯混合模型的颜色提取

我正在尝试使用opencv EM算法进行颜色提取.我在opencv文档中使用以下代码:

cv::Mat capturedFrame ( height, width, CV_8UC3 );
int i, j;
int nsamples = 1000;
cv::Mat samples ( nsamples, 2, CV_32FC1 );
cv::Mat labels;
cv::Mat img = cv::Mat::zeros ( height, height, CV_8UC3 );
img = capturedFrame;
cv::Mat sample ( 1, 2, CV_32FC1 );
CvEM em_model;
CvEMParams params;
samples = samples.reshape ( 2, 0 );

    for ( i = 0; i < N; i++ )
    {           
        //from the training samples
        cv::Mat samples_part = samples.rowRange ( i*nsamples/N, (i+1)*nsamples/N);

        cv::Scalar mean (((i%N)+1)*img.rows/(N1+1),((i/N1)+1)*img.rows/(N1+1)); …
Run Code Online (Sandbox Code Playgroud)

c++ opencv extract colors gaussian

7
推荐指数
1
解决办法
2万
查看次数

从 PDF 中提取文本的格式(字体大小、类型等)

是否可以从 PDF 文件中提取有关特定字体/字体大小/字体颜色等的文本?我更喜欢 Perl、python 或 *nix 命令行实用程序。我的目标是从 PDF 文件中提取所有标题,这样我就可以在单个 PDF 中获得一个很好的文章索引。

pdf fonts extract font-size

7
推荐指数
1
解决办法
7887
查看次数

提取PDF的特定页面并用Python保存

我有一些来源并尝试编写代码来提取一些页面并创建 pdf 文件。我有一个看起来像这样的列表

information = [(filename1,startpage1,endpage1), (filename2, startpage2, endpage2), ...,(filename19,startpage19,endpage19)].
Run Code Online (Sandbox Code Playgroud)

这是我的代码。

import PyPDF2    
for page in range(pdfReader.getNumPages()-1):
    pdf_writer = PyPDF2.PdfFileWriter()
    start = information[page][1]
    end = information[page][2]
    while start<end:
        pdf_writer.addPage(pdfReader.getPage(start))
        start+=1
        output_filename = '{}_{}_page_{}.pdf'.format(information[page][0],information[page][1], information[page][2])
    with open(output_filename,'wb') as out:
        pdf_writer.write(out)
Run Code Online (Sandbox Code Playgroud)

但是输出很奇怪……有些里面什么都没有,有些里面只有一页。我该如何纠正?

python pdf extract pypdf2

7
推荐指数
2
解决办法
8716
查看次数

标签 统计

extract ×10

python ×3

pdf ×2

php ×2

string ×2

c++ ×1

colors ×1

digits ×1

ffmpeg ×1

font-size ×1

fonts ×1

frame ×1

gaussian ×1

hash ×1

href ×1

html ×1

java ×1

opencv ×1

progress ×1

pypdf2 ×1

ruby ×1

sed ×1

tar ×1

url ×1

ziparchive ×1