标签: extract

sed提取数字

我尝试用sed提取数字:

echo hgdfjg678gfdg kjg45nn | sed 's/.*\([0-9]\+\).*/\1/g'

Run Code Online (Sandbox Code Playgroud)

但结果是:5如何提取:678和45？提前致谢!

sed extract digits

Ned*_*Ned

lucky-day

8
推荐指数

2
解决办法

2万
查看次数

使用Python提取ZipFile,显示进度百分比？

我知道如何使用Python提取zip存档,但我究竟如何以百分比显示该提取的进度？

python extract progress ziparchive

Zac*_*own

2015 01-06

7
推荐指数

2
解决办法

3622
查看次数

PHP String Manipulation:提取hrefs

我有一个HTML字符串,我想检查它是否有任何内部链接,如果是这样,提取它们并将它们放在一个数组中.我可以使用其选择器的简单性在jQuery中执行此操作,但我找不到在PHP中使用的正确方法.

例如,字符串可能如下所示:

<h1>Doctors</h1>
<a title="C - G" href="linkl.html">C - G</a>
<a title="G - K" href="link2.html">G - K</a>
<a title="K - M" href="link3.html">K - M</a>

Run Code Online (Sandbox Code Playgroud)

如何(在PHP中)我可以把它变成一个看起来像这样的数组:

[1]=>"link1.html"
[2]=>"link2.html"
[3]=>"link3.html"

Run Code Online (Sandbox Code Playgroud)

谢谢,伊恩

php string extract href

Ian*_*ugh

2015 07-08

7
推荐指数

1
解决办法

6550
查看次数

从URL中提取HTML

我正在使用Boilerpipe从url中提取文本,使用以下代码:

URL url = new URL("http://www.example.com/some-location/index.html");
String text = ArticleExtractor.INSTANCE.getText(url);

Run Code Online (Sandbox Code Playgroud)

String text只包含html页面的文本,但我需要从中提取整个html代码.

是否有人使用此库并知道如何提取HTML代码？

您可以查看演示页面以获取有关库的更多信息.

html java string url extract

Was*_*RAR

2012 01-10

7
推荐指数

1
解决办法

1万
查看次数

有没有Ruby相当于PHP的提取？

我可以创建一个块来提取哈希元素并将它们转换为局部变量,但我想知道本机方法是否已经存在.像这样的东西:

extract({ :foo => 'bar', :foo2 => 'bar2' })
puts foo  # 'bar'
puts foo2 # 'bar2'

Run Code Online (Sandbox Code Playgroud)

请注意,密钥是私有的,并且范围需要保持在本地.

php ruby hash extract

glo*_*tho

lucky-day

7
推荐指数

1
解决办法

1053
查看次数

我有一个tar存档,我有一个目录,我需要在给定的目录中提取.例如:我有一个目录

TarPrefix/X/Y/Z

在tar存档中我想在给定的目标目录中提取它,例如:extract/a/this目录应该包含目录TarPrefix/x/y/z中包含的所有文件和目录.

subdir_and_files = [  tarinfo for tarinfo in tar.getmembers()
                      if tarinfo.name.startswith("subfolder/")
                   ]

Run Code Online (Sandbox Code Playgroud)

获取目录路径"子文件夹/"中所有成员的列表然后我使用tar.extractall(extracted/a,subdir_and_files) 它提取它,但它提取所有成员及其目录路径例如,这导致提取/ a/x/y/z.你能帮我解压一下给定文件夹中的这些文件吗？

python extract tar

gau*_*rav

lucky-day

7
推荐指数

1
解决办法

1万
查看次数

使用具有相应帧编号的ffmpeg提取帧

我试图使用FFMPEG使用以下命令提取帧:

 ffmpeg.exe ' -i ' videoFile ' -r 1/5 ' imgsFolder '\%5d.png'

Run Code Online (Sandbox Code Playgroud)

它以连续的方式提取帧并分配帧名,例如0,1 ......

是否可以将实际帧编号指定为提取的一部分？

例如,如果ffmpeg提取第10帧,第20帧......它应该命名为img00010,img00020而不是img00000,img00001 ....

ffmpeg extract frame

ssk*_*ssk

2012 08-11

7
推荐指数

1
解决办法

1286
查看次数

OpenCV:基于高斯混合模型的颜色提取

我正在尝试使用opencv EM算法进行颜色提取.我在opencv文档中使用以下代码:

cv::Mat capturedFrame ( height, width, CV_8UC3 );
int i, j;
int nsamples = 1000;
cv::Mat samples ( nsamples, 2, CV_32FC1 );
cv::Mat labels;
cv::Mat img = cv::Mat::zeros ( height, height, CV_8UC3 );
img = capturedFrame;
cv::Mat sample ( 1, 2, CV_32FC1 );
CvEM em_model;
CvEMParams params;
samples = samples.reshape ( 2, 0 );

    for ( i = 0; i < N; i++ )
    {           
        //from the training samples
        cv::Mat samples_part = samples.rowRange ( i*nsamples/N, (i+1)*nsamples/N);

        cv::Scalar mean (((i%N)+1)*img.rows/(N1+1),((i/N1)+1)*img.rows/(N1+1)); …

Run Code Online (Sandbox Code Playgroud)

c++ opencv extract colors gaussian

E_l*_*ner

2012 10-16

7
推荐指数

1
解决办法

2万
查看次数

从 PDF 中提取文本的格式（字体大小、类型等）

是否可以从 PDF 文件中提取有关特定字体/字体大小/字体颜色等的文本？我更喜欢 Perl、python 或 *nix 命令行实用程序。我的目标是从 PDF 文件中提取所有标题，这样我就可以在单个 PDF 中获得一个很好的文章索引。

pdf fonts extract font-size

Wak*_*nka

2021 03-11

7
推荐指数

1
解决办法

7887
查看次数

提取PDF的特定页面并用Python保存

我有一些来源并尝试编写代码来提取一些页面并创建 pdf 文件。我有一个看起来像这样的列表

information = [(filename1,startpage1,endpage1), (filename2, startpage2, endpage2), ...,(filename19,startpage19,endpage19)].

Run Code Online (Sandbox Code Playgroud)

这是我的代码。

import PyPDF2    
for page in range(pdfReader.getNumPages()-1):
    pdf_writer = PyPDF2.PdfFileWriter()
    start = information[page][1]
    end = information[page][2]
    while start<end:
        pdf_writer.addPage(pdfReader.getPage(start))
        start+=1
        output_filename = '{}_{}_page_{}.pdf'.format(information[page][0],information[page][1], information[page][2])
    with open(output_filename,'wb') as out:
        pdf_writer.write(out)

Run Code Online (Sandbox Code Playgroud)

但是输出很奇怪……有些里面什么都没有，有些里面只有一页。我该如何纠正？

python pdf extract pypdf2

SSS*_*SSS

lucky-day

7
推荐指数

2
解决办法

8716
查看次数