标签: extract

如何从远程存档文件中提取单个文件?

特定

  1. 存档的URL(例如zip文件)
  2. 该存档内文件的全名(包括路径)

我正在寻找一种方法(最好是在Java中)来创建该文件的本地副本,而无需先下载整个存档.

从我(有限的)理解应该是可能的,虽然我不知道如何做到这一点.我一直在使用TrueZip,因为它似乎支持各种各样的存档类型,但我对它以这种方式工作的能力存有疑虑.有没有人有这种经历?

编辑:能够用tarball和压缩的tarball做到这一点对我来说也很重要.

java extract download tar archive

11
推荐指数
2
解决办法
1万
查看次数

CakePHP 2.1 - 如何在find()中正确使用DISTINCT

我有一个让我疯狂的问题,我不得不承认我在CakePHP中没有经验.正如在这个问题中提到的, 在CakePHP查找函数中使用DISTINCT,这样使用DISTINCT:

$this->Model->find('all', array('fields'=>'DISTINCT field_name'));
Run Code Online (Sandbox Code Playgroud)

不返回DISTINCT值,而是返回所有行.事实上,这里的DISTINCT完全没有意义,因为由于某种原因,CakePHP补充道TableName.id在SQL查询中(为什么??我可以删除id引用??),有效地返回每个DISTINCT主键(= all rows = unhelpful).

所以,我仍然想要返回特定field_name列的DISTINCT值.我不能只使用find('all')或find('list')函数吗?是否真的是使用上面链接中描述的Set :: extract()函数来实现它的正确方法?这似乎是CakePHP过度间接的解决方案,通常Cake会让我的生活更轻松.:-)将find和DISTINCT一起使用的正确方法是什么?也许DISTINCT不适用于find()?

看看CookBook,他们说:"做一个DISTINCT查询的快速例子.你可以用类似的方式使用其他运算符,如MIN(),MAX()等:"

<?php
    array(
        'fields' => array('DISTINCT (User.name) AS my_column_name'),
        'order' = >array('User.id DESC')
    )
?>
Run Code Online (Sandbox Code Playgroud)

资料来源:http://book.cakephp.org/2.0/en/models/retrieving-your-data.html

这表明DISTINCT应该可以使用,但是这里有什么用呢?(User.name)对应于我想要DISTINCT的field_name还是my_column_name my field_name?

最后,从CakePHP 1.x迁移到CakePHP 2.x时,是否有任何改变?即在Stackoverflow上看到的CakePHP 1.x的答案仍然相关吗?

提前致谢!

cakephp extract distinct find cakephp-2.0

11
推荐指数
2
解决办法
3万
查看次数

Eclipse可以自动生成第三方库类的接口吗?

我正在Apache commons网络库中使用Apache的FTPClient类.遗憾的是,它没有为大多数功能实现接口,这使得使用它的测试类变得棘手.所以,我以为我会创建自己的类来封装这个并实现一个接口.无论如何那是背景.我的问题是,在Eclipse中是否可以生成一个接口(类似于Refactor-> Extract Interface),但是对于坐在jar文件中的第三方代码?

为了澄清,我不是在寻找FTPClient现在实现新接口,而是创建一个模仿与FTPClient相同的公共API的接口.然后我可以创建自己的类来实现这个接口并封装FTPClient.

java eclipse interface extract

10
推荐指数
1
解决办法
2086
查看次数

如何从R中的统一列表中提取值?

例如,如何在people下面的列表中获取每个人年龄的向量:

> people = vector("list", 5)
> people[[1]] = c(name="Paul", age=23)
> people[[2]] = c(name="Peter", age=35)
> people[[3]] = c(name="Sam", age=20)
> people[[4]] = c(name="Lyle", age=31)
> people[[5]] = c(name="Fred", age=26)
> ages = ???
> ages
[1] 23 35 20 31 26
Run Code Online (Sandbox Code Playgroud)

是否有相当于Python列表的理解或具有相同效果的东西?

r extract list

10
推荐指数
2
解决办法
3万
查看次数

如何用python提取.gpx数据

我是一个新的linux/python用户,有.gpx文件(由GPS跟踪软件制作的输出文件),需要将值提取到csv/txt中,以便在GIS程序中使用.我已经在我开始的python书,本网站和在线查找了字符串和切片等.我使用了.gpx到.txt转换器,可以将经度和纬度拉出到文本文件中.我需要提取高程数据.该文件在顶部有六行文本,我只知道如何在emacs中打开此文件(除了在网站上传)这是从第7行开始的文件.

最理想的是,我想知道如何通过python(或Perl)将所有值提取到csv或txt文件中.如果有人知道网站教程或示例脚本,将不胜感激.

<metadata>
<time>2012-06-13T01:51:08Z</time>
</metadata>
<trk>
<name>Track 2012-06-12 19:51</name>
<trkseg>
<trkpt lat="43.49670697" lon="-112.03380961">
<ele>1403.0</ele>
<time>2012-06-13T01:53:44Z</time>
<extensions>
<ogt10:accuracy>34.0</ogt10:accuracy></extensions>
</trkpt>
<trkpt lat="43.49796612" lon="-112.03970968">
<ele>1410.9000244140625</ele>
<time>2012-06-13T01:57:10Z</time>
<extensions>
<gpx10:speed>3.75</gpx10:speed>
<ogt10:accuracy>13.0</ogt10:accuracy>
<gpx10:course>293.20001220703125</gpx10:course></extensions>
</trkpt>
<trkpt lat="43.49450857" lon="-112.04477274">
<ele>1406.5</ele>
<time>2012-06-13T02:02:24Z</time>
<extensions>
<ogt10:accuracy>12.0</ogt10:accuracy></extensions>
</trkpt>
</trkseg>
<trkseg>
<trkpt lat="43.49451057" lon="-112.04480354">
<ele>1398.9000244140625</ele>
<time>2012-06-13T02:54:55Z</time>
<extensions>
<ogt10:accuracy>10.0</ogt10:accuracy></extensions>
</trkpt>
<trkpt lat="43.49464813" lon="-112.04472215">
<ele>1414.9000244140625</ele>
<time>2012-06-13T02:56:06Z</time>
<extensions>
<ogt10:accuracy>7.0</ogt10:accuracy></extensions>
</trkpt>
<trkpt lat="43.49432573" lon="-112.04489684">
<ele>1410.9000244140625</ele>
<time>2012-06-13T02:57:27Z</time>
<extensions>
<gpx10:speed>3.288236618041992</gpx10:speed>
<ogt10:accuracy>21.0</ogt10:accuracy>
<gpx10:course>196.1999969482422</gpx10:course></extensions>
</trkpt>
<trkpt lat="43.49397445" lon="-112.04505216">
<ele>1421.699951171875</ele>
<time>2012-06-13T02:57:30Z</time>
<extensions>
<gpx10:speed>3.0</gpx10:speed>
<ogt10:accuracy>17.0</ogt10:accuracy>
<gpx10:course>192.89999389648438</gpx10:course></extensions>
</trkpt>
<trkpt lat="43.49428702" lon="-112.04265923">
<ele>1433.0</ele>
<time>2012-06-13T02:58:46Z</time>
<extensions> …
Run Code Online (Sandbox Code Playgroud)

python perl extract gpx

10
推荐指数
3
解决办法
1万
查看次数

从String中提取X和Y坐标

我从CCString中提取b2vec2坐标时遇到问题,这些坐标来自cocos2dx和box2d.

我尝试过使用strtk,但我无法使用它

任何帮助都会很棒.

谢谢

字符串的布局是"x,yx,yx,y"我想将x和y放入b2vec2的数组中

string extract box2d cocos2d-x

10
推荐指数
1
解决办法
255
查看次数

SQL - 按单词开头搜索

我想编写一个SQL SERVER语句,用于搜索以某些内容开头的字符串中单词的开头.

例如,如果我在公司记录中搜索'em',我应该得到:

艾米莉公司

艾美奖

忘记他们

Lemming,LLC

我可以通过将字符串提取/切片成数组并搜索每个单词的开头来在PHP中完成此操作.但是如何在不借助存储过程/函数的情况下在SQL服务器中编写此查询?

sql extract

10
推荐指数
1
解决办法
3万
查看次数

PHP如何在没有索引的情况下提取键和值数组

我想提取一个数组(带有键和值的原始数组).在我提取数组后,我想要两个新数组(第一个数组只是键,另一个数组只是值)和两个没有索引的数组(参见代码示例)

// original array 
$array = array(
    "name1"=>500
   ,"name2"=>400
   ,"name3"=>300
   ,"name4"=>200
   ,"name5"=>100
);

// after extraction
$array1 = array('name1','name2','name3','name4','name5');
$array2 = array(500,400,300,200,100);

// not like this
// $array1 = array(0=>'name1',1=>'name2',2=>'name3',3=>'name4',4=>'name5);
// $array2 = array(0=>500,1=>400,2=?300,3=>200,4=>100);
Run Code Online (Sandbox Code Playgroud)

php arrays extract

10
推荐指数
2
解决办法
3万
查看次数

截断文本块末尾的HTML内容(块元素)

主要是当我们缩短/截断文本内容时,我们通常只是在特定字符索引处截断它.无论如何,HTML已经很复杂,但我想div使用不同的措施截断我的HTML内容(使用内容可编辑生成):

  1. 我将定义N将用作截断起始点限制的字符索引
  2. 算法将检查内容是否至少为N字符长(仅文本;不计算标签); 如果不是,它将只返回整个内容
  3. 然后,它将从检查N-XN+X字符位置(文字只)并搜索块的节点的端部; X是预定义的偏移值,可能N/5N/4;
  4. 如果多个块节点在此范围内结束,则算法将选择最接近限制索引的那个节点 N
  5. 如果没有块节点在此范围内结束,则它将在相同范围内找到最接近的字边界,并选择最接近N并在该位置截断的索引.
  6. 使用有效的HTML返回截断的内容(所有标记在结尾处关闭)

我的内容可编辑生成的内容可能包含段落(带换行符),预先格式化的代码块,块引号,有序和无序列表,标题,粗体和斜体(它们是内联节点,不应计入截断过程)等.实现当然会定义哪些元素特别是可能的截断候选者.标题即使它们是块HTML元素也不会被视为截断点,因为我们不需要寡居标题.段落,列出单个项目,整个有序和无序列表,块引号,预格式化块,无效元素等都是好的.标题和所有内联块元素都不是.

让我们把这个stackoverflow问题作为我想要截断的HTML内容的一个例子.我们将截断限制设置为1000,偏移量为250个字符(1/4).

此DotNetFiddle显示此问题的文本,同时还在其中添加限制标记(|MIN|表示字符750,|LIMIT|表示字符1000 |MAX|,表示字符1250).

从示例中可以看出,两个块节点与字符1000之间最接近的截断边界</OL>和之间P(我的内容可编辑生成...).这意味着我的HTML应该在这两个标记之间被截断,这将导致内容文本明智地少于1000个字符,但保持截断的内容有意义,因为它不会在某些文本段落的某个地方截断.

我希望这能解释事情应该如何与这个算法相关.

问题

我在这里看到的第一个问题是我正在处理像HTML这样的嵌套结构.我还必须检测不同的元素(只有块元素,没有内联元素).最后但并非最不重要的是,我将只计算字符串中的某些字符并忽略那些属于标记的字符.

可能的解决方案

  1. 我可以通过创建表示内容节点及其层次结构的对象树来手动解析我的内容
  2. 我可以将HTML转换为更容易管理的内容,如markdown,然后只需搜索最接近我提供的索引的新行N并转换回HTML
  3. 使用类似HTML Agility Pack的东西,用它替换我的#1解析,然后以某种方式使用XPath来提取块节点并截断内容

第二个想法

  • 我确信我可以通过做#1做到这一点,但感觉我正在重新发明轮子.
  • 我不认为#2有任何C#库,所以我也应该手动对Markdown进行HTML操作,或者将pandoc作为外部进程运行.
  • 我可以使用HAP,因为它非常适合操作HTML,但我不确定我的截断是否足够简单.我担心在我的自定义代码中,大部分处理仍然在HAP之外

如何处理这种截断算法?我的头似乎太累了,无法达成共识(或解决方案).

html c# truncate extract

10
推荐指数
1
解决办法
966
查看次数

如何从C#中的HTML文件中提取图像URL

任何人都可以通过解释如何从C#中的HTML文件中提取图像URL来帮助我

.net html c# parsing extract

9
推荐指数
1
解决办法
9574
查看次数

标签 统计

extract ×10

c# ×2

html ×2

java ×2

.net ×1

archive ×1

arrays ×1

box2d ×1

cakephp ×1

cakephp-2.0 ×1

cocos2d-x ×1

distinct ×1

download ×1

eclipse ×1

find ×1

gpx ×1

interface ×1

list ×1

parsing ×1

perl ×1

php ×1

python ×1

r ×1

sql ×1

string ×1

tar ×1

truncate ×1