小编Aja*_*air的帖子

使用python读取动态生成的网页

我正在尝试使用python和美丽的汤刮一个网站.我在某些网站遇到过,虽然在浏览器上看到的图片链接在源代码中无法看到.但是,在使用Chrome Inspect或Fiddler时,我们可以看到相应的代码.我在源代码中看到的是:

<div id="cntnt"></div>
Run Code Online (Sandbox Code Playgroud)

但是在Chrome Inspect上,我可以看到在这个div类中生成的一大堆HTML\CSS代码.有没有办法在python中加载生成的内容?我在python中使用常规urllib,我可以获取源但没有生成的部分.

我不是网络开发者,因此我无法用更好的术语表达这种行为.如果我的问题看起来模糊,请随时澄清!

python web-scraping

23
推荐指数
2
解决办法
4万
查看次数

用awk替换正则表达式

我正在尝试编写一个正则表达式来用一个空格替换文件中存在的一个或多个"+"符号.我尝试了以下方法:

 echo This++++this+++is+not++done | awk '{ sub(/\++/, " "); print }'
 This this+++is+not++done
Run Code Online (Sandbox Code Playgroud)

预期:

This this is not done
Run Code Online (Sandbox Code Playgroud)

任何想法为什么这不起作用?

regex linux awk

14
推荐指数
5
解决办法
3万
查看次数

感兴趣的区域opencv python

我正在尝试使用opencv python获取图像区域(ROI).使用的opencv版本是2.4.3.但是,当我尝试调用API时

cv2.SetImageROI
Run Code Online (Sandbox Code Playgroud)

它返回错误

AttributeError: 'module' object has no attribute 'SetImageROI'
Run Code Online (Sandbox Code Playgroud)

此外,在检查文档时,它似乎表明这个api是一个遗留的python函数. http://docs.opencv.org/2.4.3/search.html?q=setimageroi

我不知道如何在python中使用当前版本的opencv来获得ROI.有人可以建议如何解决这个问题吗?

谢谢

python opencv image-processing

13
推荐指数
3
解决办法
5万
查看次数

OpenCV匹配模板

我试图将我的徽标(模板)与一些图像相匹配.我的图像都是自然色的,我正在使用的方法是使用openCV中的cvMatchTemplate()并在源图像上运行模板(徽标).我将模板缩放到多个级别以找到最佳匹配.请注意,我只是在图像上找到数字印记的徽标,而不是场景中存在的徽标.例如:从这张图片中检测天空运动http://i56.tinypic.com/2v3j3wx.jpg(该图像纯粹用于表示和清晰我的任务,而不是我正在使用的图像

我的图像没有固定的分辨率,因此我将其缩放到标准的800x600.现在当我的源图像分辨率很差时说300x300,结果非常普通.我在模板参数中使用方法= CV_TM_CCOEFF_NORMED,即使是精确匹配的分数也很低(在0到1.0的范围内低至0.4),这使我很难自信地说明徽标是否存在.我有两个问题:

1 - 在opencv模板匹配中,它如何处理彩色图像.我试图从文档中理解,我的推论是它分别计算每个频道的得分,并且最好采取.如果是这样的话我不会更好地考虑所有三个渠道以获得更好的结果

2 - 任何替代方法!! :)

如果有任何事情不清楚,请告诉我!

编辑(附加信息):正如评论中所讨论的,我附加了我目前的匹配技术,即缩放模板匹配.请注意附加的图像纯粹是出于测试目的而不是我正在使用的实际图像集(不能发布,因为图像是proprieotry)源图像从youtube拍摄的屏幕截图 形象标识 来自维基百科 使用模板匹配输出图像 指示最佳匹配的红色块与最高分

尽管模板匹配,但此处获得的分数对于此最佳匹配为0.59.虽然相对来说它是一场比赛的好成绩,但仍然不够好,我无法确定所需的标志是否存在.在我的测试图像中,当屏幕上的徽标是透明的时,它仍会检测到徽标,但得分为0.3-0.4.使用SURF/SIFT可以获得更好的结果吗?

编辑(尝试使用SURF)我试图在opencv官方文档(minHessian = 2000)中运行一个SURF代码作为示例.这里链接 是输出.我不确定如何解释它(2,3点似乎在预期的边界内.这被认为是好的吗?还有什么进一步的建议吗? 在此输入图像描述 谢谢

python opencv image-processing

9
推荐指数
1
解决办法
3697
查看次数

在Windows 7中使用nutch

我试图从Windows环境中使用nutch 1.6,但每次我尝试按照Nutch Tuorial Apache站点中给出的程序运行时,我总是遇到以下异常:

Exception in thread "main" java.io.IOException: Failed to set permissions of path: \tmp\hadoop-ajayn\mapred\staging\ajayn-1231695575\.staging to 0700
Run Code Online (Sandbox Code Playgroud)

我一直在网上广泛搜索,但没有具体的解决方案.请注意,我没有在系统中安装或运行hadoop实例,我的唯一目的是试用nutch作为网络爬行代理.

是否有可能在Windows中运行nutch 1.6,如果是的话,任何关于如何处理它的指针并避免上述异常.

PS:如果它有帮助,/ tmp /文件夹附加了一个只读属性,即使你试图这样做也不会改变.同样来自cygwin我试图设置文件权限777,但每次我尝试运行nutch实例时,都会创建一个新文件夹,例如:"ajayn-1231695575",它没有任何执行权限.

谢谢

阿贾伊

windows cygwin nutch windows-7

6
推荐指数
1
解决办法
1175
查看次数