我正在学习制作网络抓取工具,并希望抓住TripAdvisor的个人项目,使用urllib2抓取html.但是,我遇到了一个问题,使用下面的代码,我回来的html是不正确的,因为页面似乎需要一秒钟重定向(你可以通过访问网址验证这一点) - 而是我得到的代码从最初短暂出现的页面.
是否有一些行为或参数要设置以确保页面在获取网站内容之前已完全加载/重定向?
import urllib2
from bs4 import BeautifulSoup
bostonPage = urllib2.urlopen("http://www.tripadvisor.com/HACSearch?geo=34438#02,1342106684473,rad:S0,sponsors:ABEST_WESTERN,style:Szff_6")
soup = BeautifulSoup(bostonPage)
print soup.prettify()
Run Code Online (Sandbox Code Playgroud)
编辑:答案是彻底的,但是,最终解决了我的问题是:https: //stackoverflow.com/a/3210737/1157283
我正在尝试使用mount命令将来自计算机的目录安装到我的Windows机器上.
在cygwin中,我尝试了几种变体:
mount machineName:/remote/location/blah /local/location
mount -t nfs machineName:/remote/location/blah /local/location
mount nfs machineName:/remote/location/blah /local/location
mount machineNAme:/remote/location/blah
Run Code Online (Sandbox Code Playgroud)
我已经尝试过切换的参数等等....我要么得到这个消息:mount: can't find brotula in /etc/fstab or in /etc/fstab.d/$USER
或者invalid arguments
.我知道我的路径正确,因为我使用scp就好了.
我究竟做错了什么?谢谢!
我有一个简单的正则表达式问题让我发疯.我有一个变量x = "field1: XXXX field2: YYYY"
.我想要检索YYYY
(请注意,这是一个示例值).我的方法如下:
values = re.match('field2:\s(.*)', x)
print values.groups()
Run Code Online (Sandbox Code Playgroud)
它不匹配任何东西.我能帮忙解决这个问题吗?谢谢!
我正在尝试使用CSS确定格式化两列文本的最佳方法:
(以-----为空格)
dfasfasdfsa ------------ fdafsadfasdfasdf
fdsafadsfaf ------------ fadsdsafasfsaf
fdfgfgdsdffd ----------- fgdhfjshkjahjkh
fdljkgjklkj --------------- jfkldjskafljaf
我可以蛮力定位它,但我敢肯定必须有一个更简单的方法..任何建议?对不起初学者的问题.
抱歉,这个问题可能听起来“主观”,但我认为它应该有一个相当明确的答案。我有一个类“LocationManager”,我想管理我的核心位置逻辑。我有两个选择:
LocationManager 有一个引用 CLLocationManager 实例的强大属性。LocationManager 是 CLLocationManager 的委托,并从中接收位置更新。
LocationManager 是 CLLocationManager 的子类,它表示 self.delegate = self ,以便它可以接收自己的位置更新。
我很好奇这些选项中哪一个被认为是“正确”的事情,我确信一定有一种首选方法。谢谢!
我刚从emacs切换到vim,使用MacVim和Janus.在emacs中,您可以拥有一个仅供shell使用的缓冲区.这可能在MacVim?调试时非常有用.
这也让我问 - 有没有办法在vim中编译类似于emacs:你输入meta-x编译,然后能够点击错误把光标带到相关的行?
我只想弄清楚MacVim的良好工作流程,并想要一个好方法来修复我的错误,而不必排列终端和MacVim并排.任何建议表示赞赏
我正在处理浮动64的货币表示.例如,2.9美元代表2.90美元,所以如果我需要将其转换为货币的最低面额,我只需乘以100(2.9*100 = 290美分).
这适用于大多数主要货币.但是,在日本,例如,float64表示不会有小数,因为Yen已经是最低的表示.如果我得到浮动64(290)日元,如果我试图获得最低面额,则乘以100会得到过多的日元 - 它应保持不变.
除了特殊套管之外,对于某些货币乘以100时,最好的办法是什么?
编辑:我有两条信息是浮动表示和ISO货币代码.
可能重复:
是否可以修改C中的字符串?
#include <stdio.h>
void reverseStr(char *str);
main()
{
reverseStr("abcdef");
}
void reverseStr(char *str) {
char *tmp = str;
char curr;
while (*tmp != '\0') {
tmp++;
}
tmp--;
while (tmp > str) {
curr = *str;
*str = *tmp;
*tmp = curr;
str++;
tmp--;
}
}
Run Code Online (Sandbox Code Playgroud)
当我运行它时,我得到:
/usr/bin/runit/srun_c: line 12: 2809 Segmentation fault /tmp/run_c_executable
Run Code Online (Sandbox Code Playgroud)
到底是怎么回事?我正在练习面试,我在我的C中生锈了,想要练习一些简单但不能为我的生活弄清楚这一点.我注意到当我注释掉这*str = *tmp;
条线时,seg故障消失了,我不明白为什么会导致seg故障.帮助赞赏.