小编Jam*_*len的帖子

u'\ ufeff'在Python字符串中

我得到了以下模式的错误:

UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128)

Run Code Online (Sandbox Code Playgroud)

不知道是什么u'\ufeff',它在网络抓取时显示出来.我该如何纠正这种情况？该.replace()字符串的方法不能进行这项工作.

python unicode utf-8

Jam*_*len

2018 04-10

109
推荐指数

3
解决办法

13万
查看次数

Python检查网站是否存在

我想检查某个网站是否存在,这就是我正在做的事情:

user_agent = 'Mozilla/20.0.1 (compatible; MSIE 5.5; Windows NT)'
headers = { 'User-Agent':user_agent }
link = "http://www.abc.com"
req = urllib2.Request(link, headers = headers)
page = urllib2.urlopen(req).read() - ERROR 402 generated here!

Run Code Online (Sandbox Code Playgroud)

如果页面不存在(错误402,或其他任何错误),我该怎么做page = ...才能确保我正在阅读的页面退出？

html python urlopen

Jam*_*len

2013 05-28

50
推荐指数

7
解决办法

9万
查看次数

使用BeautifulSoup Python在标签内搜索

我想在标签内搜索:

<div id="cmeProductSlatePaginiationTop" class="cmePaginiation">
   <ul>
      <li class="disabled">
      <li class="active">
      <li class="away-1">
      <li>
   </ul>
</div>

Run Code Online (Sandbox Code Playgroud)

基本上,我想计算<li ..>这个div中的出现次数.但是,当我使用beautifulsoup时,我无法获得之间的标签div

    soup = BeautifulSoup(resp)
    tags = soup.find('div', attrs = {'class' : 'cmePaginiation'})
    print tags

Run Code Online (Sandbox Code Playgroud)

>>> <div id="cmeProductSlatePaginiationTop" class="cmePaginiation"> </div>

有没有办法计算li(在这个例子4中)的实例数？

html python beautifulsoup

Jam*_*len

lucky-day

9
推荐指数

1
解决办法

2万
查看次数

使用 lxml xpath 解析

我试图实现一个lxml, xpath代码来解析链接中的 html：https://www.theice.com/productguide/ProductSpec.shtml?specId=251 具体来说，我试图解析<tr class="last">页面末尾附近的表格。

我想获取该子表中的文本，例如：“纽约”及其旁边列出的时间（对伦敦和新加坡执行相同的操作）。

我有以下代码（无法正常工作）：

doc = lxml.html.fromstring(page)
tds = doc.xpath('//table[@class="last"]//table[@id"tradingHours"]/tbody/tr/td/text()')

Run Code Online (Sandbox Code Playgroud)

与美丽汤：

table = soup.find('table', attrs={'id':'tradingHours'})
for td in table.findChildren('td'):
    print td.text

Run Code Online (Sandbox Code Playgroud)

实现这一目标的最佳方法是什么？我想使用lxmlnot beautifulSoup（只是为了看看区别）。

python parsing lxml

Jam*_*len

2013 07-31

3
推荐指数

1
解决办法

2265
查看次数

在python中搜索列表中的mutliple值

假设我有一个列表:

items = ['matt', 'zen', 'a', 'b', 'c', 'cat', 'dog']

if elem in items 
`if 'a' 'b' 'c' found then return 1

Run Code Online (Sandbox Code Playgroud)

每当elem在列表中找到'a','b','c'并返回一个值.有没有办法以list这种方式定义？我不希望有多个if条件(如果可以避免的话).

python string list

Jam*_*len

2013 07-30

2
推荐指数

1
解决办法

75
查看次数

正则表达式读取标签Python

我想用regex读取标签内的元素,例如:

<td>Stuff Here</td>
<td>stuff 
</td>

Run Code Online (Sandbox Code Playgroud)

我使用以下内容: re.findall(re.compile('<td>(.*)</td>'), str(line).strip())

为什么我可以阅读第一个<td>标签,但不是第二个？

html python regex tags

Jam*_*len

2013 06-17

2
推荐指数

1
解决办法

167
查看次数

如果语句在lambdas Python中

我想if在lambda函数内声明一个语句:

假设:

cells = ['Cat', 'Dog', 'Snake', 'Lion', ...]
result = filter(lambda element: if 'Cat' in element, cells)

Run Code Online (Sandbox Code Playgroud)

是否有可能将'猫'过滤掉result？

python

Jam*_*len

lucky-day

2
推荐指数

1
解决办法

366
查看次数

templates <int T> C++

定义模板意味着什么template <int N>,我从书中的一个例子中读到这个:

typedef map<int, double> row;
template <int N> struct matrix;
{
   map <int, row> my_matrix;
}

Run Code Online (Sandbox Code Playgroud)

我经常看到模板,然后是类,然后输入,即 template <class int>

c++ templates

Jam*_*len

lucky-day

2
推荐指数

1
解决办法

3934
查看次数

加入列表元素:Python

假设我有以下列表:

x = ['a', '\n', 'b', '\n', 'c', '\n', '\n', 'd']

Run Code Online (Sandbox Code Playgroud)

如何使用该''.join()函数忽略换行符并获取'abcd'？

python string list

Jam*_*len

2014 05-09

1
推荐指数

1
解决办法

420
查看次数

在正则表达式Python中捕获$

我试图在一条线上捕获美元金额:

例如: blah blah blah (blah $23.32 blah) blah blac (blah) 我想拍摄"$ 23.32"

这就是我正在使用的:r'?([\$][.*]+)'

我告诉它找到一个(...)的出现？然后我告诉它找到一个以"$"开头的东西和任何可能出现的字符(所以我也可以得到小数点).

但是,我得到了一个错误 error: nothing to repeat

python regex

Jam*_*len

lucky-day

1
推荐指数

1
解决办法

125
查看次数

Python [[...]]中的字符串

我有一个以这种格式表示的字符串:

[[u'This is a string']], what does this mean??

Run Code Online (Sandbox Code Playgroud)

我怎么能把它变成:

[u'This is a string']

Run Code Online (Sandbox Code Playgroud)

要么

['This is a string']

Run Code Online (Sandbox Code Playgroud)

python string

Jam*_*len

lucky-day

0
推荐指数

2
解决办法

85
查看次数

在linux中存储一个变量

我试图variables在我的bash shell中创建,我可以随时使用它.更具体地说,我想创建一个可以存储文件夹路径的变量,例如:

mypath = `pwd`

Run Code Online (Sandbox Code Playgroud)

但是,我无法做到以下几点:

cd $ mypath

我该如何解决这个问题？此外,我想存储此变量,以便我可以在重新启动系统后使用.我将它存储在.bashrc文件中吗？

linux bash shell

Jam*_*len

lucky-day

0
推荐指数

1
解决办法

97
查看次数

一行复制构造函数

通过创建复制构造函数的方式,我遇到了这个例子:

class MyClass 
{
      int x;
      char c;
      std::string s;
};

Run Code Online (Sandbox Code Playgroud)

由编译器复制为:

 MyClass::MyClass( const MyClass& other ) : x( other.x ), c( other.c ), s( other.s )
  {}

Run Code Online (Sandbox Code Playgroud)

: x( other.x )...与函数标题行在同一行中的含义是什么？它是如何工作的？

c++ class function

Jam*_*len

2014 06-30

0
推荐指数

1
解决办法

426
查看次数

标签统计

python ×10

html ×3

string ×3

c++ ×2

list ×2

regex ×2

bash ×1

beautifulsoup ×1

class ×1

function ×1

linux ×1

lxml ×1

parsing ×1

shell ×1

tags ×1

templates ×1

unicode ×1

urlopen ×1

utf-8 ×1

标签 统计

小编Jam_len的帖子

标签统计