小编G G*_*cia的帖子

在日期范围切片pandas数据帧

我正在使用熊猫来分析财务记录.

我有一个DataFrame来自csv文件,看起来像这样:

<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 800 entries, 2010-10-27 00:00:00 to 2011-07-12 00:00:00
Data columns:
debit                      800  non-null values
transaction_type           799  non-null values
transaction_date_raw       800  non-null values
credit                     800  non-null values
transaction_description    800  non-null values
account_number             800  non-null values
sort_code                  800  non-null values
balance                    800  non-null values
dtypes: float64(3), int64(1), object(4)

Run Code Online (Sandbox Code Playgroud)

我根据交易金额选择了一个子集:

c1 = df['credit'].map(lambda x: x > 1000)
milestones = df[c1].sort()

Run Code Online (Sandbox Code Playgroud)

并希望根据里程碑之间的日期创建原始df的切片:

delta = dt.timedelta(days=1)
for i in range(len(milestones.index)-1):
        start = milestones.index[i].date()
        end = milestones.index[i+1].date() - delta
        rng …

Run Code Online (Sandbox Code Playgroud)

python time-series pandas

G G*_*cia

2017 01-05

6
推荐指数

1
解决办法

6952
查看次数

urllib2返回浏览器的不同页面？

我正在尝试抓一个页面(我的路由器的管理页面),但该设备似乎正在为urllib2提供与我的浏览器不同的页面.以前有人发现过这个吗？我怎么能绕过它呢？

这个我正在使用的代码:

>>> from BeautifulSoup import BeautifulSoup
>>> import urllib2
>>> page = urllib2.urlopen("http://192.168.1.254/index.cgi?active_page=9133&active_page_str=page_bt_home&req_mode=0&mimic_button_field=btn_tab_goto:+9133..&request_id=36590071&button_value=9133")
>>> soup = BeautifulSoup(page)
>>> soup.prettify()

Run Code Online (Sandbox Code Playgroud)

(通过降价删除html输出)

python screen-scraping urllib2

G G*_*cia

2014 03-18

2
推荐指数

1
解决办法

2439
查看次数