我正在使用熊猫来分析财务记录.
我有一个DataFrame
来自csv文件,看起来像这样:
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 800 entries, 2010-10-27 00:00:00 to 2011-07-12 00:00:00
Data columns:
debit 800 non-null values
transaction_type 799 non-null values
transaction_date_raw 800 non-null values
credit 800 non-null values
transaction_description 800 non-null values
account_number 800 non-null values
sort_code 800 non-null values
balance 800 non-null values
dtypes: float64(3), int64(1), object(4)
Run Code Online (Sandbox Code Playgroud)
我根据交易金额选择了一个子集:
c1 = df['credit'].map(lambda x: x > 1000)
milestones = df[c1].sort()
Run Code Online (Sandbox Code Playgroud)
并希望根据里程碑之间的日期创建原始df的切片:
delta = dt.timedelta(days=1)
for i in range(len(milestones.index)-1):
start = milestones.index[i].date()
end = milestones.index[i+1].date() - delta
rng …
Run Code Online (Sandbox Code Playgroud) 我正在尝试抓一个页面(我的路由器的管理页面),但该设备似乎正在为urllib2提供与我的浏览器不同的页面.以前有人发现过这个吗?我怎么能绕过它呢?
这个我正在使用的代码:
>>> from BeautifulSoup import BeautifulSoup
>>> import urllib2
>>> page = urllib2.urlopen("http://192.168.1.254/index.cgi?active_page=9133&active_page_str=page_bt_home&req_mode=0&mimic_button_field=btn_tab_goto:+9133..&request_id=36590071&button_value=9133")
>>> soup = BeautifulSoup(page)
>>> soup.prettify()
Run Code Online (Sandbox Code Playgroud)
(通过降价删除html输出)