我有一个看起来像这样的大数据框(并且可以复制粘贴df=pd.read_clipboard(sep='\s\s+'):
user_nm month unique_ips shifted_ips halves quarters mo_pairs
100118231 2 set([142.136]) set([]) h1 q1 p1
100118231 3 set([142.136]) set([142.136]) h1 q1 p2
100118231 6 set([108.0]) set([142.136]) h1 q2 p3
100118231 7 set([108.0]) set([108.0]) h2 q3 p4
100118231 8 set([142.136]) set([108.0]) h2 q3 p4
100118231 9 set([142.136]) set([142.136]) h2 q3 p5
100118231 10 set([142.136]) set([142.136]) h2 q4 p5
100118231 11 set([142.136]) set([142.136]) h2 q4 p6
100406016 3 set([50.192]) set([]) h1 q1 p2
100406016 7 set([50.192]) set([50.192]) h2 q3 p4 …Run Code Online (Sandbox Code Playgroud) 我有一个小包,它有一些依赖项,例如 pandas 和 gensim。文件结构是这样的
/package
__init__.py
agg_clean.py
Run Code Online (Sandbox Code Playgroud)
在__init__.py文件中,我有import agg_clean所以我能够以链接的方式访问这些功能,例如:
import package as pkg
pkg.agg_clean.function()
Run Code Online (Sandbox Code Playgroud)
但是,我在agg_clean.py,(pandas、os 等)中有几个导入语句。当我像上面那样进行链式导入时,我也可以访问 中的导入agg_clean,例如pkg.agg_clean.os.listdir()
如何在包导入中隐藏各种模块的导入?
我试图在一周的时间内随机抽样随机条目。为了确保平日和周末条目的平衡,我草拟了 2 个单独的 sql 语句,如下所示:
select * FROM admin.acct_activity
where RANDOM() <=1
--weekday
and extract(day from page_hit_ts) Between 6 and 10
limit 500
UNION all
SELECT *
FROM admin.acct_activity
where RANDOM() <=1
--weekend
and extract(day from page_hit_ts) Between 11 and 12
limit 200
/* to-do
1. limit results for each query
2. order query results by date*/
Run Code Online (Sandbox Code Playgroud)
错误信息是:
"all" (at char 121) expecting a keyword (State:42000, Native Code: 1B)
Run Code Online (Sandbox Code Playgroud)
这是在 Netezza SQL (NZSQL)
第一个 select 语句中的 limit 语句似乎导致了错误。有小费吗?