我知道可以在Hadoop上使用python语言.
但是有可能在Hadoop上使用scikit-learn的机器学习算法吗?
如果答案是否定的,是否有一些python和Hadoop的机器学习库?
谢谢你的帮助.
我想做以下事情
FROM if(... = ...,
table_date_range(mytable, timestamp('2017-01-01'), timestamp('2017-01-17')),
table_date_range(mytable, timestamp('2016-01-01'), timestamp('2016-01-17'))
)
Run Code Online (Sandbox Code Playgroud)
BigQuery 允许这种操作吗?
我有一个包含这样的条目的文件:
1,1,07 2012,07 2013,11,blablabla
Run Code Online (Sandbox Code Playgroud)
两个第一个字段是ID.第三个是开始日期(月份),第四个是结束日期.第五个字段是这两个日期之间的月数.最后一个字段包含文本.
这是我的猪代码加载这些数据:
f = LOAD 'file.txt' USING PigStorage(',') AS (id1:int, id2:int, date1:chararray, date2:chararray, duration:int, text:chararray);
Run Code Online (Sandbox Code Playgroud)
我想过滤我的文件,以便我只保留date2从今天起不到三年的条目.猪可能吗?
谢谢.