我有一个数据集,其中类是不平衡的.类为'1'或'0',其中类'1':'0'的比例为5:1.你如何计算每个类的预测误差和相应的重新平衡权重在sklearn中随机森林,类似于以下链接:http: //www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm#平衡
python classification machine-learning random-forest scikit-learn
import datetime
import pandas.io.data
sp = pd.io.data.get_data_yahoo('^IXIC',start = datetime.datetime(1972, 1, 3),
end = datetime.datetime(2010, 1, 3))
Run Code Online (Sandbox Code Playgroud)
我已经使用了上面的示例,但是当我想每周拉一次时,它只会将DAILY数据拉入数据帧.它似乎没有get_data_yahoo一个参数,您可以选择从每日,每周或每月,如雅虎本身提供的选项.您知道的任何其他包或想法可能会促进这一点吗?