我正在寻找进行随机分层抽样的最佳方法,例如调查和民意调查。我不想做 sklearn.model_selection.StratifiedShuffleSplit 因为我没有做监督学习而且我没有目标。我只想从 Pandas DataFrame ( https://www.investopedia.com/terms/stratified_random_sampling.asp )创建随机分层样本。
Python是我的主要语言。
感谢您的任何帮助
我不明白为什么这段代码不起作用。数据是虚构的,我只希望能够使用plotly进行时间序列可视化。
这个模块曾经在Kaggle内核中为我工作:
https://www.kaggle.com/aubertsigouin/organizing-macrohistorical-datasets/data
奇怪的是,我无法使其再次运行。它说“ AttributeError:模块'plotly'没有属性'plotly'»。
有小费吗 ?
import plotly
import plotly.graph_objs as go
from plotly import tools
from plotly.offline import init_notebook_mode, plot, iplot
init_notebook_mode()
import pandas as pd
import numpy as np
data = []
array_of_time = pd.to_datetime(np.arange('2013-01-01', '2013-03-01', dtype='datetime64[M]'))
raw_data = [[20,29], [30,33]]
trace_1 = go.Scatter(
x=array_of_time,
y=raw_data[0],
name = 'data_1',
line = dict(color = '#aeb9ba'),
opacity = 0.8
)
trace_2 = go.Scatter(
x=array_of_time,
y=raw_data[1],
name = 'data_2',
line = dict(color = '#ffd800'),
opacity = 0.8
)
data.append(trace_1)
data.append(trace_2) …Run Code Online (Sandbox Code Playgroud)