我有一个大熊猫数据框(大约 150000 行)。我尝试过方法 groupby('id') 但在返回组元组中。我只需要一个数据帧列表,然后将它们转换为 np 数组批次以放入自动编码器(例如https://www.datacamp.com/community/tutorials/autoencoder-keras-tutorial但 1D)
所以我有一个熊猫数据集:
data = {'Name': ['Tom', 'Joseph', 'Krish', 'John', 'John', 'John', 'John', 'Krish'], 'Age': [20, 21, 19, 18, 18, 18, 18, 18],'id': [1, 1, 2, 2, 3, 3, 3, 3]}
# Create DataFrame
df = pd.DataFrame(data)
# Print the output.
df.head(10)
Run Code Online (Sandbox Code Playgroud)
我需要相同的输出(只是一个熊猫数据框列表)。另外,我需要一个未排序列表的列表,这很重要,因为它的时间序列。
data1 = {'Name': ['Tom', 'Joseph'], 'Age': [20, 21],'id': [1, 1]}
data2 = {'Name': ['Krish', 'John', ], 'Age': [19, 18, ],'id': [2, 2]}
data3 = {'Name': ['John', 'John', 'John', 'Krish'], …Run Code Online (Sandbox Code Playgroud)