我需要在循环中创建字典,并将它们附加到具有匹配的dict关键字名和数据帧的列名的pandas数据帧。每次迭代中字典的键值对可能不同。df_podcast开头已定义了一个空的熊猫数据框,并在字典中使用了所有可能的键。
以下是尚未完成的代码示例
df_podcast=pd.DataFrame(columns=podcast_cols)
podcast_dict={}
for j in range(len(podcast[0])):
if podcast[0][j].tag=="key":
podcast_dict[podcast[0][j].text]=podcast[0][j+1].text
### Have to append dict to pandas df ############
Run Code Online (Sandbox Code Playgroud)
我将podcast_dict附加到df_podcast。播客实际上是列表的列表,这里我只考虑列表的第一行
我有一个带有时间戳数据类型的列“hit_timestamp”的表。下面是一些值。
20-MAR-17 00.00.00.000000000
20-MAR-17 00.03.53.000000000
20-MAR-17 00.01.16.000000000
20-MAR-17 00.07.32.000000000
20-MAR-17 00.18.36.000000000
20-MAR-17 00.16.12.000000000
Run Code Online (Sandbox Code Playgroud)
我想在 10 分钟内分组
time_bucket no_of_records
---------- ---------
"000000_000010" 4
"000011_000020" 2
Run Code Online (Sandbox Code Playgroud)