如何创建具有重复字符串值的数据框列？

Question

如何创建具有重复字符串值的数据框列？

Kat*_*e R 5 python string dataframe pandas

我正在从一堆文件中读取数据并将其存储在数据框中。我想要数据框的一列来指示数据来自哪个文件。如何创建一个反复重复相同字符串的列，而无需手动输入？

我读入的每个文件都有大约 100 个数据点（但每次的数量不同）。当我读入每个数据时，我将沿着 axis=0 连接到数据帧。它应该看起来像这样。

import numpy as np
import pandas as pd
numbers = np.random.randn(5) # this data could be of any length, ~100
labels = np.array(['file01','file01','file01','file01','file01']) 
tf = pd.DataFrame()
tf['labels'] = labels
tf['numbers'] = numbers

In [8]: tf
Out[8]: 
   labels   numbers
0  file01 -0.176737
1  file01 -1.243871
2  file01  0.154886
3  file01  0.236653
4  file01 -0.195053

Run Code Online (Sandbox Code Playgroud)

（是的，我知道我可以将“file01”设为列标题并沿 axis=1 附加每个列标题，但有一些原因我不想这样做。）

Answer 1

Fla*_*ois 4

好了，您的代码已修复！实际上，您可以将单个值放入 DataFrame 构造函数中使用的字典中:)。

import numpy as np
import pandas as pd
filename = 'file01'
numbers = np.random.randn(5) # this data could be of any length, ~100
tf = pd.DataFrame({'labels': filename , 'numbers': numbers})

In [8]: tf
Out[8]: 
   labels   numbers
0  file01 -0.176737
1  file01 -1.243871
2  file01  0.154886
3  file01  0.236653
4  file01 -0.195053

Run Code Online (Sandbox Code Playgroud)

归档时间：	10 年前
查看次数：	10322 次
最近记录：	10 年前