以下面的例子为例:
>>> df1 = pd.DataFrame({"x":[1, 2, 3, 4, 5],
"y":[3, 4, 5, 6, 7]},
index=['a', 'b', 'c', 'd', 'e'])
>>> df2 = pd.DataFrame({"y":[1, 3, 5, 7, 9],
"z":[9, 8, 7, 6, 5]},
index=['b', 'c', 'd', 'e', 'f'])
>>> pd.concat([df1, df2], join='inner')
Run Code Online (Sandbox Code Playgroud)
输出是:
y
a 3
b 4
c 5
d 6
e 7
b 1
c 3
d 5
e 7
f 9
Run Code Online (Sandbox Code Playgroud)
由于axis=0是列,我认为concat()只考虑在两个数据帧中找到的列.但是,实际输出会考虑在两个数据帧中找到的行.
axis参数的确切含义是什么?
很难找到有关{:}在线的信息我在下面看到了一些代码:
def dateformat(date):
day, month, year=date.split('/')
return "{:4d}{:02d}{:02d}".format(int(year),int(month),int(day))
Run Code Online (Sandbox Code Playgroud)
我有点知道它正在0以格式填充领先,但我不知道做什么'02'和'd'在{:02d}做什么?
例如,我有一个列表:
L=[-13, -24, -21, -3, -23, -15, -14, -27, -13, -12]
Run Code Online (Sandbox Code Playgroud)
如果在%timeit -n 10 myList = [item for item in L if item < 15]
输出中键入10 loops, best of 3: 1.25 µs per loop
如果我输入myGen = (item for item in L if item < 15)
输出是1000000 loops, best of 3: 561 ns per loop
在情况2中,我不明白为什么生成器需要1000000个循环而不是10个循环?“ 3中最佳”是什么意思?我如何算出每个公共区域所需的总秒数,例如案例1的10 * 1.25 = 12.5 us?