我希望使用pandas和生成基于相关性的树形图scipy.我使用一个DataFrame由返回组成的数据集(作为a ),其大小n x m,n日期m数和公司数.然后我只是运行脚本
import pandas as pd
import matplotlib.pyplot as plt
from scipy.cluster import hierarchy as hc
import numpy as np
m = 5
dates = pd.date_range('2013-01-01', periods=365)
random_matrix = np.random.normal(0, 0.01, size=(len(dates), m))
dataframe = pd.DataFrame(data=random_matrix, index=dates)
z = hc.linkage(dataframe.values.T, method='average', metric='correlation')
dendrogram = hc.dendrogram(z, labels=dataframe.columns)
plt.show()
Run Code Online (Sandbox Code Playgroud)
我得到了一个很好的树状图.现在,问题是除了普通的Pearson相关之外,我还想使用其他相关度量,这是一个pandas通过简单调用而引入的功能DataFrame.corr(method='<method>').所以,我一开始认为只需运行以下代码即可
import pandas as pd
import matplotlib.pyplot as plt
from scipy.cluster import hierarchy as hc …Run Code Online (Sandbox Code Playgroud)