我的问题与此类似.但对于字符串.
所以我有一个数据帧,每列包含不同长度的字符串.那么,我如何找到每列的最大字符串长度?
然后,如何通过sapply或类似选择长度> 1的列.
数据框的典型列如下所示:
clmn=c("XDX", "GUV", "FQ", "ACUE", "HIT", "AYX", "NFD", "AHBW", "GKQ", "PYF")
Run Code Online (Sandbox Code Playgroud)
谢谢
这是我的代码
import numpy as np
import time
from scipy.spatial import distance
y1=np.array([0,0,0,0,1,0,0,0,0,0])
y2=np.array([0. , 0.1, 0. , 0. , 0.7, 0.2, 0. , 0. , 0. , 0. ])
start_time = time.time()
for i in range(1000000):
distance.sqeuclidean(y1,y2)
print("--- %s seconds ---" % (time.time() - start_time))
Run Code Online (Sandbox Code Playgroud)
---15.212640523910522 秒---
start_time = time.time()
for i in range(1000000):
np.sum((y1-y2)**2)
print("--- %s seconds ---" % (time.time() - start_time))
Run Code Online (Sandbox Code Playgroud)
---8.381187438964844---秒
我认为 Scipy 是经过优化的,所以它应该更快。
任何意见将不胜感激。