小编sok*_*014的帖子

如何根据从一个数据帧到另一个数据帧的2个键找到最接近的匹配?

我有两个我正在使用的数据帧.一个有一堆位置和坐标(经度,纬度).另一个是天气数据集,其中包含来自世界各地气象站的数据及其各自的坐标.我正在尝试将最近的气象站连接到我的数据集中的每个位置.气象站名称和我的位置名称不匹配.

我试图通过坐标中最接近的匹配来链接它们,并且不知道从哪里开始.

我在考虑使用

np.abs((location['latitude']-weather['latitude'])+(location['longitude']-weather['longitude'])

各自的例子

地点...

Location   Latitude   Longitude Component  \
     A  39.463744  -76.119411    Active   
     B  39.029252  -76.964251    Active   
     C  33.626946  -85.969576    Active   
     D  49.286337   10.567013    Active   
     E  37.071777  -76.360785    Active   
Run Code Online (Sandbox Code Playgroud)

天气...

     Station Code             Station Name  Latitude  Longitude
     US1FLSL0019    PORT ST. LUCIE 4.0 NE   27.3237   -80.3111
     US1TXTV0133            LAKEWAY 2.8 W   30.3597   -98.0252
     USC00178998                  WALTHAM   44.6917   -68.3475
     USC00178998                  WALTHAM   44.6917   -68.3475
     USC00178998                  WALTHAM   44.6917   -68.3475
Run Code Online (Sandbox Code Playgroud)

输出将是位置数据帧上的新列,其中站名是最接近的匹配

但是我不知道如何通过两者来循环来实现这一目标.任何帮助将不胜感激..

谢谢,斯科特

python dataframe pandas

6
推荐指数
1
解决办法
1307
查看次数

使用export graphviz将特征和类名称添加到决策树中

下午好,

我正在研究决策树分类器,但我无法将其可视化.我可以输出决策树,但是我无法将我的功能或类名/标签输入其中.我的数据是一个pandas数据帧格式,然后我移动到一个numpy数组并传递给分类器.我尝试了一些东西,但是当我尝试指定类名时,似乎只是出错了.任何帮助,将不胜感激.代码如下.

all_inputs=df.ix[:,14:].values
all_classes=df['wic'].values

(training_inputs,
 testing_inputs,
 training_classes,
 testing_classes) = train_test_split(all_inputs, all_classes,train_size=0.75, random_state=1)

decision_tree_classifier=DecisionTreeClassifier()
decision_tree_classifier.fit(training_inputs,training_classes)

export_graphviz(decision_tree_classifier, out_file="mytree.dot",  
                     feature_names=??,  
                     class_names=??)  
Run Code Online (Sandbox Code Playgroud)

LIke我说,它运行正常并输出一个决策树,即如果我取出feature_names和class_names参数.我想尽可能将它们包括在输出中并且已经碰壁了......

任何帮助将不胜感激!

谢谢,

斯科特

python decision-tree scikit-learn

4
推荐指数
2
解决办法
7692
查看次数

标签 统计

python ×2

dataframe ×1

decision-tree ×1

pandas ×1

scikit-learn ×1