我是一名想要学习正则表达式的 Python 用户,我在 Udemy 上有一门很好的课程,似乎还可以。然而,它既不是 Python 课程也不是 Python 正则表达式课程。
正则表达式在任何编程语言上都一样吗?
我的意思是它们会相同并使用与repython 中的包完全相同的语法吗?
我有一个小型的csv,具有来自英国伯明翰的6个坐标。我用熊猫阅读了csv,然后将其转换为GeoPandas DataFrame,并使用Shapely Points更改了我的纬度和经度列。我现在正在尝试绘制我的GeoDataframe,我所能看到的就是要点。如何获得伯明翰地图?一个有关GeoPandas的良好文档来源也将受到高度赞赏。
from shapely.geometry import Point
import geopandas as gpd
import pandas as pd
df = pd.read_csv('SiteLocation.csv')
df['Coordinates'] = list(zip(df.LONG, df.LAT))
df['Coordinates'] = df['Coordinates'].apply(Point)
# Building the GeoDataframe
geo_df = gpd.GeoDataFrame(df, geometry='Coordinates')
geo_df.plot()
Run Code Online (Sandbox Code Playgroud) 每当我同时使用 StandardScaler 和 OnehotEncoding 时,我都无法使用剩余='passthrough' 。不管我怎么说,我都有一个问题。它要么是参数之前的关键字,要么是fit_tranform的问题......你能想到的。这是我正在做的事情:
trans_cols= make_column_transformer((OneHotEncoder(),['job', 'marital', 'education',
'default','housing','loan','contact','month','poutcome']),remainder='passthrough')
trans_cols.fit_transform(X)
here are my columns:
Index(['age', 'job', 'marital', 'education', 'default', 'balance', 'housing',
'loan', 'contact', 'month', 'duration', 'campaign', 'pdays', 'previous',
'poutcome', 'y'],
dtype='object')
Run Code Online (Sandbox Code Playgroud)
上面的代码有效,我只是在使用余数键参数时无法组合两个估计器。这就是我尝试的原因:
trans_cols= make_column_transformer((OneHotEncoder(),['job', 'marital', 'education', 'default','housing','loan',
'contact','month','poutcome']),remainder='passthrough',
(StandardScaler(),['age', 'job', 'marital', 'education', 'default', 'balance',
'housing','loan', 'contact', 'month', 'duration',
'campaign', 'pdays', 'previous','poutcome']))
Run Code Online (Sandbox Code Playgroud)
remainder但是,在我删除并保留 2 个元组之前,上述方法不起作用。这是可以理解的。然而,这样做它试图对我的一些数字进行编码,并且我收到一条消息,告诉它遇到了一些具有浮动的列。而且我的准确性严重下降。