我在一个文件夹中有几个csv文件,我想在一个数据框中打开它们并插入一个带有相关文件名的新列.到目前为止,我编写了以下代码:
import pandas as pd
import glob, os
df = pd.concat(map(pd.read_csv, glob.glob(os.path.join('path/*.csv'))))
df['filename']= os.path.basename(csv)
df
Run Code Online (Sandbox Code Playgroud)
这给了我想要的数据帧但是在新列'filename'中它只列出了每行的文件夹中的最后一个文件名.我正在寻找每一行用它的相关csv文件填充.不只是文件夹中的最后一个文件.
对这位新手的任何帮助都非常感谢.
我有一个名为 eq 的地震数据数据框,其中列出了纬度和经度的列。使用 geopandas 我创建了一个点列,内容如下:
from geopandas import GeoSeries, GeoDataFrame
from shapely.geometry import Point
s = GeoSeries([Point(x,y) for x, y in zip(df['longitude'], df['latitude'])])
eq['geometry'] = s
eq.crs = {'init': 'epsg:4326', 'no_defs': True}
eq
Run Code Online (Sandbox Code Playgroud)
现在我有一个带有经纬度坐标的几何列,但我想将投影更改为 UTM。任何人都可以帮助转型吗?