Cha*_*arr 5 python csv dataframe python-2.7 pandas
我已经彻底搜索过,但找不到我在这个问题上寻找的指导,所以我希望这个问题不是多余的。我有几个代表光栅图像的 .csv 文件。我想对它们进行一些统计分析,所以我尝试为每个文件创建一个 Pandas 数据框,这样我就可以对它们进行切片并绘制它们......但我在循环文件列表时遇到问题为每个文件创建一个具有有意义名称的 DF。
这是我到目前为止所拥有的:
import glob
import os
from pandas import *
#list of .csv files
#I'd like to turn each file into a dataframe
dataList = glob.glob(r'C:\Users\Charlie\Desktop\Qvik\textRasters\*.csv')
#name that I'd like to use for each data frame
nameList = []
for raster in dataList:
path_list = raster.split(os.sep)
name = path_list[6][:-4]
nameList.append(name)
#zip these lists into a dict
dataDct = {}
for k, v in zip(nameList,dataList):
dataDct[k] = dataDct.get(k,"") + v
dataDct
Run Code Online (Sandbox Code Playgroud)
所以现在我有一个字典,其中键是我想要的每个数据帧的名称,值是 read_csv(path) 的路径:
{'Aspect': 'C:\\Users\\Charlie\\Desktop\\Qvik\\textRasters\\Aspect.csv',
'Curvature': 'C:\\Users\\Charlie\\Desktop\\Qvik\\textRasters\\Curvature.csv',
'NormalZ': 'C:\\Users\\Charlie\\Desktop\\Qvik\\textRasters\\NormalZ.csv',
'Slope': 'C:\\Users\\Charlie\\Desktop\\Qvik\\textRasters\\Slope.csv',
'SnowDepth': 'C:\\Users\\Charlie\\Desktop\\Qvik\\textRasters\\SnowDepth.csv',
'Vegetation': 'C:\\Users\\Charlie\\Desktop\\Qvik\\textRasters\\Vegetation.csv',
'Z': 'C:\\Users\\Charlie\\Desktop\\Qvik\\textRasters\\Z.csv'}
Run Code Online (Sandbox Code Playgroud)
我的直觉是尝试以下变体:
for k, v in dataDct.iteritems():
k = read_csv(v)
Run Code Online (Sandbox Code Playgroud)
但这给我留下了一个数据帧 'k' ,它填充了循环读取的最后一个文件中的数据。
我可能在这里遗漏了一些基本的东西,但我开始在这方面旋转我的轮子,所以我想我会问你们......任何想法都表示赞赏!
干杯。
您是否试图在字典中单独获取所有数据帧,每个键一个数据帧?如果是这样,这将为您留下您显示的字典,但会包含每个键中的数据。
dataDct = {}
for k, v in zip(nameList,dataList):
dataDct[k] = read_csv(v)
Run Code Online (Sandbox Code Playgroud)
现在,您可以这样做:
dataDct['SnowDepth'][['cola','colb']].plot()
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1962 次 |
| 最近记录: |