我正在尝试根据值是否在列中多次出现来创建一个新的数据框。
Parcel Permit Town
123Q ABC BLD
1000 A45 BLD
9999 G5R BLD
123Q LK9 BLD
123Q Q2W BLD
Run Code Online (Sandbox Code Playgroud)
所以我的目标是创建一个数据框来提取包裹号 123Q。
我正在尝试扫描目录以及其中的所有子文件夹和文件。我还想提取每个文件夹和文件的文件大小。我对最好的技术有点困惑。这是我到目前为止所拥有的。总目录输出不正确,总文件夹大小也不正确。
import os
import pandas as pd
import time
from pathlib import Path
# sets the display so that when the code prints, it is readable
pd.set_option('display.max_rows', 3000)
pd.set_option('display.max_columns', 10)
pd.set_option('display.width', 3000)
# Initialize the dataframe
col_names = ['directory', 'file name', 'file size', 'file date', 'total in directory', 'total in folder']
files = pd.DataFrame(columns=col_names)
dir_path = Path('G:/OM/Permits')
for dirpath, dirnames, filenames in os.walk(dir_path):
print(dirpath)
files.loc[dirpath, 'directory'] = dirpath
total_file = sum(os.path.getsize(f) for f in os.scandir(dirpath) if os.path.isfile(f))
files.loc[total_file, 'total in …Run Code Online (Sandbox Code Playgroud)