需要应用程序的文件系统元数据层

Ken*_*Far 5 python metadata file

我正在寻找一个位于文件之上的元数据层,它可以解释文件名中信息的键值对,以便处理数千个文件.更多信息:

  • 这些不一定是具有内置元数据的媒体文件 - 因此是键值对.
  • 元数据超出了os信息(文件大小等) - 到应用程序放入键值的任何内容.
  • 它应该可以通过命令行和python模块访问,以便我的应用程序可以与它通信.
  • 增加:它还应该受到常见的os命令(cp,mv,tar等)的支持,以便在复制或移动文件时不会丢失.

我想要的功能包括:

  • 列出目录x中的文件,用于organization_id 3375
  • 通过将load_time转换为年/月并显示每年/每月组合的文件计数和大小来报告目录y中的文件
  • 根据加载时间的关键字在目录z中获取最旧的文件

嵌入了这些简单元数据的文件可能如下所示:

  • bowling_state-ky_league-15_game-8_gametime-201209141830.tgz
  • bowling_state-ky_league-15_game-9_gametime-201209141930.tgz

此元数据非常易于访问并与文件紧密连接.但是 - 我宁愿避免在所有操作中使用切割卡或外卡.

我环顾四周,只能找到媒体和操作系统元数据解决方案,如果它已经存在,就不想构建它.

Han*_*hen 3

您看过扩展文件属性吗?请参阅: http: //en.wikipedia.org/wiki/Extended_file_attributes

基本上,您将键值对存储为文件系统本身中以零结尾的字符串。您可以从命令行设置这些属性,如下所示:

$ setfattr -n user.comment -v "this is a comment" testfile
$ getfattr testfile
# file: testfile
user.comment
$ getfattr -n user.comment testfile
# file: testfile
user.comment="this is a comment"
Run Code Online (Sandbox Code Playgroud)

要从 python 设置和查询扩展文件系统属性,您可以尝试 python 模块 xattr。请参阅: http: //pypi.python.org/pypi/xattr

编辑 大多数文件系统操作命令(例如 cp、mv 和 tar)通过添加命令行标志来支持扩展属性。例如 cp -a 或 tar --xattr。您可能需要使这些命令透明地工作。(您可能有一些用户不知道您的扩展属性。)在这种情况下,您可以创建一个别名,例如alias cp="cp -a"。