相关疑难解决方法(0)

看看两个文件在python中是否具有相同的内容

可能重复:
查找重复文件并删除它们.
在Python中,是否有一种简洁的方法来比较两个文本文件的内容是否相同?

在Python中查看两个文件内容是否相同的最简单方法是什么?

我能做的一件事是每个文件md5并进行比较.有没有更好的办法?

python file

45
推荐指数
2
解决办法
8万
查看次数

检测具有不同比特率和/或不同ID3标签的重复MP3文件?

我怎样才能检测到(最好用Python)可以用不同比特率编码的重复MP3文件(但它们是同一首歌)和可能不正确的ID3标签?

我知道我可以对文件内容进行MD5校验和,但这对于不同的比特率不起作用.我不知道ID3标签是否对生成MD5校验和有影响.我应该重新编码具有不同比特率的MP3文件,然后我可以进行校验和吗?您有什么推荐的吗?

python mp3 id3 file duplicates

12
推荐指数
2
解决办法
1万
查看次数

你做的有趣的Python系统实用程序?

我慢慢地,但肯定地教自己Python.我做得最好.我正在寻找一些整洁的系统生产力程序,我可以尝试制作你发现对自己有用的程序.我成功制作和使用的一些模块如下:

  • 压缩文件夹
  • 将一整套文件夹作为自动备份压缩到存档
  • 应用程序启动器,在启动时打开我最常用的程序

但我现在有点卡住了.我还能做什么?

python

4
推荐指数
1
解决办法
2858
查看次数

使用MD5校验和在多个硬盘上搜索重复文件是否安全?

我的任务是整合大约15年的实验室记录,其中大部分是学生作业或原始数据.我们正在谈论100,000多个人工生成的文件.

我的计划是编写一个Python 2.7脚本,它将映射整个目录结构,为每个目录结构创建校验和,然后标记重复项以进行删除.我预计可能会有10-25%的重复.

我的理解是MD5碰撞在理论上是可能的,但是这不太可能,这实际上是一个安全的程序(假设如果发生1次碰撞,我的工作将是安全的).

这是一个安全的假设吗?如果实现很重要,我打算使用的唯一Python库是:

  • hashlib 校验和;
  • sqlite 用于数据处理结果;
  • os 用于目录映射

python checksum md5

4
推荐指数
1
解决办法
2447
查看次数

标签 统计

python ×4

file ×2

checksum ×1

duplicates ×1

id3 ×1

md5 ×1

mp3 ×1