我通过HTTP-Upload获取文件,需要确保它是一个pdf文件.编程语言是Python,但这不重要.
我想到了以下解决方案:
检查字符串的第一个字节是否为"%PDF".这不是一个好的检查,但可以防止使用意外上传其他文件.
尝试使用libmagic(bash上的"file"命令使用它).这与1的检查完全相同.
拿一个lib并尝试从文件中读取页数.如果lib能够读取页数,那么它应该是有效的pdf.问题:我不知道python的lib可以做到这一点
所以任何人都有lib或其他技巧的解决方案?
谢谢
有没有办法在覆盖模型保存方法时获取上传文件的内容类型?我试过这个:
def save(self):
print(self.file.content_type)
super(Media, self).save()
Run Code Online (Sandbox Code Playgroud)
但它没有用.在此示例中,self.file是model.FileField:
file = models.FileField(upload_to='uploads/%m-%Y/')
Run Code Online (Sandbox Code Playgroud)
编辑:我希望能够将内容类型保存到数据库,所以在保存实际完成之前我需要它:)