我的文件管理系统的要求是:
我决定将所有文档(和扫描图像)作为blob存储在数据库中,到目前为止,我的经验非常棒,文档检索也非常快 - 它符合上述所有标准,甚至还有一些额外的优点,例如,将文档与其相关的实体一起自动存储,轻松快速地搜索内容,删除各种用户活动,包括打开和命名文档等.
我的问题是 - 这个设计和实施中是否存在任何我忽略的严重风险或事物?
编辑注意:DB是PostgreSQL,非常好地处理BLOBS并且非常好地扩展.环境是多用户.
我的一位客户要求提供文件管理系统,用于数千种不同格式的文档,即pdf,doc,docx等.我的问题是在数据库或文件系统中存储此文件的最佳方法是什么?两种方法之间如何轻松保护文档?
快速检索文件是关键要求..
如果有帮助,我正在使用mysql
问候.
请推荐一个简单的基于Web的文档存储库,用于保存我的小公司文档(.DOCs,.PDFs),以便我可以从任何地方访问它们.互联网上有许多可用的,但它们很重,并且充满了不必要的功能和要求.
我没有什么要求:愉快的界面(AJAX感觉很好),文件夹或标签,可能是版本,可能是CIFS安装或批量上传/下载,最好不是用Java编写的(不能托管它).
此致,托多尔
注 - 问题提交者正在使用基于LAMP的环境.
我有一个文档管理系统,其中文档可以有多个版本.保存每个版本,用户可以查看版本历史记录.
我想知道的是:我应该使用什么数据类型的版本号?十进制,浮点数还是双倍?我正在使用.NET和C#.
版本号从0.1开始,每个发布的主要版本将四舍五入到下一个整数.即0.4去1.0和1.3进行到2.0等
当版本号达到0.9并且添加了次要版本时,我希望当我添加它时,该数字将变为0.10而不是1.0.这是最大的问题.
任何建议表示赞赏.
谢谢.
更新:我现在为ssdeep C API 编写了一个名为php_ssdeep的PHP扩展,以便在本机中简化PHP中的模糊散列和散列比较.可以在我的博客上找到更多信息.我希望这对人们有所帮助.
我参与在Linux上编写一个PHP自定义文档管理应用程序,它将存储各种文件格式(可能是1000个文件),我们需要能够检查文本文档是否已经上传,以防止数据库中的重复.
基本上,当用户上传新文件时,我们希望能够向他们提供重复或包含类似内容的文件列表.然后,这将允许他们选择一个预先存在的文档或继续上传他们自己的文档.
类似的文件将通过查看他们的相似发送的内容以及可能是动态生成的关键字列表来确定.然后,我们可以向用户显示百分比匹配,以帮助他们找到重复项.
您能推荐一下这个过程的任何软件包以及过去如何做到这一点的任何想法吗?
我认为可以通过获取所有文本内容来完成直接复制
然后形成MD5哈希以与任何新文档进行比较.如果用户编辑文档以添加额外的段落符号,则剥离这些项目应该有助于防止找不到欺骗.有什么想法吗?
此过程也可能作为夜间作业运行,如果计算要求太大而无法实时运行,我们可以在下次登录时通知用户任何重复项.然而,实时将是首选.
我已经评估了几个开源文档管理系统,似乎这些在过去,例如opendocman,quotero
我正在寻找一个开源文档管理系统,它提供了以下功能.
如果您有使用任何人的经验并且我可以使用它,请告诉我?
我有一个想要实施文档管理系统的公司实习面试,他们正在考虑首先开源解决方案,他们的首选是Alfresco,但决定仍然不是最终的,我的工作部分将是调查是Alfresco是最好的解决方案.
我从项目描述中看到的是,他们将使用MySQL数据库实现Alfresco,而不是仅将DBMS用于文档元数据和索引,但他们实际上想要将文档存储在其中.根据公司资料,文档类型主要是PDF和.doc,而不是图像.
我已经研究了一下,我已经阅读了有关将文件存储到数据库中的所有主题,而不是复制问题.因此,根据我的理解,存储BLOBS通常是不可推荐的,并且根据公司的概况及其存档的法律义务,我认为他们将需要存储更多的文档.
我想尽可能多地为面试做好准备,这就是为什么我希望你对这些问题的意见:
决定将文档存储到DBMS中的原因是什么(特别是考虑到您正在安装Alfresco,它将文件存储在FS中)?
您是否有任何将文档存储到MySQL数据库的经验?
非常感谢所有的帮助,我对面试感到非常兴奋,真的很想实习,所以这是我以前真正想要了解的事情之一!
谢谢!!!!
我打算建立一个简单的文件管理系统.最好围绕java平台构建.围绕这个有最好的做法吗?要求是:
我目前正在考虑几种选择.第一个选项是在SVN或CVS之上的简单API,并使用DB后端来跟踪标签,上传者,评论等
另一种选择是使用文件系统.将文档版本作为版本文件夹中的副本进行版本并使用文件名.
或者,如果有一个Open非GPL的文档管理系统,我们可以根据我们的需求对其进行自定义,并将其打包到我们的应用程序中.有没有人有建立这样的经验?
经过多年无组织文件的航行,我开始寻找一种廉价/免费的方式来对我们的工作文档进行结构分类,以便整理并更好地执行工作流程.所以我希望能够根据项目,客户,使用的组件等标记文档.
例如,想象一下这些文档:
......等等.
通过这种方式,我可以按标签过滤文档,例如获取给定项目的所有文档,或给定客户的所有报价,或使用给定应用程序服务器的所有项目. .
喜欢的事,M-文件将是完美的,但我更喜欢一个基于Linux的解决方案.. :)(甚至没有基于网络的,如果有可能),
我花了一整天尝试在Freshmeat上和维基百科发现DMSes,但我找不到像M档一样工作的东西..:/
我很欣赏任何提示/指针,非常感谢!
我需要创建一个非常简单的DMS(文档管理系统)/文件存储库/文件管理器,或者我们在Java EE下可能会称之为的任何文件。
它应该允许用户创建文件夹并将文件上传到其中,并且文件夹/文件信息应存储在数据库中以检查哪个用户创建了什么(在这种情况下,这是一个简单的文件管理器,它仅允许浏览服务器磁盘上的目录是不足够的)。
更明确地说,这应该是或多或少的:
到目前为止,我一直在寻找可以使用的罐装解决方案,但是我只找到了很好的TinyDMS(http://sourceforge.net/projects/tinydms/)(上面的图片是运行中的屏幕截图),它使用jackrabbit进行但是文件搜索需要大量的Spring框架依赖,并且很难编译(尚未成功)。然后是OpenKM和LogicalDoc,但是它们确实是复杂的程序,因此不适合包含在第三方应用程序中。我没有什么可以开始的吗?
dms ×3
java ×3
document ×2
linux ×2
mysql ×2
php ×2
.net ×1
alfresco ×1
blob ×1
blobstorage ×1
c# ×1
duplicates ×1
java-ee ×1
lamp ×1
open-source ×1
organization ×1
performance ×1
security ×1
storing-data ×1
svn ×1
tagging ×1
versions ×1