标签: document

将文档作为Blob存储在数据库中 - 有什么缺点吗?

我的文件管理系统的要求是:

  1. 必须通过简单复制目录,文件等来防止被盗.
  2. 必须安全抵御传统病毒感染(物理文件的感染)
  3. 必须快速检索
  4. 访问者(目录)浏览用户等不得看到存储库.

我决定将所有文档(和扫描图像)作为blob存储在数据库中,到目前为止,我的经验非常棒,文档检索也非常快 - 它符合上述所有标准,甚至还有一些额外的优点,例如,将文档与其相关的实体一起自动存储,轻松快速地搜索内容,删除各种用户活动,包括打开和命名文档等.

我的问题是 - 这个设计和实施中是否存在任何我忽略的严重风险或事物?

编辑注意:DB是PostgreSQL,非常好地处理BLOBS并且非常好地扩展.环境是多用户.

security performance document blob document-management

50
推荐指数
3
解决办法
4万
查看次数

有办法访问iphone/ipad中的文档文件夹(真实设备,没有模拟器)?

有办法访问真实设备(iphone/ipad)文件夹吗?我意识到一个应用程序将一些数据存储在该文件夹中,我想检查一切是否正确.

iphone document ipad ios

46
推荐指数
4
解决办法
8万
查看次数

46
推荐指数
1
解决办法
2万
查看次数

在javascript中按类型访问元素

前一段时间我在Javascript中进行了一些测试,并使用代码来获取具有某个类的所有元素的文本,现在我试图制作这样的东西但是通过某种类型获取所有元素,例如所有元素type ="text"有没有办法在Javascript中执行此操作,还是应该使用jquery?

var xx = document.getElementsByClassName("class");
for (i=0;i<xx.length;i++){
    var str=xx[i].innerHTML;
            alert(str);
}
Run Code Online (Sandbox Code Playgroud)

javascript types document element

38
推荐指数
2
解决办法
11万
查看次数

LaTeX书类:具有错误边距的双面文档

我试图用胶乳写我的论文......虽然不能直接得到布局:?我正在使用以下文档类:

\documentclass[11pt,a4paper,twoside,openright]{book}
Run Code Online (Sandbox Code Playgroud)

我的问题是:在奇数页面上有一个很大的边距,剩下一小部分 - 它应该是相反的方式...(对于绑定和东西)我有点困惑 - 我只是愚蠢地看到明显的?奇数页码出现在绑定文档的"右侧"页面上,因此左侧需要更大的装订边距进行绑定 - 反之亦然.对?

为什么LaTeX不像这样?

这是生成一个显示我的问题的小Tex文件的完整代码:

\documentclass[11pt,a4paper,twoside,openright]{book}
\begin{document}
\chapter{blah}
Lorem ipsum ius et accumsan tractatos, aliquip deterruisset cu usu. Ea soleat eirmod nostrud eum, est ceteros similique ad, at mea tempor petentium. At decore neglegentur quo, ea ius doming dictas facilis, duo ut porro nostrum suavitate.
\end{document}
Run Code Online (Sandbox Code Playgroud)

编辑:我知道有很多方法可以手动指定页边距,比如

\setlength{\oddsidemargin}{53pt}  
Run Code Online (Sandbox Code Playgroud)

要么 ...

\usepackage[lmargin=1cm,rmargin=2.5cm,tmargin=2.5cm,bmargin=2.5cm]{geometry}
Run Code Online (Sandbox Code Playgroud)

我只是想使用默认设置而不理解为什么它们没有按预期运行.

latex document margins

37
推荐指数
4
解决办法
4万
查看次数

使用Sklearn的TfidfVectorizer变换

我正在尝试使用Sklearn的TfidfVectorizer对象获取单个文档的tf-idf向量.我根据一些训练文档创建词汇表,并使用fit_transform训练TfidfVectorizer.然后,我想找到任何给定测试文档的tf-idf向量.

from sklearn.feature_extraction.text import TfidfVectorizer

self.vocabulary = "a list of words I want to look for in the documents".split()
self.vect = TfidfVectorizer(sublinear_tf=True, max_df=0.5, analyzer='word', 
                 stop_words='english')
self.vect.fit_transform(self.vocabulary)

...

doc = "some string I want to get tf-idf vector for"
tfidf = self.vect.transform(doc)
Run Code Online (Sandbox Code Playgroud)

问题是这会返回一个包含n行的矩阵,其中n是我的doc字符串的大小.我希望它只返回一个代表整个字符串的tf-idf的向量.我怎样才能将字符串视为单个文档,而不是每个字符都是文档?另外,我对文本挖掘很新,所以如果我在概念上做错了,那就太棒了.任何帮助表示赞赏.

python document text-mining tf-idf

36
推荐指数
1
解决办法
5万
查看次数

文档类型与导出和导入的UTI

任何人都可以向我解释Xcode 5.1中文档类型,导出的UTI和导入的UTI之间的区别吗?我希望能够让我的应用程序根据文件扩展名自动检测文件类型.为了做到这一点,我需要实施这三个中的哪一个?

xcode document file-type uti

35
推荐指数
1
解决办法
1万
查看次数

如何使用JavaScript创建Document对象

基本上这就是问题,如何在javascript中动态地从HTML字符串构造一个Document对象?

javascript dom specifications document xmlhttprequest

34
推荐指数
3
解决办法
5万
查看次数

在MS Word中创建图像/图形的自动编号

我有MS Word文档,其中包含大约50个带标题的图像.

我的问题是,如果我在两者之间插入图像(比如在图像21之后插入图像),那么图像没有自己的标题(必须插入带有标题22的​​新图像).

我需要在新添加的图像后手动更新所有图像的编号.我能自动化吗?

document ms-word image

33
推荐指数
2
解决办法
16万
查看次数

GetElementByID - 多个ID

doStuff(document.getElementById("myCircle1" "myCircle2" "myCircle3" "myCircle4"));
Run Code Online (Sandbox Code Playgroud)

这不起作用,所以我需要逗号或分号才能使其工作吗?

javascript arrays document element get

32
推荐指数
3
解决办法
15万
查看次数