标签: document

从HTMLDocument获取所有html作为String

我用Java编码..

有谁知道如何将javax.swing.text.html.HTMLDocument的内容作为字符串获取?这是我到目前为止所得到的......

URL url = new URL( "http://www.test.com" );

HTMLEditorKit kit = new HTMLEditorKit(); 
HTMLDocument doc = (HTMLDocument) kit.createDefaultDocument(); 
doc.putProperty("IgnoreCharsetDirective", Boolean.TRUE);
Reader HTMLReader = new InputStreamReader(url.openConnection().getInputStream()); 
kit.read(HTMLReader, doc, 0); 
Run Code Online (Sandbox Code Playgroud)

我需要将HTMLDocument的内容作为String.

例:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">    <html><head><meta http-equiv="X-UA-Compatible" content="IE=Edge,chrome=1">
Run Code Online (Sandbox Code Playgroud)

.......等

任何帮助,将不胜感激.我需要使用HTMLDocument类才能正确处理html :)

谢谢Daniel

java document

7
推荐指数
1
解决办法
6871
查看次数

LaTeX中没有挪威字符

我已经用LaTeX格式将文档从英语翻译成挪威语,并且在使用挪威语特殊字符时,我收到错误

\usepackage[utf8x]{inputenc}
Run Code Online (Sandbox Code Playgroud)

尝试以PostScript/PDF/DVI格式显示挪威语(斯堪的纳维亚语)特殊字符

 Package utf8x Error: MalformedUTF-8sequence.
Run Code Online (Sandbox Code Playgroud)

虽然这不起作用,但我尝试了另一种可能的解决方案:

\usepackage{ucs}
\usepackage[norsk]babel
Run Code Online (Sandbox Code Playgroud)

当我试图在Emacs中保存它时,我收到此消息:

These default coding systems were tried to encode text
in the buffer `lol.tex':
(utf-8-unix (905 . 4194277) (916 . 4194245) (945 . 4194278) (950
. 4194277) (954 . 4194296) (990 . 4194277) (1010 . 4194277) (1013
. 4194278) (1051 . 4194277) (1078 . 4194296) (1105 . 4194296))
However, each of them encountered characters it couldn't encode:
utf-8-unix cannot encode these: \345 \305 \346 \345 \370 \345 \345 \346 \345 …
Run Code Online (Sandbox Code Playgroud)

latex document internationalization texinfo

6
推荐指数
1
解决办法
3131
查看次数

全包工具将不同类型的文档转换为pdf

我一直在网上寻找可以与Java一起使用的工具.无论是Java API还是命令行界面,我都可以创建一个Java包装器,使我能够将多种类型的文档转换为PDF.

以下是我需要能够转换为PDF的文档列表:

  • 图像(.tiff,.jpeg,.png,.bmp,.gif)
  • MS WORD(.doc,.docx)
  • 文本文件(.txt,.rtf)

以下是我到目前为止在网站上发现的与pdf转换相关的一些注释

JODConverter - http://www.artofsolving.com/opensource/jodconverter 希望将许多不同类型的格式转换为PDF不再积极开发免费

iText不起作用 - http://itextpdf.com/itext.php/"iText 可以将XML或XHTML/CSS文件转换为PDF(使用XML Worker).将文档从一种格式转换为另一种格式不在iText的范围内并且没有:iText不会将Word文档转换为PDF格式!"

GhostScript - http://www.ghostscript.com/ 将postscript转换为pdf需要找到可以将文件格式转换为ps的软件首先可能不是最好的解决方案免费

Qoppa软件 - http://www.qoppa.com/solutions/javapdf.html jPDFImages - 从jpg,tif和png图像创建pdf jWordConvert - 将word文档转换为PDF(doc,docx)成本金钱

imagemagick - http://www.imagemagick.org/script/index.php一次 将一个图像转换为pdf,需要与批处理脚本一起使用,将所有pdf合并为一个除了图像之外不做任何事情.自由

如果有关这些产品的任何信息不正确,我们将不胜感激.

是否有一个解决方案仍然得到积极支持,可以在一个软件中完成所有这些转换?

我觉得这是人们遇到的常见问题,必须有一个比将多个第三方产品组合在一起更好的解决方案.它可以是开源的,也可以是许可证和金钱.

java pdf command-line document file-conversion

6
推荐指数
0
解决办法
2423
查看次数

不能使用任何CouchDB _list函数

努力让任何列表功能起作用.我对_show和_view函数一直很好,但是列表似乎没有用,或者我误解了要做什么!(我承认需要一个白痴的指导!)

我的设计文档如下:

{
   "_id": "_design/lists",
   "_rev": "3-d22225b4a28a6ca11484723c3a37201b",
   "language": "javascript",
   "views": {
       "variants": {
           "map": "function(doc) { emit(doc.var, doc.number_of_results); }"
       }
   },
   "lists": {
       "results": "function(head, req) { var row; while(row = getRow()) {send(row.value);}}"
   }
}
Run Code Online (Sandbox Code Playgroud)

当我输入http:// localhost:5984/mydb/_design/lists/_view/variants时,我得到一个变体名称列表,例如:

...{"id":"f050ad9b9f725443cb8c4071f40583b","key":"rs1013940","value":19008},
{"id":"f050ad9b9f725443cb8c4071f40daff","key":"rs1013940","value":19008},
{"id":"f050ad9b9f725443cb8c4071f40b985","key":"rs1021188","value":10197}...
Run Code Online (Sandbox Code Playgroud)

但当我输入http:// localhost:5984/mydb/_design/lists/_list/results时,我得到:

{"error":"list_error","reason":"Invalid path."}
Run Code Online (Sandbox Code Playgroud)

有谁知道我做错了什么?我已经尝试了所有我能想到的东西,并在任何在线教程中交换了一个函数.

我在Ubuntu 12.04上使用CouchDB版本1.0.1

非常感谢,希望有人能帮忙!

couchdb document views list

6
推荐指数
1
解决办法
2065
查看次数

寻找第三方CMS与MVC网站集成

我正在考虑将第三方组件集成到基于MVC的站点中的可能性.我们有一个基于MVC的门户,托管在云中,需要文档处理和搜索功能,而无需从头开始实施全部工作.

是否存在任何其他与云兼容的第三方系统并提供用于处理文档,安全性和全文搜索的API?

cloud asp.net-mvc lucene.net document content-management-system

6
推荐指数
1
解决办法
535
查看次数

未声明框架文档的字符编码

在开发我的网站时,我在FF中收到此警告.我找不到任何关于它的真实信息以及如何解决这个问题.

the character encoding of a framed document was not declared. The document may appear different if viewed without the document framing it.


...e)});else for(var g in a)ca(g,a[g],c,e);return d.join("&").replace(bD,"+")}}),f....
Run Code Online (Sandbox Code Playgroud)

jquery .... min.js(第4行)

firefox document character-encoding declare

6
推荐指数
1
解决办法
2万
查看次数

以英寸为单位确定网页的宽度

我有一个CSS样式表,它使用媒体查询来根据宽度的多少英寸来改变页面的显示方式(例如,如果它小于4英寸或者在手持设备上显示,它会假设更具移动性 - 友好的LAF).

我遇到的问题是它的内容.在主页上,有一个停靠式界面,可根据窗口的当前高度和宽度动态更改高度,以便文本和项目永远不会离开屏幕.但是,确定此大小的我的JS不知道样式表何时更改为手持设备或小屏幕,因此在此模式下行为继续无法预测.当页面小于或等于4英寸时,如何使用JavaScript检测,以便我可以禁用当时重新设置的扩展坞的自动调整大小?

javascript document width inches dynamic-resizing

6
推荐指数
1
解决办法
3877
查看次数

document.querySelector.bind(document)是什么意思;

我正在检查来自html5rocks的代码:http://www.html5rocks.com/static/demos/parallax/demo-1a/scripts/parallax.js

并注意他们使用

(function(win, d) {

  var $ = d.querySelector.bind(d);

  ....

  var mainBG = $('section#content');

  ....

})(window, document);
Run Code Online (Sandbox Code Playgroud)

为什么他们将文档绑定到querySelector.是不是它已经作为文件的范围?

javascript document bind parallax.js

6
推荐指数
1
解决办法
2534
查看次数

没有JOIN,处理文档数据库中数据的正确方法是什么?

我知道JOIN在文档数据库中是不可能的或不赞成的.我来自关系数据库背景,并试图了解如何处理这种情况.

假设我有一个Employees集合,我存储了所有与员工相关的信息.以下是典型的员工文档:

{
   "id": 1234,
   "firstName": "John",
   "lastName": "Smith",
   "gender": "Male",
   "dateOfBirth": "3/21/1967",
   "emailAddresses":[
      { "email": "johnsmith@mydomain.com", "isPrimary": "true" },
      { "email": "jsmith@someotherdomain.com", "isPrimary": "false" }
   ]
}
Run Code Online (Sandbox Code Playgroud)

我们还说,我有一个单独的项目集合,我存储的项目数据看起来像这样:

{
   "id": 444,
   "projectName": "My Construction Project",
   "projectType": "Construction",
   "projectTeam":[
      { "_id": 2345, "position": "Engineer" },
      { "_id": 1234, "position": "Project Manager" }
   ]
}
Run Code Online (Sandbox Code Playgroud)

如果我想返回我的所有项目列表以及项目团队,我该如何处理以确保我返回有关团队中个人的所有相关信息,即全名,电子邮件地址等?

这是两个单独的查询吗?一个用于项目,另一个用于ID出现在项目集合中的人员?

如果是这样,我如何插入有关人员的数据,即全名,电子邮件地址?然后我在我的应用程序中执行foreach循环来更新数据吗?

如果我依赖我的应用程序来处理所有相关数据的填充,那么这不是一个性能损失会抵消MongoDB等文档数据库的性能优势吗?

谢谢你的帮助.

sql document mongodb mongodb-query azure-cosmosdb

6
推荐指数
1
解决办法
263
查看次数

如何在 Google 和 Microsoft 的文档查看器上使用 Firebase 存储 URL

我读过一篇文章,介绍了如何使用两家公司提供的以下预先建立的 Rest API 预览 Office 文档(doc、docx、xls、xlsx、ppt、pptx)。

MS 文档查看器:

https://view.officeapps.live.com/op/embed.aspx?src=

谷歌文档查看器:

https://docs.google.com/gview?url=[DOCUMENT_URL]&embedded=true

然而,这两个选项似乎适用于简单的 URL,因此当我尝试使用下面提供的示例文档(存储在 Firebase 存储中)时,它无法预览,也无法由文档查看器解析 URL提到。

我想问是否有人知道或有想法,如何编码或预解析以下 URL,以便我的 Firebase 文档可以正确显示:

示例 Firebase DOCX 文件:

https://firebasestorage.googleapis.com/v0/b/mycloudvip-storage.appspot.com/o/GMbRXZARq1AqDGD0xTZ4%2FnihZvJ4fwXQ2oO40ItWf.docx?alt=media&token=97628604-2ab4-4111-b531-085d545e1a93

非常感谢#STAYSAFE

document viewer firebase

6
推荐指数
1
解决办法
450
查看次数