标签: document

如何清理microsoft html doc？

我有从Microsoft Word生成的html格式的大文档.它太乱了,充满了臃肿的东西(比如unknow标签,unknow名称空间等等和其他臃肿的东西)

有没有办法将其转换为普通的HTML sytax？

html document ms-word

nig*_*2k1

2015 11-01

7
推荐指数

1
解决办法

6165
查看次数

为什么这个JavaScript(使用document.open和document.write)不能在Internet Explorer或Opera中运行？

我迫切需要一些帮助.

我创建了一个非常平行的<script>,并重现了我在其他地方写过的另一个更复杂的<script>的问题.

这是它的作用:

创建一个<iframe>并插入页面上的<div>
创建一个文档并将其附加到<iframe>,其中包含一个<script>,它定义了一些函数(包括一个回调函数和一个使用AJAX加载外部<script>的函数)
后一个外部脚本只是对回调函数的调用,该函数调用一个创建文档并将其附加到<iframe>的函数; 这应该有效地覆盖<script>

涉及的三个文件是:

http://troy.onespot.com/static/document_write/index.html(主页)
http://troy.onespot.com/static/document_write/main.js(加载的第一个<script>)
http://troy.onespot.com/static/document_write/jsonp.js(由jQuery的$ .ajax()方法加载的<script>)

这一切都适用于Firefox,Safari和Chrome.它崩溃的地方是Internet Explorer和Opera.会发生什么是main.js中的render()函数执行,并且触发了所有三个警报,但<iframe>中的文档没有被覆盖.我无法分辨出正在创建或写入的文档,或者根本不是.

如果我在render()函数的开头添加调试代码(如console.log(document)),那么工作浏览器似乎可以获得现有<iframe>文档的句柄并列出下面包含的属性.Internet Explorer似乎也可以找到某种文档.我只是不知道为什么不让我覆盖它.

这可能是范围问题吗？也许我不正确地使用document.write(),document.open()或document.close()方法,Firefox和其他一些浏览器只是让我逃脱它？

一个可能的线索:如果我把render()函数的内容拿出来(即,只是把它们放在main.js中的load()之后),这样可以正常工作.这告诉我,我不是如何使用document.open()等,但是在执行callback()函数时,文档对象不可用,或者超出了范围,或类似的东西.

这让我非常难过,这是一个非常重要的项目,即将到期.如果它让我摆脱这种干扰,我不会超越黑客或解决方法.任何帮助或见解都将非常感激!

console.log()的文档属性列表:

ATTRIBUTE_NODE: 2
CDATA_SECTION_NODE: 4
COMMENT_NODE: 8
DOCUMENT_FRAGMENT_NODE: 11
DOCUMENT_NODE: 9
DOCUMENT_POSITION_CONTAINED_BY: 16
DOCUMENT_POSITION_CONTAINS: 8
DOCUMENT_POSITION_DISCONNECTED: 1
DOCUMENT_POSITION_FOLLOWING: 4
DOCUMENT_POSITION_IMPLEMENTATION_SPECIFIC: 32
DOCUMENT_POSITION_PRECEDING: 2
DOCUMENT_TYPE_NODE: 10
ELEMENT_NODE: 1
ENTITY_NODE: 6
ENTITY_REFERENCE_NODE: 5
NOTATION_NODE: 12
PROCESSING_INSTRUCTION_NODE: 7
TEXT_NODE: 3
URL: "http://localhost/projects/test/ajax_loader/document_write/index.html"
activeElement: HTMLBodyElement
addEventListener: function addEventListener() {
adoptNode: function adoptNode() {
alinkColor: ""
all: HTMLCollection
anchors: HTMLCollection
appendChild: function appendChild() …

javascript iframe scope document document.write

Bun*_*gle

2009 11-15

7
推荐指数

1
解决办法

2万
查看次数

(un)结构化文本文档的词法分析器/解析器

脚本(即结构化计算机语言)有很多解析器和词法分析器.但我正在寻找能够将(几乎)非结构化文本文档分解为更大的部分的文档,例如章节,段落等.

一个人识别它们相对容易:目录,确认或主体开始的位置,并且可以构建基于规则的系统来识别其中的一些(例如段落).

我不认为它是完美的,但有没有人知道这么宽泛的'基于块'的词法分析器/解析器？或者你能指出我可能有帮助的文学方向吗？

parsing document lexer

wil*_*n32

lucky-day

7
推荐指数

1
解决办法

413
查看次数

哪个简单的文件管理系统？

对于资金不多的中小型NGO,我正在寻找一个简单的文档管理系统(不是Web CMS).要求相对简单:

基于网络
免费(如免费啤酒)或非常便宜,如果它也是开源的话更好
能够存储电子文档(Word,PDF,...)和扫描的纸质文档(PDF/jpeg /任何图像格式)
除了一些元数据:文档的名称,它所属的项目/部门,作者,日期,地点,一些识别代码,简短描述,......

可选但很好:

版本
索引/搜索单词/ pdf/text/...文档

根据我对SO的网络和其他线程的研究,我归结为这三种产品:

KnowledgeTree(在本地安装,而不是SAAS)
露天
Nuxeo DM

对于KT的偏爱,另外两个人对我们的简单要求感觉有点过分.我也在关注MS Sharepoint Foundation(ex-Sharepoint Services),但这意味着购买我认为他们不想要的Windows Server许可证.

有人可以给我一些关于这些产品的反馈,特别是KT吗？你会选择(或避免)哪一个？我错过了还有其他合适的解决方案吗？欢迎任何信息!

document ecm content-management-system

Pie*_*nry

lucky-day

7
推荐指数

1
解决办法

4367
查看次数

如何将FlowDocument导出到DOC(x)或XLS

在我的程序中,我生成了一些报告FlowDocument并用DocumentViewer控件显示它.现在我需要增加更多的出口机会.我使用iTextSharp以PDF格式导出,我可以本地保存到XPS.我可以将文档直接保存到任何办公室格式,DOC或XLS.或者有人知道在DOC或XLS中转换PDF/XPS的好库？

c# wpf document ms-office

Art*_*eel

lucky-day

7
推荐指数

1
解决办法

4631
查看次数

嵌入式文档中的mongodb限制

我需要创建一个消息系统,一个人可以与许多用户进行对话.例如,我开始与user2,user3和user4交谈,因此他们中的任何人都可以看到整个对话,如果对话在任何时间都不是私密的,任何参与者都可以将任何其他人添加到对话中.

这是我的想法如何做到这一点.我正在使用Mongo,我的想法是使用对话框作为实例而不是消息.

架构如下所示:

{
_id : ...., // dialog Id
'private' : 0 // is the conversation private
'participants' : [1, 3, 5, 6], //people who are in the conversation
'msgs' :[
  {
   'mid' : ...// id of a message
   'pid': 1, // person who wrote a message
   'msg' : 'tafasd' //message
  },
  ....
  {
   'mid' : ...// id of a message
   'pid': 1, // person who wrote a message
   'msg' : 'tafasd' //message
  }
]
}

Run Code Online (Sandbox Code Playgroud)

我可以看到这种方法的一些优点 - 在一个大型数据库中,很容易找到某些特定会话的消息. …

document mongodb mongodb-php

Sal*_*ali

2011 12-10

7
推荐指数

1
解决办法

5226
查看次数

如何使用Java将原始数据发送到打印机

我正在尝试创建一个简单的程序,将字符串发送到打印机进行打印.这是我的程序的样子:

import javax.print.Doc;
import javax.print.DocFlavor;
import javax.print.DocPrintJob;
import javax.print.PrintException;
import javax.print.PrintService;
import javax.print.PrintServiceLookup;
import javax.print.SimpleDoc;

public class PrinterTest {
  public static void main (String [] args) throws PrintException {
    DocPrintJob job = null;
    PrintService[] printServices = 
    PrintServiceLookup.lookupPrintServices(null, null);
    System.out.println("Number of print services: " + printServices.length);
    for (PrintService printer : printServices) {
        System.out.println("Printer: " + printer.getName());
        if (printer.getName().contains("ZM400")) {
            String hello = "Hello";
            DocFlavor flavor = DocFlavor.STRING.TEXT_PLAIN;
            Doc doc = new SimpleDoc(hello, flavor, null);
            job = printer.createPrintJob();
            job.print(doc, null);
        }
    } …

Run Code Online (Sandbox Code Playgroud)

java printing document exception raw-data

aCa*_*lla

2017 08-04

7
推荐指数

1
解决办法

4138
查看次数

仅使用 javascript 复制文档对象的最简单方法是什么

文档对象的副本在复制后应该像...文档对象一样，但完全脱离实际的 dom 引用。我的意思是——如果我们将此文档副本保存为var documentCopydocumentCopy 应该能够像本来.getElementsByClass('xx')那样在自身上运行document，但对其的修改不会影响原始document对象。

那可能吗？

我对除 jQuery 之外的所有库都持开放态度。

javascript clone document object

Eze*_*wei

lucky-day

7
推荐指数

1
解决办法

7230
查看次数

提取Spacy文档的一部分作为新文档

我有一个较长的文本被解析Spacy为一个Doc实例：

import spacy

nlp = spacy.load('en_core_web_lg')
doc = nlp(content)

Run Code Online (Sandbox Code Playgroud)

doc这里成为一个Doc类实例。

现在，由于文本很大，因此我想仅使用文档的一部分（例如前100个句子）在Jupyter笔记本中进行处理，实验和可视化。

如何Doc从现有文档的一部分中切片并创建新实例？

python nlp document spacy

ale*_*cxe

2017 12-15

7
推荐指数

2
解决办法

473
查看次数

如何使用 Jsdocs 和 Typescript 记录 React 功能组件

鉴于这种

type LocationWeather = {
  name: string;
  temperature: number;
};

type IndexProp = {
  savedLocationsWeather: LocationWeather[];
  favoriteLocationWeather: LocationWeather;
};


function Index({ savedLocationsWeather, favoriteLocationWeather }: IndexProp)

Run Code Online (Sandbox Code Playgroud)

文档应该是什么样的？

我的第一个方法是：

/**
 * Home page displaying weather details of saved locations and favorite location
 * @param {object} props Component props
 * @param {LocationWeather[]} props.savedLocationsWeather Weather details of saved locations
 * @param {LocationWeather} props.favoriteLocationWeather Weather details of favorite location
 * @return {TSX.Element}
 */

Run Code Online (Sandbox Code Playgroud)

但：