标签: docx

使用 docx4j 转换 docx -> pdf 时如何更改字体编码?

当我将 docx 文档转换为 pdf 时,我的国家字符会转换为“#”标记。
有没有办法为pdf文档设置字体编码?

我过去使用过 xdocreport,它可以处理这个问题,但我在图像、页眉和页脚方面遇到了问题。

Docx4j 可以做到这一点,但字体不行。转换后,字体具有 ANSI 编码,而我想要 windows-1250。有一个选项可以设置这个吗?

java pdf docx docx4j xdocreport

2
推荐指数
1
解决办法
1万
查看次数

在 Swift 中将 Docx 文件转换为文本

我的临时存储中有一个 .docx 文件:

    let location: NSURL = NSURL.fileURLWithPath(NSTemporaryDirectory())
    let file_Name = location.URLByAppendingPathComponent("5 November 2016.docx")
Run Code Online (Sandbox Code Playgroud)

我现在要做的是提取此文档中的文本。但我似乎找不到任何转换器或这样做的方法。

我试过这个:

    let file_Content = try? NSString(contentsOfFile: String(file_Name), encoding: NSUTF8StringEncoding)
    print(file_Content)
Run Code Online (Sandbox Code Playgroud)

但是它打印零。

那么如何读取 docx 文件中的文本呢?

ms-word docx local-storage swift

2
推荐指数
1
解决办法
3635
查看次数

使用 python-docx 搜索目录中的所有 docx 文件(批处理)

我有一堆docx具有相同嵌入 Excel 表格的 Word文件。我正在尝试从多个文件中提取相同的单元格。

我想出了如何硬编码到一个文件:

from docx import Document

document = Document(r"G:\GIS\DESIGN\ROW\ROW_Files\Docx\006-087-003.docx")
table = document.tables[0]
Project_cell = table.rows[2].cells[2]
paragraph = Project_cell.paragraphs[0]
Project = paragraph.text

print Project
Run Code Online (Sandbox Code Playgroud)

但是我该如何批处理呢?我在 上尝试了一些变体listdir,但它们对我不起作用,而且我太绿了,无法独自到达那里。

python docx python-docx

2
推荐指数
1
解决办法
2566
查看次数

从 Word (Docx) 读取方程和公式到 html 并使用 java 保存数据库

我有一个 word/docx 文件,其中包含图像下的方程 在此处输入图片说明

我想读取文件 word/docx 的数据并保存到我的数据库中,当需要时我可以从数据库中获取数据并显示在我的 html 页面上

java docx apache-poi docx4j

2
推荐指数
1
解决办法
5817
查看次数

提取 DOCX 评论

我是一名教师。我想要一份所有对我布置的文章发表评论的学生的名单,以及他们说了什么。Drive API 的东西对我来说太具有挑战性了,但我想我可以将它们作为 zip 下载并解析 XML。

评论被标记在w:comment标签中,w:t用于评论文本和 。这应该很容易,但是 XML (etree) 正在杀死我。

通过教程(和官方 Python 文档):

z = zipfile.ZipFile('test.docx')
x = z.read('word/comments.xml')
tree = etree.XML(x)
Run Code Online (Sandbox Code Playgroud)

然后我这样做:

children = tree.getiterator()
for c in children:
    print(c.attrib)
Run Code Online (Sandbox Code Playgroud)

结果是这样:

{}
{'{http://schemas.openxmlformats.org/wordprocessingml/2006/main}author': 'Joe Shmoe', '{http://schemas.openxmlformats.org/wordprocessingml/2006/main}id': '1', '{http://schemas.openxmlformats.org/wordprocessingml/2006/main}date': '2017-11-17T16:58:27Z'}
{'{http://schemas.openxmlformats.org/wordprocessingml/2006/main}rsidR': '00000000', '{http://schemas.openxmlformats.org/wordprocessingml/2006/main}rsidDel': '00000000', '{http://schemas.openxmlformats.org/wordprocessingml/2006/main}rsidP': '00000000', '{http://schemas.openxmlformats.org/wordprocessingml/2006/main}rsidRDefault': '00000000', '{http://schemas.openxmlformats.org/wordprocessingml/2006/main}rsidRPr': '00000000'}
{}
{'{http://schemas.openxmlformats.org/wordprocessingml/2006/main}val': '0'}
{'{http://schemas.openxmlformats.org/wordprocessingml/2006/main}val': '0'}
{'{http://schemas.openxmlformats.org/wordprocessingml/2006/main}val': '0'}
Run Code Online (Sandbox Code Playgroud)

在此之后,我完全被困住了。我试着element.get()element.findall()没有运气。即使我复制/粘贴值 ( '{http://schemas.openxmlformats.org/wordprocessingml/2006/main}val'),我也会得到None回报。

任何人都可以帮忙吗?

python xml docx google-docs openxml

2
推荐指数
3
解决办法
4972
查看次数

使用 Angular 2 生成 Docx 文件

我正在使用 angular2 并且我想使用一个对象生成一个 docx 文件。我希望我的 docx 文件包含页脚、页眉、表格等。我能想到的最佳解决方案是首先创建一个 HTML 文件,然后将其转换为 docx 文件。但这似乎不对。有没有更简单方便的方法来做我想做的事情?这是我使用的方法:

exportAsDoc() {

const preHtml = '<html xmlns:o=\'urn:schemas-microsoft-com:office:office\' ' + '' +
        ' xmlns:w=\'urn:schemas-microsoft-com:office:word\' xmlns=\'http://www.w3.org/TR/REC-html40\'><head><meta charset=\'utf-8\'>' +
        '<title>Export HTML To Doc</title></head><body>';
const postHtml = '</body></html>';

let innerHtml = '';
// Specify file name
const filename = this.respSheet.title + '.doc';
const respSheetKpis = this.respSheet.sheet_kpis;
respSheetKpis.forEach(x => {
  const footer = '<p style="text-align: center">' + x.kpi.name + ' - ' + x.kpiValue + '</p>';
  innerHtml += footer;
  x.sheet_kpi_dimensions.forEach(dimension => {
    if (dimension.dimension …
Run Code Online (Sandbox Code Playgroud)

docx typescript angular

2
推荐指数
1
解决办法
1万
查看次数

使用 Python 在 word docx 中编辑表格

如何使用 Python 编辑 Word 文档中已存在的表格。假设在我的 word 文档中,我有一个只有 2 行的表格,我想在 Python 中添加更多行,我该怎么做?我已经尝试过使用docxlibrary,但我能做的最好的事情是创建一个表格并将其保存到 word 文档中。

我想编辑一个已经存在的表。谢谢!

python ms-word docx python-2.7 python-docx

2
推荐指数
1
解决办法
5248
查看次数

从python中的word文件中读取

如何从python中的单词(docx)文件中读取。我可以读取 txt 文件,但不能读取 MS Office word 文档。有什么建议?

python docx readlines

2
推荐指数
1
解决办法
1746
查看次数

使用 Node.js 使用数据库值生成动态 word 文档

我正在尝试使用npm docx. 我正在尝试从 SQLite 数据库中读取数据,但由于异步节点 js 属性,这些值没有进入变量并显示undefined. 如果我使函数同步npm docx则会引发错误并且不会填充文档。

包.json

{
  "name": "demoName",
  "version": "1.0.0",
  "description": "",
  "main": "index.js",
  "scripts": {
    "test": "echo \"Error: no test specified\" && exit 1"
  },
  "keywords": [],
  "author": "",
  "license": "ISC",
  "dependencies": {
    "body-parser": "^1.19.0",
    "docx": "^5.1.1",
    "express": "^4.17.1",
    "md5": "^2.2.1",
    "sqlite3": "^4.2.0"
  }
}
Run Code Online (Sandbox Code Playgroud)

索引.js

const docx = require('docx');
var express = require('express');
var app = express();
var db = require("./database.js")

var bodyParser = require("body-parser");
app.use(bodyParser.urlencoded({ extended: …
Run Code Online (Sandbox Code Playgroud)

javascript sqlite docx node.js express

2
推荐指数
1
解决办法
2304
查看次数

使用 zipfile 库解压 .docx 文件

我正在尝试编写一个应用程序从 word docx 文件中的表中获取信息,以便通过将其转换为 pandas 对其进行一些分析DataFrame。第一步是正确读取 docx 文件,为此,我遵循 Virantha Ekanayake 的使用 Python 读取和编写 Microsoft Word docx 文件的指南。

我在第一步,他们说要使用库的Zipfile方法zipfile将 docx 文件解压缩为 xml 文件。我将指南中的函数定义改编为我的代码(代码包含在下面),但是当我运行我的代码时,我收到一条错误消息,指出 docx 文件“不是 zip 文件”。

指南中的这个人说,“从本质上讲,docx 文件只是一个 zip 文件(尝试在其上运行 unzip!)……”我尝试将 docx 文件重命名为 zip 文件,并且它使用 WinZip 成功解压。但是,在我的程序中,我希望能够解压缩 docx 文件而不必手动将其重命名为.zip文件。我能否以某种方式解压缩 docx 文件而不重命名它?或者,如果我必须重命名它才能使用该方法,我该如何在我的 Python 代码中执行此操作?Zipfile

import zipfile
from lxml import etree
import pandas as pd

FILE_PATH = 'C:/Users/user/Documents/Python Project'

class Application():
    def __init__(self):
        #debug print('Initialized!')
        xml_content = …
Run Code Online (Sandbox Code Playgroud)

python docx zipfile python-3.7

2
推荐指数
1
解决办法
517
查看次数