标签: docx

删除 docx 文件中的所有图像

我搜索了python-docx其他软件包的文档以及堆栈溢出,但找不到如何docx使用 python 从文件中删除所有图像。

我的具体用例:我需要将数百个 Word 文档转换为“草稿”格式以供客户查看。这些草稿应与原始文档相同,但必须删除/编辑其中的所有图像。

抱歉,没有提供我尝试过的示例,我尝试过的是数小时的研究,但没有提供任何信息。我发现这个问题是关于如何从Word文件中提取图像,但这并没有从实际文档中删除它们:Extract pictures from Word and Excel with Python

从那里和其他来源我发现docx文件可以被读取为简单的zip文件,我不知道这是否意味着可以在没有图像的情况下“重新压缩”而不影响文件的完整性docx(编辑:只需删除图像即可,但python-docx由于缺少对图像的引用而无法继续使用此文件),但认为这可能是解决方案的路径。

有任何想法吗?

python docx python-docx

3
推荐指数
1
解决办法
4059
查看次数

如何在 python-docx 中使用 add_picture() 在背景上插入图像(与文本重叠)?

如何通过 python-docx 将图像插入文本背景(如重叠)?

我知道图像可以在其右侧或左侧放置文本。

但我想要像在任何文本上浮动图像之类的东西。就像背景图像一样。

有可能这样做吗?

谢谢。

overlay image docx overlapping python-docx

3
推荐指数
1
解决办法
3620
查看次数

如何创建文件下载按钮?<a href> 和 Axios 不工作

我试图在我的个人网站上创建一个下载按钮,供人们下载我的 docx 简历,但遇到了一些问题。

首先我用简单的 href 链接来做到这一点

<a href="xxx.docx" download><button>download my resume</button></a>
Run Code Online (Sandbox Code Playgroud)

但没有用。

然后我尝试了 axois 方式,创建一个按钮,并将单击操作绑定到 downloadFile(){} 方法,但不起作用,出现错误

获取http://localhost:8080/assets/assets/imgs/cv_eudora.docx404(未找到)

Uncaught (in promise) Error: Request failed with status code 404
    at createError (createError.js?2d83:16)
    at settle (settle.js?467f:17)
    at XMLHttpRequest.handleLoad (xhr.js?b50d:59)
Run Code Online (Sandbox Code Playgroud)

截屏

我认为这是因为 downloadFile(){} 函数中的 url 部分没有正确说明,但不知道在 vue 中编写路径的正确方法。路径本身应该是正确的,因为当我这样做时,它甚至一路上都有自动提示选项。

Uncaught (in promise) Error: Request failed with status code 404
    at createError (createError.js?2d83:16)
    at settle (settle.js?467f:17)
    at XMLHttpRequest.handleLoad (xhr.js?b50d:59)
Run Code Online (Sandbox Code Playgroud)
<button @click="downloadFile()">download my resume</button>
Run Code Online (Sandbox Code Playgroud)

download docx webpack vue.js

3
推荐指数
1
解决办法
5432
查看次数

如何使用 DOCX.JS 设置列大小

我正在使用电子和反应创建一个应用程序,我需要动态创建一个Word文本文档,我找到了一个很棒的包,DOCX,但我需要创建一些表格,并且我无法设置列的大小,我需要帮助设置列的大小,遵循代码摘录和文档链接https://docx.js.org/#/

// eslint-disable-next-line
import { Document, Packer, Paragraph, TextRun, Table, TableRow, TableCell, VerticalAlign, HeadingLevel } from 'docx';
const {dialog} = window.require('electron').remote;
const app = window.require('electron').remote
const fs = app.require('fs');

const doc = new Document();

export default function createDocx(){

    const table = new Table({
        rows: [
            new TableRow({
                children: [
                    new TableCell({
                        children: [new Paragraph({}), new Paragraph({})],
                        verticalAlign: VerticalAlign.CENTER,
                    }),
                    new TableCell({
                        children: [new Paragraph({}), new Paragraph({})],
                        verticalAlign: VerticalAlign.CENTER,
                    }),
                ],
            }),
            new TableRow({
                children: [
                    new TableCell({
                        children: [ …
Run Code Online (Sandbox Code Playgroud)

javascript ms-word docx reactjs electron

3
推荐指数
1
解决办法
6255
查看次数

将样式 ID/名称从 HTML 传送到 .docx?

是否有可能以某种方式告诉pandoc将样式名称从原始 HTML 转移到 .docx?

我知道为了调整实际样式,我应该reference.docx使用pandoc. 但是,reference.docx仅限于它所具有的样式:标题、正文、块文本等。

我想:

  1. 在输入 HTML 中指定“myStyle”样式(通过“class”属性,通过任何其他 HTML 属性,甚至通过用 Lua 编写的过滤器代码),

    <html>
      <body>
        <p>Hello</p>
        <p class="myStyle">World!</p>
      </body>
    </html>
    
    Run Code Online (Sandbox Code Playgroud)
  2. 添加自定义“myStyle”以reference.docx使用 Word,

  3. 运行html->docx转换并期望pandoc生成一个带有“myStyle”的段落元素(而不是,我相信它默认BodyText设置),因此最终结果如下所示(为了简洁起见,结果内部的内容被剪切):word/document.xmloutput.docx

    <w:p>
      <w:pPr>
        <w:pStyle w:val="BodyText" />
      </w:pPr>
      <w:r>
        <w:txml:space="preserve">Hello</w:t>
      </w:r>
    </w:p>
    <w:p>
      <w:pPr>
        <w:pStyle w:val="myStyle" />
      </w:pPr>
      <w:r>
        <w:txml:space="preserve">World!</w:t>
      </w:r>
    </w:p>
    
    Run Code Online (Sandbox Code Playgroud)

一些证据 styleId可以传递,但我不太理解,也找不到任何有关它的文档。

Lua 中的过滤文档指出,您可以attrs在操作 a 时访问pandoc.div,但它没有说明任何 attr 是否会被 …

lua docx pandoc

3
推荐指数
1
解决办法
664
查看次数

php docx模板修改

有没有人有编辑docx模板的经验.我的php管理区域需要修改docx模板的功能,这个功能将被大量使用,因此内存很重要.

我发现phpword是测试版,它可以工作,但不是100%

我一直在谷歌搜索并找到phpdocx,有没有人使用过这个并且可以给我一些反馈?

是否有任何其他解决方案,我需要的是能够在docx模板中更改文本和图像.

我将准备支付服务但不支付群众费用,并且优先购买一次性许可费.

php templates docx phpdocx

2
推荐指数
1
解决办法
2万
查看次数

使用APACHE POI处理docx文件

我正在尝试从数据库检索docx,并尝试通过检查其内容来对其进行处理。我认为mycode检索了我想要的文件,但似乎我还没有完全理解APACHE POI。我在stacktrace上遇到一个错误,说我对POI的想法有误吗?

这是我加载文件的方式:

public void loadFile(String FileName)
{
    InputStream is = null;
    try
    {
        //Connecting to MYSQL Database
        Class.forName(driver).newInstance();
        con = DriverManager.getConnection(url+dbName,userName,password);

        Statement stmt = (Statement) con.createStatement();
        ResultSet rs = stmt.executeQuery("SELECT FILE FROM doccompfiles WHERE FileName = '"+ FileName +"'");

        while(rs.next())
        {
            is = rs.getBinaryStream("FILE");
        }

        HWPFDocument doc = new HWPFDocument(is);
        WordExtractor we = new WordExtractor(doc);

        String[] paragraphs = we.getParagraphText();
        JOptionPane.showMessageDialog(null, "Number of Paragraphs" + paragraphs.length);
        con.close();
    }
    catch(Exception ex)
    {
        ex.printStackTrace();
    }
}
Run Code Online (Sandbox Code Playgroud)

堆栈跟踪:

org.apache.poi.poifs.filesystem.OfficeXmlFileException: The supplied data appears …
Run Code Online (Sandbox Code Playgroud)

java apache file docx apache-poi

2
推荐指数
1
解决办法
4807
查看次数

如何使用tm创建*.docx文件的语料库?

我有一个MS Word文档的混合文件类型集合.有些文件是*.doc,有些是*.docx.我正在学习使用tm并且我(或多或少*)使用以下方法成功创建了由*.doc文件组成的语料库:

ex_eng <- Corpus(DirSource('~/R/expertise/corpus/english'), 
                 readerControl=list(reader=readDOC, 
                                    language='en_CA',
                                    load=TRUE));
Run Code Online (Sandbox Code Playgroud)

此命令不处理*.docx文件.我认为我需要一个不同的读者.从这篇文章中,我了解到我可以编写自己的文章(很好地理解我目前没有的.docx格式).

readDOC阅读器使用antiword来解析*.doc文件.是否有类似的应用程序将解析*.docx文件?

或者更好的是,是否已经有一种使用tm创建*.docx文件语料库的标准方法?


*或多或少,因为虽然文件进入并且可读,但我对每个文档都会收到此警告: In readLines(y, encoding = x$Encoding) : incomplete final line found on 'path/to/a/file.doc'

r docx tm

2
推荐指数
1
解决办法
4056
查看次数

Docx缺少属性

我正在尝试使用python中的docx库来考虑word文档.问题是,无论我导入什么,我都会得到关于'无属性'的错误消息.例如 - 文件

from docx import Document
Run Code Online (Sandbox Code Playgroud)

给出输出

cannot import name Document
Run Code Online (Sandbox Code Playgroud)

并且任何尝试使用Document都会以错误结束

AttributeError: 'module' object has no attribute 'Document'
Run Code Online (Sandbox Code Playgroud)

任何语法似乎都是正确的.我正在使用docx模块版本0.2.4.

谢谢你的帮助.

python docx python-2.7

2
推荐指数
1
解决办法
4583
查看次数

设置POI XWPFParagraph行间距

我想在使用POI库创建的文档中的所有段落上设置行间距.我想将段落行间距设置为1.0,并删除段落前后的空格,但生成的文档继续使用1.15行间距并在段落后添加空格.这是我的代码:

for (XWPFParagraph paragraph : doc.getParagraphs()) {
        paragraph.setSpacingAfter(0);
        paragraph.setSpacingAfterLines(0);
        paragraph.setSpacingBefore(0);
        paragraph.setSpacingBeforeLines(0);
        paragraph.setSpacingLineRule(LineSpacingRule.EXACT);
        paragraph.setVerticalAlignment(TextAlignment.TOP);
    }
Run Code Online (Sandbox Code Playgroud)

请帮忙,谢谢,

java docx apache-poi

2
推荐指数
1
解决办法
6370
查看次数