相关疑难解决方法(0)

如何使用JavaScript在浏览器中呈现Word文档(.doc,.docx)?

我已成功完成代码以在浏览器中显示PDF文件,而不是"打开/保存"对话框.现在,我一直试图在浏览器中显示Word文档.我想在Firefox,IE7 +,Chrome等中显示Word文档.

任何人都可以帮忙吗?在浏览器中显示Word文档时,我总是收到"打开/保存"对话框.我想使用JavaScript实现此功能.

javascript browser ms-word

120
推荐指数
5
解决办法
24万
查看次数

不使用COM /自动化从Word文档中提取文本的最佳方法?

有没有合理的方法从不依赖于COM自动化的Word文件中提取纯文本?(这是部署在非Windows平台上的Web应用程序的一项功能 - 在这种情况下是不可协商的.)

Antiword似乎可能是一个合理的选择,但似乎它可能会被抛弃.

Python解决方案是理想的,但似乎不可用.

python ms-word

24
推荐指数
2
解决办法
5万
查看次数

如何使用PHP从word文档中提取文本内容?

我想用PHP从word文档中提取文本内容.

我在Microsoft Word for Mac 2011中创建了一个新的word文档.编辑:还通过在Windows 7下的Microsoft Word中创建相同的文档进行了测试.

该文件的内容是

The quick brown fox jumps over the lazy dog
Run Code Online (Sandbox Code Playgroud)

我已将其作为Word 97-2004文档(.doc)保存到磁盘.

我正在使用phpoffice/phpword和此代码来提取文本:

<?php

$source = "word.doc";

$phpWord = \PhpOffice\PhpWord\IOFactory::load($source, 'MsDoc');

$text = '';

$sections = $phpWord->getSections();

foreach ($sections as $s) {
    $els = $s->getElements();
    foreach ($els as $e) {
        if (get_class($e) === 'PhpOffice\PhpWord\Element\Text') {
            $text .= $e->getText();
        } elseif (get_class($e) === 'PhpOffice\PhpWord\Section\TextBreak') {
            $text .= " \n";
        } else {
            throw new Exception('Unknown class type ' . get_class($e));
        } …
Run Code Online (Sandbox Code Playgroud)

php phpoffice

18
推荐指数
2
解决办法
5804
查看次数

如何从纯C++中的MS word文档文件中提取纯文本?

是否有任何纯C++库从.doc文件中提取纯文本?

我正在开发一个C++程序来读取.doc和.pdf文件.我必须从文件中提取纯文本并将其写入.txt文件.

c++

7
推荐指数
1
解决办法
7918
查看次数

命令行将目录(和子目录)中的所有 .docx 转换为文本文件并写入新文件

我想从命令行将目录(和子目录)中的所有 .docx 文件转换为文本文件(这样我可以在这些文件上使用 grep after )。我找到了这个

unzip -p tutu.docx word/document.xml | sed -e 's/<\/w:p>/\n/g; s/<[^>]\{1,\}>//g; s/[^[:print:]\n]\{1,\}//g'
Run Code Online (Sandbox Code Playgroud)

这里效果很好,但它在终端中发送文件。我想将新的文本文件(例如 .txt)写入与 .docx 文件相同的目录中。我想要一个脚本来递归地执行此操作。

我有这个,使用反词,可以完成我想要的 .doc 文件,但它不适用于 .docx 文件。

find . -name '*.doc' | while read i; do antiword -i 1 "${i}" >"${i/doc/txt}"; done
Run Code Online (Sandbox Code Playgroud)

我尝试将两者混合,但没有成功...能够同时执行这两项操作的命令行将不胜感激!

谢谢

grep doc unzip

3
推荐指数
1
解决办法
3133
查看次数

标签 统计

ms-word ×2

browser ×1

c++ ×1

doc ×1

grep ×1

javascript ×1

php ×1

phpoffice ×1

python ×1

unzip ×1