标签: doc

使用PHP linux将doc,docx,pdf转换为HTML

我运行一个求职网站,我需要在运行php的linux CentOS服务器上将doc,docx和pdf文件转换为HTML.人们将这些文件作为简历提交.到目前为止,我发现PHPDocx非常适合将docx转换为html.但我被困在doc/pdf.当我运行测试时,PDFTOHTML给出错误"颜色不好".至于doc,我只找到了wvwave,它看起来既复杂又笨重.

有没有人对如何轻松地将doc/pdf转换为HTML有任何想法?

php linux pdf doc docx

9
推荐指数
1
解决办法
6879
查看次数

如何使用Ghostscript将XPS转换为PDF或XPS转换为DOC?

哪一个是将XPS转换为PDF和XPS转换为DOC的最佳第三方库.

pdf doc xps ghostscript

8
推荐指数
2
解决办法
8969
查看次数

rails发布说明或更改日志的位置

Rails 3.0.4刚刚发布.但我没有看到任何更改日志文件.

那么rails 3.0.4更新日志在哪里?我需要知道是否应该将我的所有应用程序从3.0.3升级到3.0.4.

ruby-on-rails doc

8
推荐指数
2
解决办法
3373
查看次数

使用Java将DOC文件转换为DOCX

我需要在我正在开发的Java软件中使用DOCX文件(实际上是其中包含的XML),但我公司的一些人仍然使用DOC格式.

您知道是否有办法使用Java将DOC文件转换为DOCX格式?我知道使用C#是可能的,但这不是一个选择

我用Google搜索了,但没有出现......

谢谢

java doc docx ms-office

8
推荐指数
1
解决办法
2万
查看次数

使用C#读取doc和docx文件,而不在服务器上安装MS Office

我正在开发一个项目(asp.net,c#,vb 2010,.net 4),我需要阅读DOC和DOCX文件,我已经上传了(我已经完成了上传部分).棘手的部分是我没有在服务器上安装MS Office而且我无法使用它.

是否有任何公共图书馆可以包含在我的项目中,而无需安装任何东西?这两个文档都很简单:

NUMBER TAB STRING  
NUMBER TAB STRING  
NUMBER TAB STRING  
...  
Run Code Online (Sandbox Code Playgroud)

我需要为每一行(段落)提取数字和字符串.

愿有人帮忙吗?我应该再次重复一遍,因为我无法在服务器上安装任何东西.

c# doc docx

7
推荐指数
1
解决办法
2万
查看次数

C#/ASP.NET - 从 PDF/DOC 文件获取缩略图

我有一个 ASP.NET WebForms 应用程序(用 C# 编写),允许用户使用 FileUpload 控件上传文件。

如果我可以自动从文件生成缩略图,那就太好了。JPG/PNG 等图像当然是微不足道的,但用户经常会上传 .DOC 和 .PDF 文件 - 有没有一种方法可以将 .DOC 和 .PDF 文件本质上转换为图像,以便我可以获得缩略图?

谢谢!

c# pdf asp.net doc

7
推荐指数
1
解决办法
8527
查看次数

如何使用POI api读取java中的doc和docx文件

我正在尝试阅读doc和docx文件.这是代码:

  static String distination="E:\\         
  static String docFileName="Requirements.docx";
 public static void main(String[] args) throws FileNotFoundException, IOException {
    // TODO code application logic here
    ReadFile rf= new ReadFile();
    rf.ReadFileParagraph(distination+docFileName);


  }
  public void ReadFileParagraph(String path) throws FileNotFoundException, IOException
    {
        FileInputStream fis;
        File file = new File(path);
        fis=new FileInputStream(file.getAbsolutePath());
           String filename=file.getName();

        String fileExtension=fileExtension(path);
        if(fileExtension.equals("doc"))
        {
             HWPFDocument document=new HWPFDocument(fis);
             WordExtractor DocExtractor = new WordExtractor(document);
             ReadDocFile(DocExtractor,filename);

        }
        else if(fileExtension.equals("docx"))
        {

            XWPFDocument documentX = new XWPFDocument(fis);            
            List<XWPFParagraph> pera =documentX.getParagraphs();
            ReadDocXFile(pera,filename);
        }
        else
        {
            System.out.println("format does not match"); …
Run Code Online (Sandbox Code Playgroud)

java doc docx apache-poi

7
推荐指数
1
解决办法
8235
查看次数

如何在C#(.NET)中加载MS Word文档的文本?

如何在不执行此操作的情况下将MS Word文档(.doc和.docx)加载到内存(变量)?

wordApp.Documents.Open

我不想打开MS Word,我只想在里面写这个文字.

你给了我DOCX的答案,但DOC怎么样?我想要免费和高性能的解决方案 - 不要打开12.000个Word实例来处理所有这些.:( Aspose是商业产品,900美元是我做的太多的方式.

.net c# ms-word doc docx

6
推荐指数
1
解决办法
2万
查看次数

如何在没有openoffice.org的情况下将ODT转换为DOC/RTF

有没有办法在没有openoffice或任何依赖安装openoffice的库的情况下将odt文件转换为linux或rtf?

rtf openoffice.org doc odf

6
推荐指数
1
解决办法
1万
查看次数

在java中将html转换为doc

我想将html或xhtml文档(最好是样式)转换为Microsoft .doc和/或.docx格式.

似乎有很多例子可以反过来这样做,但我没有找到任何转换为​​ms文档格式的有用示例.

任何人都可以指向我api或提供一个这样做的例子

非常感谢

html java xhtml doc docx

6
推荐指数
1
解决办法
2万
查看次数

标签 统计

doc ×10

docx ×6

c# ×3

java ×3

pdf ×3

.net ×1

apache-poi ×1

asp.net ×1

ghostscript ×1

html ×1

linux ×1

ms-office ×1

ms-word ×1

odf ×1

openoffice.org ×1

php ×1

rtf ×1

ruby-on-rails ×1

xhtml ×1

xps ×1