使用 libclang 解析多个文件时可以共享工作吗?

ajp*_*ajp 5 libclang

如果我在一个大项目中有多个文件,所有文件共享大量包含的头文件,有什么办法可以共享解析头文件的工作吗?我曾希望创建一个索引然后向其中添加多个 translationUnit 可以导致一些工作被共享 - 但是即使是(伪代码)

index = clang_createIndex();
clang_parseTranslationUnit(index, "myfile");
clang_parseTranslationUnit(index, "myfile");
Run Code Online (Sandbox Code Playgroud)

每次调用 parseTranslationUnit 似乎都花费了全部时间,性能并不比

index1 = clang_createIndex();
clang_parseTranslationUnit(index1, "myfile");
index2 = clang_createIndex();
clang_parseTranslationUnit(index2, "myfile");
Run Code Online (Sandbox Code Playgroud)

我知道有专门的函数可以重新解析完全相同的文件;然而,我真正想要的是解析“myfile1”和“myfile2”可以共享解析“myheader.h”的工作,并且重新解析特定的函数在那里无济于事。

作为一个子问题,重用索引和为每个翻译单元创建新索引之间有什么有意义的区别吗?

ffe*_*tte 5

一种方法是从项目中的共享头文件创建预编译头文件(PCH 文件)。

沿着这些路线的东西似乎有效(您可以在此处查看整个示例):

  auto Idx = clang_createIndex (0, 0);
  CXTranslationUnit TU;
  Timer t;

  {
    char const *args[] = { "-xc++", "foo.hxx" };
    int nargs = 2;

    t.reset();
    TU = clang_parseTranslationUnit(Idx, 0, args, nargs, 0, 0, CXTranslationUnit_ForSerialization);
    std::cerr << "PCH parse time: " << t.get() << std::endl;
    displayDiagnostics (TU);
    clang_saveTranslationUnit (TU, "foo.pch", clang_defaultSaveOptions(TU));
    clang_disposeTranslationUnit (TU);
  }

  {
    char const *args[] = { "-include-pch", "foo.pch", "foo.cxx" };
    int nargs = 3;

    t.reset();
    TU = clang_createTranslationUnitFromSourceFile(Idx, 0, nargs, args, 0, 0);
    std::cerr << "foo.cxx parse time: " << t.get() << std::endl;
    displayDiagnostics (TU);
    clang_disposeTranslationUnit (TU);
  }

  {
    char const *args[] = { "-include-pch", "foo.pch", "foo2.cxx" };
    int nargs = 3;

    t.reset();
    TU = clang_createTranslationUnitFromSourceFile(Idx, 0, nargs, args, 0, 0);
    std::cerr << "foo2.cxx parse time: " << t.get() << std::endl;
    displayDiagnostics (TU);
    clang_disposeTranslationUnit (TU);
  }
Run Code Online (Sandbox Code Playgroud)

产生以下输出:

PCH parse time: 5.35074
0 diagnostics

foo1.cxx parse time: 0.158232
0 diagnostics

foo2.cxx parse time: 0.143654
0 diagnostics
Run Code Online (Sandbox Code Playgroud)

我在 API 文档中没有找到关于 libclang 和预编译头的太多信息,但这里有几页出现了关键字:CINDEXTRANSLATION_UNIT

请注意,无论如何,此解决方案都不是最佳解决方案。我期待看到更好的答案。特别是:

  1. 每个源文件最多可以有一个预编译头
  2. 这里没有什么是libclang特定的;这与使用标准clang命令行用于构建时间优化的策略完全相同。
  3. 它并不是真正自动化,因为您必须显式创建预编译头(因此必须知道共享头文件的名称)
  4. 我认为在这里使用不同的 CXIndex 对象不会有什么不同