通过核心Erlang编译Erlang到Javascript

Gor*_*rie 9 javascript compiler-construction erlang source-maps coreerlang

所以开始在LuvvieScript上取得进展,然后在Twitter上开始了一些... https://twitter.com/gordonguthrie/status/389659700741943296

Anthony Ramine https://twitter.com/nokusu指出我做错了,我应该通过Core Erlang而不是Erlang AST从Erlang编译成JavaScript.这对我来说是一个引人注目但又没有吸引力的选择......推特不是讨论的正确媒介我想我会在这里写下来并得到一些建议.

战略概述

LuvvieScript有三个核心要求:

  • Erlang的有效子集,编译为相同且高性能的Javascript
  • 一个完整的源映射,以便可以在浏览器中使用LuvvieScript而不是Javascript进行调试
  • 一个'运行时'客户端javascript环境(带有服务器端通信)来执行LuvvieScript模块(一种页内主管...)

这些选项中的第三个有点超出了本次辩论的范围,但前两个是核心.

有一个懒惰的结果 - 我想尽可能多地使用Erlang和Javascript语法工具(词法分析器,解析器,标记器,AST变换等等)并编写最少量的代码.

当前的思考

代码当前的编写方式如下:

基本上我得到一个看起来像这样的Erlang AST:

 [{function,
      {19,{1,9}},
      atom1_fn,0,
      [{clause,
           {19,none},
           [],
           [[]],
           [{match,
                {20,none},
                [{var,{20,{5,6}},'D'}],
                [{atom,{20,{11,15}},blue}]},
            {var,{21,{5,6}},'D'}]}]}]},
Run Code Online (Sandbox Code Playgroud)

然后我将其转换为Javascript JSON AST,如下所示:

{
    "type": "Program",
    "body": [
        {
            "type": "VariableDeclaration",
            "declarations": [
                {
                    "type": "VariableDeclarator",
                    "id": {
                        "type": "Identifier",
                        "name": "answer",
                        "loc": {
                            "start": {
                                "line": 2,
                                "column": 4
                            },
                            "end": {
                                "line": 2,
                                "column": 10
                            }
                        }
                    },
                    "init": {
                        "type": "BinaryExpression",
                        "operator": "*",
                        "left": {
                            "type": "Literal",
                            "value": 6,
                            "raw": "6",
                            "loc": {
                                "start": {
                                    "line": 2,
                                    "column": 13
                                },
                                "end": {
                                    "line": 2,
                                    "column": 14
                                }
                            }
                        },
                        "right": {
                            "type": "Literal",
                            "value": 7,
                            "raw": "7",
                            "loc": {
                                "start": {
                                    "line": 2,
                                    "column": 17
                                },
                                "end": {
                                    "line": 2,
                                    "column": 18
                                }
                            }
                        },
                        "loc": {
                            "start": {
                                "line": 2,
                                "column": 13
                            },
                            "end": {
                                "line": 2,
                                "column": 18
                            }
                        }
                    },
                    "loc": {
                        "start": {
                            "line": 2,
                            "column": 4
                        },
                        "end": {
                            "line": 2,
                            "column": 18
                        }
                    }
                }
            ],
            "kind": "var",
            "loc": {
                "start": {
                    "line": 2,
                    "column": 0
                },
                "end": {
                    "line": 2,
                    "column": 19
                }
            }
        }
    ],
    "loc": {
        "start": {
            "line": 2,
            "column": 0
          },
        "end": {
            "line": 2,
            "column": 19
           }
    }
}
Run Code Online (Sandbox Code Playgroud)

El Problemo

安东尼的观点很好 - Core Erlang是一种比Erlang更简单,更常规的语言,应该比简单的Erlang更容易转换为Javascript,但它没有很好的记录.

我可以很容易地得到一个类似于Core Erlang的AST表示:

{c_module,[],
    {c_literal,[],basic_types},
    [{c_var,[],{atom1_fn,0}},
     {c_var,[],{atom2_fn,0}},
     {c_var,[],{bish_fn,1}},
     {c_var,[],{boolean_fn,0}},
     {c_var,[],{float_fn,0}},
     {c_var,[],{int_fn,0}},
     {c_var,[],{module_info,0}},
     {c_var,[],{module_info,1}},
     {c_var,[],{string_fn,0}}],
    [],
    [{{c_var,[],{int_fn,0}},{c_fun,[],[],{c_literal,[],1}}},
     {{c_var,[],{float_fn,0}},{c_fun,[],[],{c_literal,[],2.3}}},
     {{c_var,[],{boolean_fn,0}},{c_fun,[],[],{c_literal,[],true}}},
     {{c_var,[],{atom1_fn,0}},{c_fun,[],[],{c_literal,[],blue}}},
     {{c_var,[],{atom2_fn,0}},{c_fun,[],[],{c_literal,[],'Blue 4 U'}}},
     {{c_var,[],{string_fn,0}},{c_fun,[],[],{c_literal,[],"string theory"}}},
     {{c_var,[],{bish_fn,1}},
      {c_fun,[],
          [{c_var,[],'_cor0'}],
          {c_case,[],
              {c_var,[],'_cor0'},
              [{c_clause,[],
                   [{c_literal,[],bash}],
                   {c_literal,[],true},
                   {c_literal,[],berk}},
               {c_clause,[],
                   [{c_literal,[],bosh}],
                   {c_literal,[],true},
                   {c_literal,[],bork}},
               {c_clause,
                   [compiler_generated],
                       [{c_var,[],'_cor1'}],
                   {c_literal,[],true},
                   {c_primop,[],
                       {c_literal,[],match_fail},
                       [{c_tuple,[],
                            [{c_literal,[],case_clause},
                             {c_var,[],'_cor1'}]}]}}]}}},
     {{c_var,[],{module_info,0}},
      {c_fun,[],[],
          {c_call,[],
              {c_literal,[],erlang},
              {c_literal,[],get_module_info},
              [{c_literal,[],basic_types}]}}},
     {{c_var,[],{module_info,1}},
      {c_fun,[],
          [{c_var,[],'_cor0'}],
          {c_call,[],
              {c_literal,[],erlang},
              {c_literal,[],get_module_info},
              [{c_literal,[],basic_types},{c_var,[],'_cor0'}]}}}]}
Run Code Online (Sandbox Code Playgroud)

但没有行col/nos.所以我可以得到一个生成JS的AST - 但关键不是SourceMaps.

问题1如何获得我需要的行信息 - (我已经可以从'普通'Erlang标记中获取列信息...)

Erlang Core在生产过程中与普通的Erlang略有不同,因为它开始用函数调用中的变量名替换它自己的内部函数,这也会导致一些源映射问题.一个例子就是这个Erlang子句:

bish_fn(A) ->
    case A of
        bash -> berk;
        bosh -> bork
    end.
Run Code Online (Sandbox Code Playgroud)

Erlang AST很好地保留了这些名字:

 [{function,
      {31,{1,8}},
      bish_fn,1,
      [{clause,
           {31,none},
           [{var,{31,{11,12}},'A'}],
           [[]],
           [{'case',
                {32,none},
                [{var,{32,{11,12}},'A'}],
                [{clause,
                     {33,none},
                     [{atom,{33,{9,13}},bash}],
                     [[]],
                     [{atom,{34,{13,17}},berk}]},
                 {clause,
                     {35,none},
                     [{atom,{35,{9,13}},bosh}],
                     [[]],
                     [{atom,{36,{13,17}},bork}]}]}]}]}]},
Run Code Online (Sandbox Code Playgroud)

Core Erlang已经改变了函数中调用的参数的名称:

'bish_fn'/1 =
    %% Line 30
    fun (_cor0) ->
    %% Line 31
    case _cor0 of
      %% Line 32
      <'bash'> when 'true' ->
          'berk'
      %% Line 33
      <'bosh'> when 'true' ->
          'bork'
      ( <_cor1> when 'true' ->
        primop 'match_fail'
            ({'case_clause',_cor1})
        -| ['compiler_generated'] )
    end
Run Code Online (Sandbox Code Playgroud)

问题2是我可以在Core Erlang中保留或映射变量名称吗?

问题3我很欣赏Core Erlang是专门设计的,可以很容易地编译 Erlang并编写可以改变Erlang Code的工具 - 但问题是它是否会让它更容易编译 Erlang?

选项

我可以分叉核心erlang代码并添加源映射选项,但我在这里玩Lazy Man卡...

更新

为了回应Eric的回应,我应该澄清我是如何生成Core Erlang cerl记录的.我首先使用以下方法将我的普通Erlang编译为核心erlang:

c(some_module, to_core)
Run Code Online (Sandbox Code Playgroud)

然后我使用core_scancore_parse在这个功能中刻从compiler.erl:

compile(File) ->
    case file:read_file(File) of
        {ok,Bin} ->
            case core_scan:string(binary_to_list(Bin)) of
                {ok,Toks,_} ->
                    case core_parse:parse(Toks) of
                        {ok, Mod} ->
                            {ok, Mod};
                        {error,E} ->
                            {error, {parse, E}}
                    end;
                {error,E,_} ->
                    {error, {scan, E}}
            end;
        {error,E} ->
            {error,{read, E}}
    end.
Run Code Online (Sandbox Code Playgroud)

问题是我如何才能获得该工具链以发出带注释的AST.我怀疑我需要自己添加这些选项:(

eri*_*itt 5

1)行号作为注释提供.如果你看一下我真正推荐你使用的cerl模块,你会看到一切都需要一个注释列表.其中一个注释是一个代表行号的简单数字.如果我直接记得核心AST正确,并且atom1_fn var在第10行.ASV看起来如下:

{c_var,[10],{atom1_fn,0}}
Run Code Online (Sandbox Code Playgroud)

2)不,你必须自己做所有的簿记.没有任何东西可以帮到你.

3)我不确定我理解这个问题.

安东尼所说的一切都是关于Core Erlang的.这就是我选择Core Erlang作为Joxa目标语言的原因.我从中学到的教训是,虽然Core Erlang是一种非常易于定位的目标语言,但它有两个主要的缺点,建议不要使用它.

1)Dialyzer仅在梁文件的抽象代码块中使用Erlang AST.编译到Core Erlang时,无法将这样的AST放入该抽象代码块中.所以如果你的目标是Core Erlang,Dialyzer就不会为你工作.无论您是否生成正确的spec属性,都是如此.

2)您放弃使用适用于Erlang AST的工具.例如,编译到Erlang Source的能力.来自源代码编译器的Core Erlang是非常错误的,根本不起作用.这是在许多实用主义领域的重大胜利.

由于上述原因,我实际上正在将Joxa重定向到Erlang AST.

顺便说一句,您可能对这个项目感兴趣.https://github.com/5HT/shen.它是Erlang AST的javascript编译器,已经存在并正在运行.虽然我没有很多经验.

**编辑:您实际上可以看到从Erlang源生成的核心erlang ast.这有助于学习如何编译到核心.ec_compileerlware_commonsrepo中有很多实用功能来帮助它.