如何将Haskell编译成无类型的lambda演算(或GHC核心)?

Pet*_*lák 9 haskell lambda-calculus ghc-api

我正在寻找如何将简单的Haskell程序(没有导入的库,只是数据类型和纯函数)转换为无类型lambda演算的术语.一种有希望的方法似乎是使用GHC API将程序编译成GHC核心,然后可以将其转换为无类型的lambda演算.

如何使用GHC API加载Haskell程序并将其编译为Core?

Cir*_*dec 5

从ghc docs中的GHC模块文档:

compileToCoreModule :: GhcMonad m => FilePath -> m CoreModule

这是访问与模块对应的Core绑定的方法.compileToCore解析,类型检查和desugars模块,然后返回生成的Core模块(包括模块名称,类型声明和函数声明),如果成功的话.

compileToCoreSimplified :: GhcMonad m => FilePath -> m CoreModule

喜欢compileToCoreModule,但调用简化器,以便返回简化和整理的Core.

我通过查看GHC模块列表,注意到Desugar模块,注意到ModGuts结果deSugar,下载所有文档以及搜索文本来找到这个ModGuts.

最小的例子

我们的示例将编译一个简单的模块,以便我们可以看到核心的样子.它使用ghc-paths来提供ghc libs目录的位置.核心将通过CoreModule包含CoreBinds列表在内存中表示.我们不能直接转储AST,因为没有Show描述AST CoreSynOutputable实例,但是实例CoreModule将打印核心,所以我们可以看到我们编译为核心.

import GHC
import DynFlags
import Outputable (Outputable, showPpr)
import qualified GHC.Paths as Paths

import Data.Functor
Run Code Online (Sandbox Code Playgroud)

runGhc'负责编译核心模块所需的所有设置,没有imports和no TemplateHaskell.我们完全关闭链接器NoLink并告诉编译器什么都不产生HscNothing.

runGhc' :: Ghc a -> IO a
runGhc' ga = do
    runGhc (Just Paths.libdir) $ do
        dflags <- getDynFlags
        let dflags2 = dflags { ghcLink   = NoLink
                             , hscTarget = HscNothing
                             }
        setSessionDynFlags dflags2
        ga
Run Code Online (Sandbox Code Playgroud)

编译模块芯由具有设定目标的guessTargetaddTarget,任选地与加载的依赖load,以构建模块图表depanel,find荷兰国际集团的正确ModSummary的模块图中,解析与所述模块parseModule,类型与检查它typecheckModule,与desugarring它desugarModule,将其转换为ModGutscoreModuleDesugaredMod实例中获取desugarring的结果,并从中提取核心ModGuts.所有这些都包含在一个很好的包装中compileToCoreModule.

compileExample :: Ghc CoreModule
compileExample = compileToCoreModule "prettyPrint2dList.hs"
Run Code Online (Sandbox Code Playgroud)

我们的整个示例程序将输出核心showPpr.

showPpr' :: (Functor m, Outputable a, HasDynFlags m) => a -> m String
showPpr' a = (flip showPpr) a <$> getDynFlags

main = runGhc' (compileExample >>= showPpr') >>= putStrLn
Run Code Online (Sandbox Code Playgroud)

编译上面的示例需要使用-package ghc标志来公开通常隐藏的ghc api包.

我们将编译为core的示例模块"prettyPrint2dList.hs"包含一个数据类型和一些使用前奏函数的代码.

data X = Y | Z
         deriving (Eq, Show)

type R = [X]
type W = [R]

example = map (\x -> take x (cycle [Y, Z])) [0..]

main = undefined
Run Code Online (Sandbox Code Playgroud)

这产生了大量漂亮的印刷核心.

%module main:Main (Safe-Inferred) [01D :-> Identifier `:Main.main',
                                   a1f2 :-> Identifier `$c==', a1f5 :-> Identifier `$c/=',
                                   a1fb :-> Identifier `$cshowsPrec', a1fh :-> Identifier `$cshow',
                                   a1fk :-> Identifier `$cshowList',
                                   r0 :-> Identifier `Main.$fShowX', r1 :-> Identifier `Main.$fEqX',
                                   r2 :-> Type constructor `Main.R',
                                   r3 :-> Type constructor `Main.X', r4 :-> Identifier `Main.main',
                                   rqS :-> Type constructor `Main.W',
                                   rrS :-> Data constructor `Main.Y', rrV :-> Identifier `Main.Y',
                                   rrW :-> Data constructor `Main.Z', rrX :-> Identifier `Main.Z',
                                   rL2 :-> Identifier `Main.example']
Main.example :: [[Main.X]]
[LclIdX, Str=DmdType]
Main.example =
  GHC.Base.map
    @ GHC.Types.Int
    @ [Main.X]
    (\ (x :: GHC.Types.Int) ->
       GHC.List.take
         @ Main.X
         x
         (GHC.List.cycle
            @ Main.X
            (GHC.Types.:
               @ Main.X
               Main.Y
               (GHC.Types.: @ Main.X Main.Z (GHC.Types.[] @ Main.X)))))
    (GHC.Enum.enumFrom
       @ GHC.Types.Int GHC.Enum.$fEnumInt (GHC.Types.I# 0))
Main.main :: forall t. t
[LclIdX, Str=DmdType]
Main.main = GHC.Err.undefined
$cshowsPrec :: GHC.Types.Int -> Main.X -> GHC.Show.ShowS
[LclId, Str=DmdType]
$cshowsPrec =
  \ _ [Occ=Dead] (ds_d1gG :: Main.X) ->
    case ds_d1gG of _ [Occ=Dead] {
      Main.Y ->
        GHC.Show.showString
          (GHC.Types.:
             @ GHC.Types.Char
             (GHC.Types.C# 'Y')
             (GHC.Types.[] @ GHC.Types.Char));
      Main.Z ->
        GHC.Show.showString
          (GHC.Types.:
             @ GHC.Types.Char
             (GHC.Types.C# 'Z')
             (GHC.Types.[] @ GHC.Types.Char))
    }
Main.$fShowX [InlPrag=[ALWAYS] CONLIKE] :: GHC.Show.Show Main.X
[LclIdX[DFunId],
 Str=DmdType,
 Unf=DFun: \ ->
       GHC.Show.D:Show TYPE Main.X $cshowsPrec $cshow $cshowList]
Main.$fShowX =
  GHC.Show.D:Show @ Main.X $cshowsPrec $cshow $cshowList;
$cshowList [Occ=LoopBreaker] :: [Main.X] -> GHC.Show.ShowS
[LclId, Str=DmdType]
$cshowList =
  GHC.Show.showList__
    @ Main.X
    (GHC.Show.showsPrec @ Main.X Main.$fShowX (GHC.Types.I# 0));
$cshow [Occ=LoopBreaker] :: Main.X -> GHC.Base.String
[LclId, Str=DmdType]
$cshow = GHC.Show.$dmshow @ Main.X Main.$fShowX;
$c== :: Main.X -> Main.X -> GHC.Types.Bool
[LclId, Str=DmdType]
$c== =
  \ (ds_d1gB :: Main.X) (ds_d1gC :: Main.X) ->
    let {
      fail_d1gD :: GHC.Prim.Void# -> GHC.Types.Bool
      [LclId, Str=DmdType]
      fail_d1gD = \ _ [Occ=Dead, OS=OneShot] -> GHC.Types.False } in
    case ds_d1gB of _ [Occ=Dead] {
      Main.Y ->
        case ds_d1gC of _ [Occ=Dead] {
          __DEFAULT -> fail_d1gD GHC.Prim.void#;
          Main.Y -> GHC.Types.True
        };
      Main.Z ->
        case ds_d1gC of _ [Occ=Dead] {
          __DEFAULT -> fail_d1gD GHC.Prim.void#;
          Main.Z -> GHC.Types.True
        }
    }
Main.$fEqX [InlPrag=[ALWAYS] CONLIKE] :: GHC.Classes.Eq Main.X
[LclIdX[DFunId],
 Str=DmdType,
 Unf=DFun: \ -> GHC.Classes.D:Eq TYPE Main.X $c== $c/=]
Main.$fEqX = GHC.Classes.D:Eq @ Main.X $c== $c/=;
$c/= [Occ=LoopBreaker] :: Main.X -> Main.X -> GHC.Types.Bool
[LclId, Str=DmdType]
$c/= =
  \ (a :: Main.X) (b :: Main.X) ->
    GHC.Classes.not (GHC.Classes.== @ Main.X Main.$fEqX a b);
:Main.main :: GHC.Types.IO GHC.Prim.Any
[LclIdX, Str=DmdType]
:Main.main =
  GHC.TopHandler.runMainIO
    @ GHC.Prim.Any (Main.main @ (GHC.Types.IO GHC.Prim.Any))
Run Code Online (Sandbox Code Playgroud)