从Haskell调用Clojure函数

Geo*_*rge 15 haskell jvm clojure ffi

是否可以使用FFI或其他技巧从Haskell(在GHC上)调用Clojure函数?在这里,我有兴趣保持在GHC的范围内(即,不使用弗雷格).我也有兴趣将中心程序保存在Haskell中(意味着应该从Haskell调用Clojure函数,反之亦然).

这该怎么做?

Ale*_*lec 3

让我先从广告开始inline-java,只需编写调用Clojure API的 Java 代码即可轻松调用 Clojure 。也就是说,由于我没有运行前沿的 GHC 8.0.2(并且有各种其他安装问题),所以我无法使用它。当(如果)我开始inline-java运行时,我将更新此解决方案。

我的下面的解决方案首先通过 JNI 在 Clojure API for Java 中创建 Java 方法的 C 接口。然后,它使用 Haskell FFI 支持调用该 C 接口。您可能需要根据 JDK 和 JRE 的安装位置调整库并包含文件路径。如果一切正常,您应该看到7打印到标准输出。这是由 Clojure 计算3出来4的。

设置

如果您还没有Clojure 1.8.0 jar,请下载它。我们将使用Java Clojure API。确保您已经定义了LD_LIBRARY_PATH. 在我使用的机器上,这意味着导出

export LD_LIBRARY_PATH="/usr/lib64/jvm/java/jre/lib/amd64/server/"
Run Code Online (Sandbox Code Playgroud)

最后,这是一个使编译更容易的 makefile。您可能需要调整一些库并包含路径。

# makefile
all:
    gcc -O -c \
        -I /usr/lib64/jvm/java/include/ \
        -I /usr/lib64/jvm/java/include/linux/ \
        java.c
    ghc -O2 -Wall \
        -L/usr/lib64/jvm/java/jre/lib/amd64/server/ \
        -ljvm \
        clojure.hs \
        java.o

run:
    ./clojure

clean:
    rm -f java.o 
    rm -f clojure clojure.o clojure.hi
Run Code Online (Sandbox Code Playgroud)

Clojure 函数的 C 接口

现在,我们将为我们需要的 JVM 和 Clojure 功能创建一个 C 接口。为此,我们将使用JNI。我选择公开一个相当有限的接口:

  • create_vm使用类路径上的 Clojure jar 初始化一个新的 JVM(如果将 Clojure jar 放在同一文件夹以外的其他位置,请确保调整此设置)
  • load_methods查找我们需要的 Clojure 方法。值得庆幸的是, Java Clojure API非常小,因此我们可以毫无困难地包装几乎所有函数。我们还需要具有将数字或字符串等内容与其相应的 Clojure 表示形式相互转换的函数。我只这样做过java.lang.Long(这是 Clojure 的默认整数类型)。
    • readObj换行clojure.java.api.Clojure.read(使用 C 字符串)
    • varObjclojure.java.api.Clojure.var包装(使用 C 字符串)的一个 arg 版本
    • varObjQualifiedclojure.java.api.Clojure.read包装(使用 C 字符串)的两个 arg 版本
    • longValue将 Clojure long 转换为 C long
    • newLong将 C long 转换为 Clojure long
    • invokeFn调度到clojure.lang.IFn.invoke正确的数量。在这里,我只费心将其暴露到 arity 2,但没有什么可以阻止您进一步了解。

这是代码:

// java.c
#include <stdio.h>
#include <stdbool.h>
#include <jni.h>

// Uninitialized Java natural interface
JNIEnv *env;
JavaVM *jvm;

// JClass for Clojure
jclass clojure, ifn, longClass;
jmethodID readM, varM, varQualM, // defined on 'clojure.java.api.Clojure'
          invoke[2],             // defined on 'closure.lang.IFn'
          longValueM, longC;     // defined on 'java.lang.Long'

// Initialize the JVM with the Clojure JAR on classpath. 
bool create_vm() {
  // Configuration options for the JVM
  JavaVMOption opts = {
    .optionString =  "-Djava.class.path=./clojure-1.8.0.jar",
  };
  JavaVMInitArgs args = {
    .version = JNI_VERSION_1_6,
    .nOptions = 1,
    .options = &opts,
    .ignoreUnrecognized = false,
  };

  // Make the VM
  int rv = JNI_CreateJavaVM(&jvm, (void**)&env, &args);
  if (rv < 0 || !env) {
    printf("Unable to Launch JVM %d\n",rv);
    return false;
  }
  return true;
}

// Lookup the classes and objects we need to interact with Clojure.
void load_methods() {

  clojure    = (*env)->FindClass(env, "clojure/java/api/Clojure");
  readM      = (*env)->GetStaticMethodID(env, clojure, "read", "(Ljava/lang/String;)Ljava/lang/Object;");
  varM       = (*env)->GetStaticMethodID(env, clojure, "var",  "(Ljava/lang/Object;)Lclojure/lang/IFn;");
  varQualM   = (*env)->GetStaticMethodID(env, clojure, "var",  "(Ljava/lang/Object;Ljava/lang/Object;)Lclojure/lang/IFn;");

  ifn        = (*env)->FindClass(env, "clojure/lang/IFn");
  invoke[0]  = (*env)->GetMethodID(env, ifn, "invoke", "()Ljava/lang/Object;");
  invoke[1]  = (*env)->GetMethodID(env, ifn, "invoke", "(Ljava/lang/Object;)Ljava/lang/Object;");
  invoke[2]  = (*env)->GetMethodID(env, ifn, "invoke", "(Ljava/lang/Object;Ljava/lang/Object;)Ljava/lang/Object;");
  // Obviously we could keep going here. The Clojure API has 'invoke' for up to 20 arguments...

  longClass  = (*env)->FindClass(env, "java/lang/Long");
  longValueM = (*env)->GetMethodID(env, longClass, "longValue", "()J");
  longC      = (*env)->GetMethodID(env, longClass, "<init>",    "(J)V");
}

// call the 'invoke' function of the right arity on 'IFn'.
jobject invokeFn(jobject obj, unsigned n, jobject *args) {
  return (*env)->CallObjectMethodA(env, obj, invoke[n], (jvalue*)args);
}

// 'read' static method from 'Clojure' object.
jobject readObj(const char *cStr) {
  jstring str = (*env)->NewStringUTF(env, cStr);
  return (*env)->CallStaticObjectMethod(env, clojure, readM, str);
}

// 'var' static method from 'Clojure' object.
jobject varObj(const char* fnCStr) {
  jstring fn = (*env)->NewStringUTF(env, fnCStr);
  return (*env)->CallStaticObjectMethod(env, clojure, varM, fn);
}
// qualified 'var' static method from 'Clojure' object.
jobject varObjQualified(const char* nsCStr, const char* fnCStr) {
  jstring ns = (*env)->NewStringUTF(env, nsCStr);
  jstring fn = (*env)->NewStringUTF(env, fnCStr);
  return (*env)->CallStaticObjectMethod(env, clojure, varQualM, ns, fn);
}
Run Code Online (Sandbox Code Playgroud)

Haskell 与 C 函数的接口

最后,我们使用 Haskell 的 FFI 插入我们刚刚创建的 C 函数。这将编译为一个可执行文件,该可执行文件添加34使用 Clojure 的 add 函数。readObj在这里,我失去了为和制作函数的动力varObj(主要是因为我的示例不需要它们)。

-- clojure.hs
{-# LANGUAGE GeneralizedNewtypeDeriving, ForeignFunctionInterface #-}

import Foreign
import Foreign.C.Types
import Foreign.C.String

-- Clojure objects are just Java objects, and jsvalue is a union with size 64
-- bits. Since we are cutting corners, we might as well just derive 'Storable'
-- from something else that has the same size - 'CLong'.
newtype ClojureObject = ClojureObject CLong deriving (Storable)

foreign import ccall "load_methods" load_methods :: IO ()
foreign import ccall "create_vm" create_vm :: IO ()
foreign import ccall "invokeFn" invokeFn :: ClojureObject -> CUInt -> Ptr ClojureObject -> IO ClojureObject
-- foreign import ccall "readObj" readObj :: CString -> IO ClojureObject
-- foreign import ccall "varObj" varObj :: CString -> IO ClojureObject
foreign import ccall "varObjQualified" varObjQualified :: CString -> CString -> IO ClojureObject
foreign import ccall "newLong" newLong :: CLong -> ClojureObject
foreign import ccall "longValue" longValue :: ClojureObject -> CLong

-- | In order for anything to work, this needs to be called first.
loadClojure :: IO ()
loadClojure = create_vm *> load_methods

-- | Make a Clojure function call
invoke :: ClojureObject -> [ClojureObject] -> IO ClojureObject
invoke fn args = do
  args' <- newArray args
  let n = fromIntegral (length args)
  invokeFn fn n args'

-- | Make a Clojure number from a Haskell one
long :: Int64 -> ClojureObject
long l = newLong (CLong l)

-- | Make a Haskell number from a Clojure one
unLong :: ClojureObject -> Int64
unLong cl = let CLong l = longValue cl in l

-- | Look up a var in Clojure based on the namespace and name
varQual :: String -> String -> IO ClojureObject
varQual ns fn = withCString ns (\nsCStr ->
                withCString fn (\fnCStr -> varObjQualified nsCStr fnCStr))

main :: IO ()
main = do
  loadClojure
  putStrLn "Clojure loaded"

  plus <- varQual "clojure.core" "+"
  out <- invoke plus [long 3, long 4]
  print $ unLong out -- prints "7" on my tests
Run Code Online (Sandbox Code Playgroud)

尝试一下!

编译应该是公正的make all并且可以运行make run

局限性

由于这只是概念证明,因此有很多问题需要修复:

  • Clojure 所有原始类型的正确转换
  • 完成后拆除 JVM!
  • 确保我们不会在任何地方引入内存泄漏(我们可能会这样做newArray
  • 在 Haskell 中正确表示 Clojure 对象
  • 还有很多!

也就是说,它有效!