通过JPype和numpy将Java类型转换为Python

Mat*_*ias 5 python java numpy type-conversion

我目前正在将用Python编写的程序移植到Java中并遇到了一些问题.我正在移植程序的一部分,为了测试目的,我正在使用JPype使它与新的java类兼容.

编辑:为了使事情更清楚,我正在处理的类为Python程序的其余部分提供数据.

所以,在我的java类中,我在ArrayLists中有一些float和byte值,

    ArrayList<ArrayList<Float>> dataFloat  = new ArrayList<ArrayList<Float>>();
    ArrayList<ArrayList<Byte>>  dataByte   = new ArrayList<ArrayList<Byte>>();
Run Code Online (Sandbox Code Playgroud)

然后使用JPype我能够将这些内容放入我现在拥有该类型的Python环境中

    <class 'jpype._jclass.java.util.ArrayList'> .
Run Code Online (Sandbox Code Playgroud)

现在我想简单地将这些转换为Python中的numpy数组,

    numpy.array(dataFloat) .
Run Code Online (Sandbox Code Playgroud)

一开始似乎起作用,因为它打印出来时看起来不错,

    [[1.0 2.0 3.0]
    [80.0 127.0 127.0]
    [255.0 255.0 255.0]] .
Run Code Online (Sandbox Code Playgroud)

但是,它不能与程序的其余部分一起使用,因为它要求值为float类型.进一步研究这个问题,我发现我拥有的这些"浮动"值实际上就是这样

    <class 'jpype._jclass.java.lang.Float'>
Run Code Online (Sandbox Code Playgroud)

而不是我想要的常规Python浮点数.与常规numpy浮点数组相比,

>>> b = array([[1.1, 2.1, 3.1], [4.1, 5.1, 6.1], [7.1, 8.1, 9.1]])
>>> type((b[0])[0])
<type 'numpy.float64'>
Run Code Online (Sandbox Code Playgroud)

它具有所需的浮动类型.

为了能够使用Python程序的其余部分运行它,我必须使用java Float.floatValue()转换每个元素的数组,

    arr = numpy.array(dataFloat)
    a = array([])
    for j in range(len(arr)):
        b = array([])
        if array_equal(a,[]):
           for i in arr.get(j):
              a = append(a, i.floatValue())
        else:
           for i in arr.get(j):
              b = append(b, i.floatValue())
           a = vstack((a, b))   
Run Code Online (Sandbox Code Playgroud)

这当然需要花费很多时间,特别是当有数千个元素时.

有谁知道这可以以有效的方式完成?简单地说,我从JPype获得了很多需要转换为常规Python浮点值的java.lang.Float值.

roc*_*ker 0

我前段时间尝试过 JPype,也遇到了一些类型转换问题。也许您可以使用http://cython.org/加速您的代码,有一些方法可以加速对 numpy 数据结构的访问:http://docs.cython.org/src/tutorial/numpy.html

进一步评论:vstack 和 hstack 可以复制任意列表/元组。所以你可以重写你的代码(未经测试)

arr = numpy.array(dataFloat)
a = []
for j in range(len(arr)):
    b = array([])
    for i in arr.get(j):
          b = append(b, i.floatValue())
    a.append(b)
a = vstack(a)   
Run Code Online (Sandbox Code Playgroud)

此外,如果避免调用append(),则可以优化速度。使用固定大小 N 分配数组 b 会更快,例如使用 Zero(),然后填充值:

arr = numpy.array(dataFloat)
N = ....
a = []
for j in range(len(arr)):
    b = zeros((N,))
    for k in range(N):
          i =arr.get(j)[k]:
          b[k] = i.floatValue()
    a.append(b)
a = vstack(a)   
Run Code Online (Sandbox Code Playgroud)

仅当您知道 N 时才有效。