如何使用Hibernate将数据流式传输到数据库BLOB(在byte []中没有内存存储)

Ice*_*low 7 java database hibernate blob stream

我正在寻找一种方法将二进制数据流入/流出数据库.如果可能的话,我希望用Hibernate完成(以数据库无关的方式).我发现的所有解决方案都涉及将二进制数据显式或隐式加载到内存中,如byte [].我需要避免它.假设我希望我的代码能够从数据库(存储在BLOB列中)向本地文件写入2GB视频,或者相反,使用不超过256Mb的内存.它显然是可以实现的,并且不涉及伏都教.但是我找不到办法,现在我正试图避免调试Hibernate.

让我们看一下示例代码(记住-Jmx = 256Mb).

实体类:

public class SimpleBean {
    private Long id;
    private Blob data;
    // ... skipping getters, setters and constructors.
}
Run Code Online (Sandbox Code Playgroud)

Hibernate映射片段:

<class name="SimpleBean" table="SIMPLE_BEANS">
    <id name="id" column="SIMPLE_BEAN_ID">
        <generator class="increment" />
    </id>
    <property name="data" type="blob" column="DATA" />
</class>
Run Code Online (Sandbox Code Playgroud)

测试代码片段:

Configuration cfg = new Configuration().configure("hibernate.cfg.xml");
ServiceRegistry serviceRegistry = new ServiceRegistryBuilder()
                                      .applySettings(cfg.getProperties())
                                      .buildServiceRegistry();

SessionFactory sessionFactory = cfg.buildSessionFactory(serviceRegistry);
Session session = sessionFactory.openSession();
session.beginTransaction();

File dataFile = new File("movie_1gb.avi");
long dataSize = dataFile.length();
InputStream dataStream = new FileInputStream(dataFile);

LobHelper lobHelper = session.getLobHelper();
Blob dataBlob = lobHelper.createBlob(dataStream, dataSize);

session.save( new SimpleBean(data) );
session.getTransaction().commit(); // Throws java.lang.OutOfMemoryError
session.close();

blobStream.close();
sessionFactory.close();
Run Code Online (Sandbox Code Playgroud)

运行该代码片段时,我得到了OutOfMemory异常.查看堆栈跟踪显示了Hibernate尝试在内存中加载流并获取OutOfMemory(应该如此).这是堆栈跟踪:

java.lang.OutOfMemoryError: Java heap space
at java.util.Arrays.copyOf(Arrays.java:2271)
at java.io.ByteArrayOutputStream.grow(ByteArrayOutputStream.java:113)
at java.io.ByteArrayOutputStream.ensureCapacity(ByteArrayOutputStream.java:93)
at java.io.ByteArrayOutputStream.write(ByteArrayOutputStream.java:140)
at org.hibernate.type.descriptor.java.DataHelper.extractBytes(DataHelper.java:183)
at org.hibernate.type.descriptor.java.BlobTypeDescriptor.unwrap(BlobTypeDescriptor.java:121)
at org.hibernate.type.descriptor.java.BlobTypeDescriptor.unwrap(BlobTypeDescriptor.java:45)
at org.hibernate.type.descriptor.sql.BlobTypeDescriptor$4$1.doBind(BlobTypeDescriptor.java:105)
at org.hibernate.type.descriptor.sql.BasicBinder.bind(BasicBinder.java:92)
at org.hibernate.type.AbstractStandardBasicType.nullSafeSet(AbstractStandardBasicType.java:305)
at org.hibernate.type.AbstractStandardBasicType.nullSafeSet(AbstractStandardBasicType.java:300)
at org.hibernate.type.AbstractSingleColumnStandardBasicType.nullSafeSet(AbstractSingleColumnStandardBasicType.java:57)
at org.hibernate.persister.entity.AbstractEntityPersister.dehydrate(AbstractEntityPersister.java:2603)
at org.hibernate.persister.entity.AbstractEntityPersister.insert(AbstractEntityPersister.java:2857)
at org.hibernate.persister.entity.AbstractEntityPersister.insert(AbstractEntityPersister.java:3301)
at org.hibernate.action.internal.EntityInsertAction.execute(EntityInsertAction.java:88)
at org.hibernate.engine.spi.ActionQueue.execute(ActionQueue.java:362)
at org.hibernate.engine.spi.ActionQueue.executeActions(ActionQueue.java:354)
at org.hibernate.engine.spi.ActionQueue.executeActions(ActionQueue.java:275)
at org.hibernate.event.internal.AbstractFlushingEventListener.performExecutions(AbstractFlushingEventListener.java:326)
at org.hibernate.event.internal.DefaultFlushEventListener.onFlush(DefaultFlushEventListener.java:52)
at org.hibernate.internal.SessionImpl.flush(SessionImpl.java:1214)
at org.hibernate.internal.SessionImpl.managedFlush(SessionImpl.java:403)
at org.hibernate.engine.transaction.internal.jdbc.JdbcTransaction.beforeTransactionCommit(JdbcTransaction.java:101)
at org.hibernate.engine.transaction.spi.AbstractTransactionImpl.commit(AbstractTransactionImpl.java:175)
at ru.swemel.msgcenter.domain.SimpleBeanTest.testBasicUsage(SimpleBeanTest.java:63)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at org.junit.runners.model.FrameworkMethod$1.runReflectiveCall(FrameworkMethod.java:45)
at org.junit.internal.runners.model.ReflectiveCallable.run(ReflectiveCallable.java:15)
Run Code Online (Sandbox Code Playgroud)

使用了Hibernate 4.1.5.SP1.确切的问题是:当使用Hibernate在数据库中存储blob时,如何使用直接流来避免将流加载到内存中.我想避免关于为什么将视频存储在数据库列中而不是将其存储在某个内容存储库和链接中的主题.请将其视为与问题无关的模型.

似乎在不同的方言上可能存在某种功能,而Hibernate可能会尝试将所有内容加载到内存中,因为底层数据库不支持流blob或类似的东西.如果是这种情况 - 我希望在处理blob方面看到不同方言之间的某种比较表.

非常感谢您的帮助!

Ice*_*low 5

对于那些寻找同样东西的人。

不好的是,对于 PostgreSQL(可能还有很多其他的),代码按预期工作(流而不尝试复制到内存)。Hibernate 的内部工作取决于所选择的方言。我首先使用的替代了直接使用流,转而使用由 byte[] 支持的 BinaryStream。

而且性能也不存在问题,因为在 PostgreSQL 中它只加载 OID(数字),在其他方言(包括 byte[] 实现)中可能会延迟加载数据。刚刚运行了一些脏测试,在 10000 次负载的实体(带二进制数据字段和不带二进制数据字段)中没有明显差异。

不过,将数据存储在数据库中似乎比仅将其作为外部文件保存在磁盘上要慢。但它在备份、处理特定文件系统的限制或并发更新等时为您省去了很多麻烦。但这是一个题外话。