Tho*_*mas 3 java streaming performance download
在我的服务中,用户可以下载非常大(5+ GB)的数据包作为 zip 文件。当前的实现定位数据包中的所有文件,创建一个新的 zip 文件,用文件的副本填充 zip 文件,然后将其流式传输给用户。
这对于较大的数据包来说不能很好地扩展,我正在尝试找到一种方法来提高此过程的效率。我在下面提出了一个建议的解决方案,但我没有提供内容的经验,并且希望获得有关解决此问题的最佳方法的专业见解。
我认为最好的方法是不要将实际字节复制到 zip 文件中。相反,创建符号链接的 zip 文件,然后在流式传输内容时复制字节。我在传输过程中实际将字节复制到 zip 中时遇到了问题,我不知道这是否可行。
我将下面 Alexey Ragozin 接受的答案实现到SpeedBagIt中,这是一个用于高效传输符合BagIt规范的 zip 文件的库。
您可以直接通过 HTTP 连接传输大型 zip 文件。
java.util.zip.ZipOutputStream
允许将数据直接压缩到流中,无需中间存储。
下面是将文件链接集合作为 zip 存档写入流中的代码片段。
当然,要传输 5GiB,您可能需要调整 servlet 容器的超时和线程池。
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.util.zip.ZipEntry;
import java.util.zip.ZipOutputStream;
public class ZipStreamer {
public void streamZip(OutputStream os, Iterable<FileLink> entries) throws IOException {
ZipOutputStream zos = new ZipOutputStream(os);
for(FileLink e: entries) {
ZipEntry entry = new ZipEntry(e.getName());
File file = e.getFile();
entry.setTime(file.lastModified());
zos.putNextEntry(entry);
if (file.isFile()) {
copyBytes(zos, new FileInputStream(file));
}
zos.closeEntry();
}
zos.close();
}
private static void copyBytes(OutputStream dest, InputStream source) {
// copy data between streams
}
public interface FileLink {
public String getName();
public File getFile();
}
}
Run Code Online (Sandbox Code Playgroud)