Arp*_*sss 6 java multithreading file-handling
我有以下代码:
import java.io.*;
import java.util.concurrent.* ;
public class Example{
public static void main(String args[]) {
try {
FileOutputStream fos = new FileOutputStream("1.dat");
DataOutputStream dos = new DataOutputStream(fos);
for (int i = 0; i < 200000; i++) {
dos.writeInt(i);
}
dos.close(); // Two sample files created
FileOutputStream fos1 = new FileOutputStream("2.dat");
DataOutputStream dos1 = new DataOutputStream(fos1);
for (int i = 200000; i < 400000; i++) {
dos1.writeInt(i);
}
dos1.close();
Exampless.createArray(200000); //Create a shared array
Exampless ex1 = new Exampless("1.dat");
Exampless ex2 = new Exampless("2.dat");
ExecutorService executor = Executors.newFixedThreadPool(2); //Exexuted parallaly to cont number of matches in two file
long startTime = System.nanoTime();
long endTime;
Future<Integer> future1 = executor.submit(ex1);
Future<Integer> future2 = executor.submit(ex2);
int count1 = future1.get();
int count2 = future2.get();
endTime = System.nanoTime();
long duration = endTime - startTime;
System.out.println("duration with threads:"+duration);
executor.shutdown();
System.out.println("Matches: " + (count1 + count2));
startTime = System.nanoTime();
ex1.call();
ex2.call();
endTime = System.nanoTime();
duration = endTime - startTime;
System.out.println("duration without threads:"+duration);
} catch (Exception e) {
System.err.println("Error: " + e.getMessage());
}
}
}
class Exampless implements Callable {
public static int[] arr = new int[20000];
public String _name;
public Exampless(String name) {
this._name = name;
}
static void createArray(int z) {
for (int i = z; i < z + 20000; i++) { //shared array
arr[i - z] = i;
}
}
public Object call() {
try {
int cnt = 0;
FileInputStream fin = new FileInputStream(_name);
DataInputStream din = new DataInputStream(fin); // read file and calculate number of matches
for (int i = 0; i < 20000; i++) {
int c = din.readInt();
if (c == arr[i]) {
cnt++;
}
}
return cnt ;
} catch (Exception e) {
System.err.println("Error: " + e.getMessage());
}
return -1 ;
}
}
Run Code Online (Sandbox Code Playgroud)
我在哪里尝试用两个文件计算数组中的匹配数.现在,虽然我在两个线程上运行它,代码表现不佳,因为:
(在单线程上运行,文件1 +文件2读取时间)<(文件1 ||文件2在多线程中读取时间).
任何人都可以帮我解决这个问题(我有2个核心CPU,文件大小约为1.5 GB).
在第一种情况下,您逐个字节地逐个读取一个文件.这和磁盘I/O一样快,只要文件不是很碎片.完成第一个文件后,磁盘/操作系统会找到第二个文件的开头并继续非常高效,线性读取磁盘.
在第二种情况下,您不断在第一个和第二个文件之间切换,迫使磁盘从一个地方寻找到另一个地方.这个额外的寻找时间(大约10毫秒)是你困惑的根源.
哦,你知道磁盘访问是单线程的,你的任务是I/O绑定的,所以没有办法将这个任务分成多个线程可以帮助,只要你从同一个物理磁盘读取?只有在以下情况下,您的方法才有道理:
除了从文件读取之外,每个线程还执行一些CPU密集型或阻塞操作,与I/O相比,速度降低了一个数量级.
文件位于不同的物理驱动器上(不同的分区不够)或某些RAID配置
你正在使用SSD驱动器
归档时间: |
|
查看次数: |
1390 次 |
最近记录: |