Joã*_*tos 3 c++ algorithm diff lcs
我正在尝试用C++创建一个能够区分两个.txt文件的程序.
struct line
{
string text;
size_t num;
int status;
};
void compareFiles(vector<line> &buffer_1, vector<line> &buffer_2, size_t index_1, size_t index_2)
{
while(index_1 < buffer_1.size())
{
while(index_2 < buffer_2.size())
{
X = buffer_1[index_1].text;
Y = buffer_2[index_2].text;
if(X == Y)
{
++index_1;
++index_2;
}
else
{
LCS();
string lcs = printLCS(X.length(), Y.length());
/*
* Here's my problem
*/
}
}
}
}
Run Code Online (Sandbox Code Playgroud)
如您所见,我有两个先前加载了文件内容的缓冲区(行向量).我还有LCS算法完全功能(测试).LCS适用于全局定义的字符串X和Y.
所以,我真正需要做的是逐行比较缓冲区与LCS,但我没有办法做到这一点.
请你帮助我好吗?
如果有疑问,我通常会推荐给以前做过的人.古老的差异计划已经永远存在,并且做你想做的事情.此外,它是开源的,所以请转到ftp://mirrors.kernel.org/gnu/diffutils/diffutils-3.0.tar.gz并查看它.
解压缩归档文件后,打开src/analyze.c.该diff_2_files函数从第472行开始.进行实际比较的代码从第512行至第537行开始.它们转载如下:
for (;; cmp->file[0].buffered = cmp->file[1].buffered = 0)
{
/* Read a buffer's worth from both files. */
for (f = 0; f < 2; f++)
if (0 <= cmp->file[f].desc)
file_block_read (&cmp->file[f],
buffer_size - cmp->file[f].buffered);
/* If the buffers differ, the files differ. */
if (cmp->file[0].buffered != cmp->file[1].buffered
|| memcmp (cmp->file[0].buffer,
cmp->file[1].buffer,
cmp->file[0].buffered))
{
changes = 1;
break;
}
/* If we reach end of file, the files are the same. */
if (cmp->file[0].buffered != buffer_size)
{
changes = 0;
break;
}
}
Run Code Online (Sandbox Code Playgroud)
这个想法是加载两个相同大小的缓冲区,然后将每个文件加载到缓冲区中.使用两个文件一次比较两个文件memcmp,并查看是否有任何缓冲区与另一个缓冲区不同.如果任何缓冲区比较不返回相等,则两个文件不同.同样重要的是要注意,您一次不必读取超过两个缓冲区的数据,因此这种方法也适用于大型文件.