linux 线程和 fopen() fclose() fgets()

Sim*_*ott 4 c linux pthreads

我正在查看一些使用 pthread 的遗留 Linux 代码。

在一个线程中,通过 fgets() 读取文件。FILE 变量是所有线程共享的全局变量。(嘿嘿,这不是我写的……)

在另一个线程中,FILE 不时关闭并使用另一个文件名重新打开。

发生这种情况后的几秒钟内,线程 fgets() 就好像它正在继续读取它从前一个文件中读取的最后一条记录:几乎好像发生了错误但 fgets() 没有返回 NULL。然后它自己整理并开始从新文件中读取。

代码看起来有点像这样(为简洁起见,所以我希望它仍然可以理解):

在一个线程中:

while(gRunState != S_EXIT){
  nanosleep(&timer_delay,0);
  flag = fgets(buff, sizeof(buff), gFile);
  if (flag != NULL){
    // do something with buff...
  }
}
Run Code Online (Sandbox Code Playgroud)

在另一个线程中:

fclose(gFile);
gFile = fopen(newFileName,"r");
Run Code Online (Sandbox Code Playgroud)

没有锁定来确保 fgets() 与 fclose()/fopen() 不同时调用。

关于可能导致 fgets() 失败但不返回 NULL 的失败模式的任何想法?

Jon*_*ler 5

描述的代码如何出错

stdio 库缓冲数据,分配内存来存储缓冲的数据。GNU C 库动态分配文件结构(一些库,特别是在 Solaris 上,使用指向静态分配的文件结构的指针,但缓冲区仍是动态分配的,除非您以其他方式设置缓冲)。

如果您的线程使用指向全局文件指针的指针的副本(因为您将文件指针作为参数传递给函数),那么可以想象,代码将继续访问最初分配的数据结构(甚至虽然它被关闭释放了),并且会从已经存在的缓冲区中读取数据。只有当您退出函数或读取缓冲区内容之外的内容时,事情才会开始出错 - 或者之前分配给文件结构的空间被重新分配以供新用途。

FILE *global_fp;

void somefunc(FILE *fp, ...)
{
    ...
    while (fgets(buffer, sizeof(buffer), fp) != 0)
        ...
}

void another_function(...)
{
    ...
    /* Pass global file pointer by value */
    somefunc(global_fp, ...);
    ...
}
Run Code Online (Sandbox Code Playgroud)

概念代码证明

在带有 GCC 4.0.1 的 MacOS X 10.5.8 (Leopard) 上测试:

#include <stdio.h>
#include <stdlib.h>

FILE *global_fp;
const char etc_passwd[] = "/etc/passwd";

static void error(const char *fmt, const char *str)
{
    fprintf(stderr, fmt, str);
    exit(1);
}

static void abuse(FILE *fp, const char *filename)
{
    char buffer1[1024];
    char buffer2[1024];
    if (fgets(buffer1, sizeof(buffer1), fp) == 0)
        error("Failed to read buffer1 from %s\n", filename);
    printf("buffer1: %s", buffer1);

    /* Dangerous!!! */
    fclose(global_fp);
    if ((global_fp = fopen(etc_passwd, "r")) == 0)
        error("Failed to open file %s\n", etc_passwd);

    if (fgets(buffer2, sizeof(buffer2), fp) == 0)
        error("Failed to read buffer2 from %s\n", filename);
    printf("buffer2: %s", buffer2);
}

int main(int argc, char **argv)
{
    if (argc != 2)
        error("Usage: %s file\n", argv[0]);

    if ((global_fp = fopen(argv[1], "r")) == 0)
        error("Failed to open file %s\n", argv[1]);

    abuse(global_fp, argv[1]);

    return(0);
}
Run Code Online (Sandbox Code Playgroud)

在其自己的源代码上运行时,输出为:

Osiris JL: ./xx xx.c
buffer1: #include <stdio.h>
buffer2: ##
Osiris JL:
Run Code Online (Sandbox Code Playgroud)

因此,经验证明在某些系统上,我概述的场景可能会发生。

如何修复代码

在其他答案中很好地讨论了对代码的修复。如果您避免我说明的问题(例如,通过避免全局文件指针),那是最简单的。假设这是不可能的,使用适当的标志进行编译可能就足够了(在许多类 Unix 系统上,编译器标志 ' -D_REENTRANT' 可以完成这项工作),并且您最终将使用基本标准 I/ 的线程安全版本O 函数。否则,您可能需要围绕对文件指针的访问设置明确的线程安全管理策略;一个互斥体或类似的东西(并修改代码以确保线程在使用相应的文件指针之前使用互斥体)。