linux 线程和 fopen() fclose() fgets()

Question

linux 线程和 fopen() fclose() fgets()

Sim*_*ott 4 c linux pthreads

我正在查看一些使用 pthread 的遗留 Linux 代码。

在一个线程中，通过 fgets() 读取文件。FILE 变量是所有线程共享的全局变量。（嘿嘿，这不是我写的……）

在另一个线程中，FILE 不时关闭并使用另一个文件名重新打开。

发生这种情况后的几秒钟内，线程 fgets() 就好像它正在继续读取它从前一个文件中读取的最后一条记录：几乎好像发生了错误但 fgets() 没有返回 NULL。然后它自己整理并开始从新文件中读取。

代码看起来有点像这样（为简洁起见，所以我希望它仍然可以理解）：

在一个线程中：

while(gRunState != S_EXIT){
  nanosleep(&timer_delay,0);
  flag = fgets(buff, sizeof(buff), gFile);
  if (flag != NULL){
    // do something with buff...
  }
}

Run Code Online (Sandbox Code Playgroud)

在另一个线程中：

fclose(gFile);
gFile = fopen(newFileName,"r");

Run Code Online (Sandbox Code Playgroud)

没有锁定来确保 fgets() 与 fclose()/fopen() 不同时调用。

关于可能导致 fgets() 失败但不返回 NULL 的失败模式的任何想法？

Answer 1

Jon*_*ler 5

描述的代码如何出错

stdio 库缓冲数据，分配内存来存储缓冲的数据。GNU C 库动态分配文件结构（一些库，特别是在 Solaris 上，使用指向静态分配的文件结构的指针，但缓冲区仍是动态分配的，除非您以其他方式设置缓冲）。

如果您的线程使用指向全局文件指针的指针的副本（因为您将文件指针作为参数传递给函数），那么可以想象，代码将继续访问最初分配的数据结构（甚至虽然它被关闭释放了），并且会从已经存在的缓冲区中读取数据。只有当您退出函数或读取缓冲区内容之外的内容时，事情才会开始出错 - 或者之前分配给文件结构的空间被重新分配以供新用途。

FILE *global_fp;

void somefunc(FILE *fp, ...)
{
    ...
    while (fgets(buffer, sizeof(buffer), fp) != 0)
        ...
}

void another_function(...)
{
    ...
    /* Pass global file pointer by value */
    somefunc(global_fp, ...);
    ...
}

Run Code Online (Sandbox Code Playgroud)

概念代码证明

在带有 GCC 4.0.1 的 MacOS X 10.5.8 (Leopard) 上测试：

#include <stdio.h>
#include <stdlib.h>

FILE *global_fp;
const char etc_passwd[] = "/etc/passwd";

static void error(const char *fmt, const char *str)
{
    fprintf(stderr, fmt, str);
    exit(1);
}

static void abuse(FILE *fp, const char *filename)
{
    char buffer1[1024];
    char buffer2[1024];
    if (fgets(buffer1, sizeof(buffer1), fp) == 0)
        error("Failed to read buffer1 from %s\n", filename);
    printf("buffer1: %s", buffer1);

    /* Dangerous!!! */
    fclose(global_fp);
    if ((global_fp = fopen(etc_passwd, "r")) == 0)
        error("Failed to open file %s\n", etc_passwd);

    if (fgets(buffer2, sizeof(buffer2), fp) == 0)
        error("Failed to read buffer2 from %s\n", filename);
    printf("buffer2: %s", buffer2);
}

int main(int argc, char **argv)
{
    if (argc != 2)
        error("Usage: %s file\n", argv[0]);

    if ((global_fp = fopen(argv[1], "r")) == 0)
        error("Failed to open file %s\n", argv[1]);

    abuse(global_fp, argv[1]);

    return(0);
}

Run Code Online (Sandbox Code Playgroud)

在其自己的源代码上运行时，输出为：

Osiris JL: ./xx xx.c
buffer1: #include <stdio.h>
buffer2: ##
Osiris JL:

Run Code Online (Sandbox Code Playgroud)

因此，经验证明在某些系统上，我概述的场景可能会发生。

如何修复代码

在其他答案中很好地讨论了对代码的修复。如果您避免我说明的问题（例如，通过避免全局文件指针），那是最简单的。假设这是不可能的，使用适当的标志进行编译可能就足够了（在许多类 Unix 系统上，编译器标志 ' -D_REENTRANT' 可以完成这项工作），并且您最终将使用基本标准 I/ 的线程安全版本O 函数。否则，您可能需要围绕对文件指针的访问设置明确的线程安全管理策略；一个互斥体或类似的东西（并修改代码以确保线程在使用相应的文件指针之前使用互斥体）。

归档时间：	16 年，3 月前
查看次数：	10407 次
最近记录：	10 年，4 月前