C 中不区分大小写的排序

MMM*_*MMM 1 c sorting case-sensitive case-insensitive

我有一个 .txt 文件,我想使用 C 编程对其进行排序。我有以下代码用于对 .txt 文件进行排序:

#include <stdio.h>
#include <string.h>
#include <stdlib.h>

#define MAX_LEN 100 // Length of each line in input file.

int main(void)
{
    char *strFileName = "/home/milad/Desktop/ddd.txt";
    char *strFileSummary = "/home/milad/Desktop/ddd2.txt";
    char strTempData[MAX_LEN];
    char **strData = NULL; // String List
    int i, j;
    int noOfLines = 0;

    FILE * ptrFileLog = NULL;
    FILE * ptrSummary = NULL;

    if ( (ptrFileLog = fopen(strFileName, "r")) == NULL ) {
        fprintf(stderr,"Error: Could not open %s\n",strFileName);
        return 1;
    }
    if ( (ptrSummary = fopen(strFileSummary, "a")) == NULL ) {
        fprintf(stderr,"Error: Could not open %s\n",strFileSummary);
        return 1;
    }

    // Read and store in a string list.
    while(fgets(strTempData, MAX_LEN, ptrFileLog) != NULL) {
        // Remove the trailing newline character
        if(strchr(strTempData,'\n'))
            strTempData[strlen(strTempData)-1] = '\0';
        strData = (char**)realloc(strData, sizeof(char**)*(noOfLines+1));
        strData[noOfLines] = (char*)calloc(MAX_LEN,sizeof(char));
        strcpy(strData[noOfLines], strTempData);
        noOfLines++;
    }
    // Sort the array.
    for(i= 0; i < (noOfLines - 1); ++i) {
        for(j = 0; j < ( noOfLines - i - 1); ++j) {
            if(strcmp(strData[j], strData[j+1]) > 0) {
                strcpy(strTempData, strData[j]);
                strcpy(strData[j], strData[j+1]);
                strcpy(strData[j+1], strTempData);
            }
        }
    }
    // Write it to outfile. file.
    for(i = 0; i < noOfLines; i++)
        fprintf(ptrSummary,"%s\n",strData[i]);
    // free each string
    for(i = 0; i < noOfLines; i++)
        free(strData[i]);
    // free string list.
    free(strData);
    fclose(ptrFileLog);
    fclose(ptrSummary);
    return 0;
} 
Run Code Online (Sandbox Code Playgroud)

此代码区分大小写,它首先对大写字母进行排序,然后对小写字母进行排序,这不是我想要的。我希望它按字母顺序对字母进行排序,并且对字母的大小写不敏感。我了解 ASCII 代码以及为什么会出现此问题,但我找不到解决方法。

如何更改代码以使其不区分大小写?

das*_*ght 5

如果您的系统具有strcasecmp可用的 POSIX 功能,请替换strcmpstrcasecmp直接替换。

否则,在您自己的代码中实现不区分大小写的字符串比较,并用它替换对的调用strcmp。您可以通过将字符串两边的字符转换为相同的大小写(大写或小写)后逐个字符进行比较来实现所需的功能。

注 1:您的算法效率低下:您以最大长度分配所有字符串,以避免当字符串长度不等时出现未定义的行为。您可以以精确的长度分配字符串并避免未定义的行为,因为您根本不需要复制内容:交换字符串指针即可完成这项工作,而且速度会快得多。

if(strcasecmp(strData[j], strData[j+1]) > 0) {
    char *tmp = strData[j];
    strData[j] = strData[j+1];
    strData[j+1] = tmp;
}
Run Code Online (Sandbox Code Playgroud)

注 2:冒泡排序算法非常慢,除非数组一开始就已经排序完毕。对于较大的文件,您可以使用qsort.

  • `qsort()` 是一个很好的方法,但可能会失去[排序稳定性](/sf/ask/40927841/)。OP 的代码看起来很稳定,尽管速度很慢。未知这对 OP 是否重要。 (2认同)