无法在vfio pci设备的文件描述符上使用pread

iga*_*vez 7 c linux virtualization qemu vfio

所以我和qemu kvm合作了一段时间,现在我需要通过PCI设备.我做了所有必要的程序来完成这项工作:启用iommu,modprobed vfio模块,绑定设备到vfio并检查vfio组确实是创建的等等...但是当我用任何pci设备启动qemu时,我收到错误消息:

vfio:无法读取设备配置空间

我深入研究qemu的代码,看看问题可能是什么,并发现问题出现在设备的pread上.即使偏移量为0,也会发生这种情况,并且对文件描述符执行正常读取时没有问题,因为我更改了代码以进行测试.检查errno因为pread失败的原因给我一个' 非法搜索 '错误消息.

我写了一些代码,看看这是否发生在qemu上下文之外(认为它可能是qemu代码中干扰设备的东西),并且有同样的问题.我也尝试用pread读取一个普通的文件,并且完美地工作......这是我编写的代码来测试它,我把它分解了一下,以便能够指出更相关的部分:

#define BUF_SIZE 4096

int main(){     
    char buf[BUF_SIZE], buf1[BUF_SIZE], buf2[BUF_SIZE];         
    int ret,group_fd, fd, fd2;  
    size_t nbytes = 4096;   
    ssize_t bytes_read;     
    int iommu1, iommu2;

    int container, group, device, i;
    struct vfio_group_status group_status = { .argsz = sizeof(group_status) };
    struct vfio_iommu_type1_info iommu_info = { .argsz = sizeof(iommu_info) };
    struct vfio_iommu_type1_dma_map dma_map = { .argsz = sizeof(dma_map) };
    struct vfio_device_info device_info = { .argsz = sizeof(device_info) };    
    container = open("/dev/vfio/vfio",O_RDWR);        

    if(ioctl(container,VFIO_GET_API_VERSION)!=VFIO_API_VERSION){
        printf("Unknown api version: %m\n");    
    }   
    group_fd = open("/dev/vfio/22",O_RDWR);     printf("Group fd = %d\n", group_fd);
    ioctl(group_fd, VFIO_GROUP_GET_STATUS, &group_status);
    if (!(group_status.flags & VFIO_GROUP_FLAGS_VIABLE)){
        printf("Group not viable\n");
        return 1;
    }   
    ret = ioctl(group_fd, VFIO_GROUP_SET_CONTAINER,&container);     
    ret = ioctl(container,VFIO_SET_IOMMU,VFIO_TYPE1_IOMMU);         
    ioctl(container, VFIO_IOMMU_GET_INFO, &iommu_info);         

    /* Allocate some space and setup a DMA mapping */            
    dma_map.vaddr = (unsigned long int) mmap(0, 1024 * 1024, PROT_READ | PROT_WRITE,MAP_PRIVATE | MAP_ANONYMOUS, 0, 0);
    dma_map.size = 1024 * 1024;
    dma_map.iova = 0; /* 1MB starting at 0x0 from device view */
    dma_map.flags = VFIO_DMA_MAP_FLAG_READ | VFIO_DMA_MAP_FLAG_WRITE;

    ioctl(container, VFIO_IOMMU_MAP_DMA, &dma_map);         
    printf("\n\nGETTING DEVICE FD\n");      
    fd = ioctl(group_fd,VFIO_GROUP_GET_DEVICE_FD,"0000:08:00.0");


    printf("Fd = %d\n",fd);     
    printf("VFIO_GROUP_GET_DEV_ID = %lu\n",VFIO_GROUP_GET_DEVICE_FD);   
Run Code Online (Sandbox Code Playgroud)

这个读取工作正常,给我一个nbytes的ret代码

    ret = read(fd,buf,nbytes);  
    if(ret<1){      
       printf("ERROR: %m \n");  
    }
Run Code Online (Sandbox Code Playgroud)

这个pread失败了反码-1和错误'非法搜寻'

    ret = pread(fd,buf,nbytes,0);

    if(ret<0){      
       printf("ERROR: %m \n");  
    }   
Run Code Online (Sandbox Code Playgroud)

在这里,我尝试在sysfs中的一个公共文件上读取和预读,看看pread是否失败,在这种情况下读取和pread工作都很好:

    printf("TESTING PREAD ON A COMMON FILE\n");     

    fd2 = open("/sys/bus/pci/devices/0000:08:00.0/device",O_RDONLY);       
    ret = read(fd2,buf1,nbytes);    
    if(ret<0){
        printf("ERROR: %m\n");  
    }   
    printf("Result from read: ret = %d, content = %s\n",ret,buf1);  
    ret = pread(fd2,buf2,nbytes,2);     
    if(ret<0){
        printf("ERROR: %m\n");  #
    }   
    printf("Result from pread: ret = %d, content = %s\n",ret,buf2);         
    close(fd2);
    getchar();
    close(fd);
    close(container);   
    close(group_fd);    
    return 0; 
}
Run Code Online (Sandbox Code Playgroud)

我正在使用用uClibc编译的通用linux内核v4.7.8用于嵌入式系统....任何人都有任何关于为什么会发生这种情况的想法?我现在很笨!TT

更新:我在同一台机器上安装了ubuntu 16.04(内核v4.4.0)并重复了这些步骤,并且pci passthrough工作正常,我的测试代码上的pread也完美无缺.所以我不确定自定义通用内核出了什么问题.

根据arash的建议,我尝试了pread(fd,buf,nbytes,SEEK_CUR),它给了我同样的"非法搜索"错误.我从ftell获得的偏移量是ubuntu和通用内核中的0xffffffff.

iga*_*vez 2

我发现了问题所在,并且一直想将其发布在这里,以供可能遇到此问题的任何人使用。事实证明,uClibc 0.9.33 版本的 pread 和 pwrite 函数已损坏,导致这些函数无法在大于 4G 的偏移量上工作。下面链接中的补丁为我解决了问题: http://uclibc.10924.n7.nabble.com/backport-pread-pwrite-fix-for-0-9-33-branch-td11921.html