小编use*_*493的帖子

如果在nestedScrollView中,RecyclerView不会回收

我的目标是让NestedScrollView包含多个包含RecyclerViews的子CardView.

我当前的xml看起来像这样:

    <CardView>
        <RecyclerView/>
    </CardView>

    <CardView>
        <RecyclerView/>
    </CardView>
</NestedScrollView>
Run Code Online (Sandbox Code Playgroud)

如果我在RecyclerViews上将nestedScrollViewEnabled设置为false,则所有内容似乎都按预期工作.但是,recyclerviews中的行不会被回收.调用layoutManager.findFirstVisibleItemPosition()始终返回0,并layoutManager.findLastVisibleItemPosition()始终返回列表中的最后一个项目位置.

有什么建议?

android android-recyclerview nestedscrollview

7
推荐指数
1
解决办法
922
查看次数

尝试了解 nvprof 指标,sm_efficiency 和 warp_execution_efficiency 为零

我正在尝试了解 nvprof 指标。我是 CUDA 新手,因此试图了解哪些指标对性能很重要。

我编写了一个内核来计算矩阵之间的绝对差之和。

在 Tegra X1 上运行,平均时间约为 47 毫秒,有 1584 个块,每个块有 1024 个线程。

运行 nvprof 我得到这些指标:

achieved_occupancy         Achieved Occupancy         0.982284    0.982284    0.982284
warp_execution_efficiency  Warp Execution Efficiency  0.00%       0.00%       0.00%
sm_efficiency              Multiprocessor Activity    0.11%       0.11%       0.11%
branch_efficiency          Branch Efficiency          100.00%     100.00%     100.00%
ipc                        Executed IPC               3.600738    3.600738    3.600738
Run Code Online (Sandbox Code Playgroud)

当其他指标都这么好时,为什么 和Warp Execution Efficiency却如此低?Multiprocessor Activity在分析内核的总体性能时,这些是需要考虑的正确指标,对吧?

cuda

5
推荐指数
1
解决办法
2230
查看次数

从未对齐的uint8_t重读为uint32_t数组-未获取所有值

我正在尝试将uint8_t数组强制转换为uint32_t数组。但是,当我尝试执行此操作时,我似乎无法访问每个连续的4个字节。

让我们说我有一个8字节的uint8_t数组。我想作为一个uint32_t访问字节2-> 6。

这些都得到相同的值*((uint32_t*)&uint8Array[0])*((uint32_t*)&uint8Array[1])*((uint32_t*)&uint8Array[2])*((uint32_t*)&uint8Array[3])

虽然*((uint32_t*)&uint8Array[4])按预期方式获得字节4-> 8。

看来我无法从任何地址访问4个连续字节?

有什么办法可以做到这一点?

cuda alignment memory-alignment

1
推荐指数
1
解决办法
364
查看次数