标签: allocation

自定义malloc()实现头设计

我试图在C中编写一个自定义分配器用于调试目的(作为练习),我将使用单个链表来使用First Fit算法将自由列表保存在一起.我在下面展示了我想在"空内存节点"中创建的结构.

如何在内存的前几个字节处编写头块(一个特定的联合),我得到(我使用malloc()来初始获得一块内存)以便剩余的字节是空闲的?

这是我正在使用的联盟:

/*Define Header Structure for proper alignment*/
union header {
struct{
    union header* next;
    unsigned size ; /*Make it size_t*/
}s; 
double dummy_align_var;
};

-------------------------------------------------------------------------------
|Next        |Size of  |16Byte| User is concerned only about |16Byte|         |
|Free Memory |Allocated|Header| this portion  of memory      |Footer|Checksum |
|Address     |Block    |Picket| and has no knowledge of rest |Picket|         |
-------------------------------------------------------------------------------
|-------Header---------|      ^Address Returned to user
                              ^------User Requested Size-----^
^-------------Memory Obtained From The Operating System-----------------------^
*/
Run Code Online (Sandbox Code Playgroud)

[编辑]根据提供的建议更改块结构.

c memory malloc memory-management allocation

6
推荐指数
1
解决办法
3534
查看次数

仪器如何自动停止工作?

我尝试通过仪器监控分配.

但是,当我跑到某一点,发送一些jabber msg时,仪器会自动停止工作.

我想知道它是如何停止的.

应用程序中是否有任何代码可以阻止仪器?

iphone debugging allocation instruments

6
推荐指数
1
解决办法
195
查看次数

Python函数因大型列表的存在而变慢

我正在测试几种不同方式的速度来对我的一些数据进行复杂的迭代,我发现了一些奇怪的东西.似乎某个函数的局部大型列表会大大减慢该函数的速度,即使它没有触及该列表.例如,通过相同生成器函数的2个实例创建2个独立列表,第二次约慢2.5倍.如果在创建第二个列表之前删除了第一个列表,则两个迭代器都会使用相同的spee.

def f():  
    l1, l2 = [], []  
    for c1, c2 in generatorFxn():  
        l1.append((c1, c2))  
    # destroying l1 here fixes the problem 
    for c3, c4 in generatorFxn():  
        l2.append((c3, c4))
Run Code Online (Sandbox Code Playgroud)

这些列表每个最终大约有310万个项目,但我也看到了与较小列表相同的效果.第一个for循环运行大约需要4.5秒,第二个循环需要10.5秒.如果我插入l1= []l1= len(l1)在注释位置,两个for循环都需要4.5秒.

为什么函数中本地内存分配的速度与该函数变量的当前大小有关?

编辑:禁用垃圾收集器修复一切,所以必须由于它不断运行.案件结案!

python memory performance allocation

6
推荐指数
1
解决办法
2798
查看次数

如何在C语言中将字符串添加到字符串数组中

所以我正在重新认识C,这个概念让我特别困惑.

目标是创建一个动态分配的字符串数组.我已完成此操作,首先创建一个空数组并为输入的每个字符串分配适当的空间量.唯一的问题是,当我尝试实际添加一个字符串时,我得到一个seg错误!我无法弄清楚为什么,我有预感,这是因为我的strcpy函数没有看错.

我在这个网站上看了一遍详尽的答案,我找到了帮助,但不能完全达成协议.您将提供的任何帮助将不胜感激!

#include <stdio.h>
#include <string.h>
#include <stdlib.h>

int main()
{
  int count = 0; //array index counter
  char *word; //current word
  char **array = NULL;


  char *term = "q"; //termination character
  char *prnt = "print";

  while (strcmp(term, word) != 0)
{
  printf("Enter a string.  Enter q to end.  Enter print to print array\n");
  // fgets(word, sizeof(word), stdin); adds a newline character to the word.  wont work in this case
  scanf("%s", word);

  //printf("word: %s\nterm: %s\n",word, term);

  if (strcmp(term, word) …
Run Code Online (Sandbox Code Playgroud)

c memory arrays string allocation

6
推荐指数
1
解决办法
2万
查看次数

当我使用 VirtualAlloc() 和 MEM_RESERVE 保留内存时,我是否应该能够在 64K 边界上增加我的分配?

首先,我非常清楚如何VirtualAlloc()工作:当我保留内存块时,我得到与 64K 边界对齐的地址(可以通过 轻松获得该值GetSystemInfo()),然后当我提交页面时,我得到它们的页面大小边界,通常为 4K。

我无法得到的事情是,为什么如果我使用标志调用VirtualAlloc()MEM_RESERVE所以我要保留页面)并且指定一定的大小,比如说 4096,那么我将无法将该区域进一步增长到 64K ?

我的意思是:当我提交页面时,我可以使用最多 4K 的内存,因为 Windows 会将这些提交与页面大小对齐(当然,我正在提交页面!),但是当我保留内存区域时,应该Windows 不会将我传递到的区域大小调整VirtualAlloc()为 64K 吗?“浪费”的 15 页都去哪儿了?

因此,如果我保留 4096 字节,我是否应该能够提交更多页面直到 65536 字节?看来并非如此,因为如果我尝试这样做,VirtualAlloc()则会因ERROR_INVALID_ADDRESS最后一个错误代码而失败。

但为什么?如果 Windows 确实在 64K 边界上保留页面,并且我保留小于该大小的页面,我会永远丢失不保留的页面吗?因为似乎没有办法再次提交它们,或者调整区域大小以适应我因较低的预留而错过的 64K 边界。

那么,进程的虚拟空间会不会有漏洞呢?为了避免这种情况,我是否必须始终在 64K 边界上保留内存,因此在保留页面时始终VirtualAlloc()给出64K 对齐的值?

当我使用的时候呢MEM_RESERVE|MEM_COMMIT?由于标志的原因,我不应该在那里传递 64K 对齐的大小吗MEM_RESERVE

我提供了一些我尝试过的代码示例。正如您在这里所看到的,第一个函数成功了,因为我保留了更多页面,那么我的提交将有足够的“保留区域”来实际提交,在这种情况下,该区域将<64K,那么那些“丢失的”页面去哪儿了?

在第二种情况下,我只是MEM_RESERVE|MEM_COMMIT,因此提交其他页面会失败并显示ERROR_INVALID_ADDRESS最后一个错误代码。很公平,但同样在这里,为什么我不能提交更多页面,至少在 64K 边界上?为了不浪费地址并创建这些“漏洞”,我真的应该在 64K 边界上保留虚拟内存吗?如果我不遵守这个原则怎么办?我总是看到很多代码只是简单地VirtualAlloc()MEM_COMMIT|MEM_RESERVE …

c++ winapi memory-management allocation virtual-memory

6
推荐指数
1
解决办法
7752
查看次数

c++ 中 new 运算符之后和 type 之前的 (placement_params) 括号是什么意思?

第一个括号有什么作用?

// TArray<struct FBatchedLine> BatchedLines;      // declared in LineBatchComponent.h

new(BatchedLines) FBatchedLine(Start, End, Color, LifeTime, Thickness, DepthPriority);
Run Code Online (Sandbox Code Playgroud)

新的运营商参考说,这是一个placement_params

如果提供了placement_params,它们将作为附加参数传递给分配函数

我想它直接在给定数组的末尾创建对象BatchedLines,但我不确定完全理解它是如何工作的。

什么时候placement_params有用?

笔记

对于那些有权访问 github UnrealEngine 存储库的人,这里是源文件。

c++ allocation new-operator

6
推荐指数
1
解决办法
772
查看次数

Julia中的内存分配

将程序从Python翻译成Julia后,我非常不满意:

  • 对于小/非常小的输入,Python更快
  • 对于中等投入,朱莉娅更快(但不是那么多)
  • 对于大输入,Python更快

我认为原因是我不明白内存分配是如何工作的(autodidact在这里,没有CS背景).我会在这里发布我的代码但是它太长而且太具体了,除了我之外它对任何人都没有好处.因此我做了一些实验,现在我有一些问题.

考虑这个简单script.jl:

function main()
    @time begin
        a = [1,2,3]
    end
end
main()
Run Code Online (Sandbox Code Playgroud)

当我运行它时,我得到:

$ julia script.jl
  0.000004 seconds (1 allocation: 96 bytes)
Run Code Online (Sandbox Code Playgroud)

1.为什么96字节?当我设置时a = []我得到64个字节(为什么空数组的重量如此之多?).96字节 - 64字节= 32字节.但是a是一个Array{Int64,1}.3*64位= 3*8字节= 24字节!= 32字节.

2.即使我设置了,为什么我会得到96个字节a = [1,2,3,4]

3.运行时为什么我得到937.500 KB:

function main()
    @time begin
        for _ in 1:10000
            a = [1,2,3]
        end
    end
end
main()
Run Code Online (Sandbox Code Playgroud)

而不是960.000 KB?

4.为什么,例如,filter()如此低效?看看这个:

check(n::Int64) = n % 2 == …
Run Code Online (Sandbox Code Playgroud)

memory allocation julia

6
推荐指数
2
解决办法
3758
查看次数

malloc 和 free 上的计时

我想了解的时机mallocfree。所以我写了这个简单的程序:

#include <stdlib.h>
#include <stdio.h>


int
main()
{
  long i;
  for(i = 2; i < 10000000000; i*=2) {
    struct timeval start, end;
    double timing ;
    long j;
    gettimeofday(&start, NULL);
    double *vect = malloc((size_t) i * sizeof(*vect));
    if (!vect) {
      printf("malloc failed\n");
      exit(-1);
    }
    gettimeofday(&end, NULL);
    timing =  (double) (end.tv_sec * 1e6 + end.tv_usec) - (start.tv_sec * 1e6 + start.tv_usec);
    printf("size %ld allocating (%f)\t", i * sizeof(*vect), timing);
    /* I do this to avoid lazy allocation */ …
Run Code Online (Sandbox Code Playgroud)

c allocation

6
推荐指数
1
解决办法
772
查看次数

如何在 Linux 中分配大的连续内存区域

是的,我最终会将它用于 DMA,但暂时将一致性放在一边。我有 64 位 BAR 寄存器,因此,AFAIK,所有 RAM(例如高于 4G)都可用于 DMA。

我正在寻找大约 64MB 的连续 RAM。是的,很多。

Ubuntu 16 和 18 具有CONFIG_CMA=y但未CONFIG_DMA_CMA在内核编译时设置。

我注意到,如果两者都设置(在内核构建时),我可以简单地调用dma_alloc_coherent,但是,出于逻辑原因,重新编译内核是不可取的。

这些机器将始终具有至少 32GB 的 RAM,不运行任何占用大量内存的东西,并且内核模块将在启动后不久加载,然后 RAM 变得明显碎片化,而且,AFAIK,没有其他东西使用 CMA。

我已经设置了内核参数 CMA=1G。(并尝试过 256M 和 512M)

# dmesg | grep cma
[    0.000000] Command line: BOOT_IMAGE=/boot/vmlinuz-4.4.170 root=UUID=2b25933c-e10c-4833-b5b2-92e9d3a33fec ro cma=1G
[    0.000000] Kernel command line: BOOT_IMAGE=/boot/vmlinuz-4.4.170 root=UUID=2b25933c-e10c-4833-b5b2-92e9d3a33fec ro cma=1G
[    0.000000] Memory: 65612056K/67073924K available (8604K kernel code, 1332K rwdata, 3972K rodata, 1484K init, 1316K bss, 1461868K reserved, 0K cma-reserved)
Run Code Online (Sandbox Code Playgroud)

我试过了 …

allocation linux-kernel dma contiguous

6
推荐指数
1
解决办法
3108
查看次数

为什么 vec![Vec::with_capacity(n)] 为子向量创建 0 容量?

给定以下代码,为什么capacity每个向量的 是 0 而不是chunk_size

#[test]
fn test() {
    let chunk_size = 1024;
    let data: Vec<Vec<u8>> = vec![Vec::with_capacity(chunk_size); 2];

    assert_eq!(data[0].capacity(), chunk_size);
    assert_eq!(data[1].capacity(), chunk_size);
}
Run Code Online (Sandbox Code Playgroud)

游乐场链接:https://play.rust-lang.org/?version= stable&mode=debug&edition=2021&gist=0c40515b164044621c369adef1090c6e

allocation vector rust

6
推荐指数
1
解决办法
126
查看次数