考虑累积频率的随机数函数

Eva*_*oll 1 math statistics frequency

姓氏和名字出现的人口普查数据集提供cumulative frequencyfrequency.我如何获得一个随机名称,其中可能会选择现实世界中出现的名称?

leo*_*loy 6

只需生成0-100范围内的随机实数,并在累积频率数据集中查找相应的条目.

例如,说你的随机数给出x = 19.41.查看表格(按累计频率排序)并找到第一个值大于或等于的值x

WALLACE        0.081 19.315    106
WOODS          0.080 19.395    107
COLE           0.080 19.476    108
WEST           0.080 19.555    109
JORDAN         0.078 19.634    110
Run Code Online (Sandbox Code Playgroud)

在这个例子中,你获得'COLE'

  • @Evan最后10%包含非常罕见的名称,将它们全部放入列表中需要花费千兆字节才能下载.您只获得了90.483%最常见的名字. (2认同)