ScalaCheck:选择具有自定义概率分布的整数

jjs*_*jst 6 scala scalacheck

我想在ScalaCheck中创建一个生成器,生成介于1和100之间的数字,但是对于接近1的数字具有钟形偏向.

Gen.choose() 在最小值和最大值之间随机分配数字:

scala> (1 to 10).flatMap(_ => Gen.choose(1,100).sample).toList.sorted
res14: List[Int] = List(7, 21, 30, 46, 52, 64, 66, 68, 86, 86)
Run Code Online (Sandbox Code Playgroud)

并且Gen.chooseNum()对上限和下限有额外的偏见:

scala> (1 to 10).flatMap(_ => Gen.chooseNum(1,100).sample).toList.sorted
res15: List[Int] = List(1, 1, 1, 61, 85, 86, 91, 92, 100, 100)
Run Code Online (Sandbox Code Playgroud)

我想要一个choose()能给我一个看起来像这样的结果的函数:

scala> (1 to 10).flatMap(_ => choose(1,100).sample).toList.sorted
res15: List[Int] = List(1, 1, 1, 2, 5, 11, 18, 35, 49, 100)
Run Code Online (Sandbox Code Playgroud)

我看到了,choose()chooseNum()采用隐含的选择特征作为参数.我应该用吗?

Oni*_*iel 5

您可以使用Gen.frequency() (1)

 val frequencies = List(
   (50000, Gen.choose(0, 9)),
   (38209, Gen.choose(10, 19)),
   (27425, Gen.choose(20, 29)),
   (18406, Gen.choose(30, 39)),
   (11507, Gen.choose(40, 49)),
   ( 6681, Gen.choose(50, 59)),
   ( 3593, Gen.choose(60, 69)),
   ( 1786, Gen.choose(70, 79)),
   (  820, Gen.choose(80, 89)),
   (  347, Gen.choose(90, 100))
 )

 (1 to 10).flatMap(_ => Gen.frequency(frequencies:_*).sample).toList
 res209: List[Int] = List(27, 21, 31, 1, 21, 18, 9, 29, 69, 29)
Run Code Online (Sandbox Code Playgroud)

我从https://en.wikipedia.org/wiki/Standard_normal_table#Complementary_cumulative获得频率。该代码只是表的示例(%3或mod 3),但我认为您可以理解。