什么数据生成器?

7 sql database csv

我即将发布一个FOSS数据生成器,它可以生成CSV格式的随机但有意义的数据.相反,我猜,我需要对这些产品的最新技术进行评估 - 因为如果有一个众所周知且有用的现有工具,我可以写下我的工作来体验.我知道一些SQL Server特定的工具,但我的不是特定于数据库的.

那么,链接?如果您使用过这样的产品,您发现它缺少哪些功能?

编辑:要在我的工具上添加更多信息(Ooh,Matron!),它旨在允许从现有数据文件生成任何类型的随机数据,并支持加权.它是基于XML的(抱歉,伙计),让你说:

<pick distribute="20,80" >
  <datafile  file="femalenames.dat"/>
  <datafile  file="malenames.dat"/>
<pick/>
Run Code Online (Sandbox Code Playgroud)

大约20%的时间选择女性名字,80%的时间选择男性名字.

但这个问题的目的不是描述我的产品,而是获取其他工具的信息.

最新消息:如果有人感兴趣,他们可以在http://code.google.com/p/csvtest上获取我的数据生成器的字母

Dir*_*tel 1

这可以是R中的一行代码,我使用较小的脚本前端:

# generate the data as a one-liner from the command-line
# we set the RNG seed, and draw from a bunch of distributions
# indented just to fit the box here
edd@ron:~$ r -e'set.seed(42); write.csv(data.frame(y=runif(10), x1=rnorm(10),    
                x2=rt(10,4), x3=rpois(10, 0.4)), file="/tmp/neil.csv", 
                quote=FALSE, row.names=FALSE)'
edd@ron:~$ cat /tmp/neil.csv
y,x1,x2,x3
0.914806043496355,-0.106124516091484,0.830735621223563,0
0.937075413297862,1.51152199743894,1.6707628713402,0
0.286139534786344,-0.0946590384130976,-0.282485683052060,0
0.830447626067325,2.01842371387704,0.714442314565005,0
0.641745518893003,-0.062714099052421,-1.08008578470128,0
0.519095949130133,1.30486965422349,2.28674786332467,0
0.736588314641267,2.28664539270111,-0.73270267483628,1
0.134666597237810,-1.38886070111234,-1.45317770550920,1
0.656992290401831,-0.278788766817371,-1.01676025893376,1
0.70506478403695,-0.133321336393658,0.404860813371462,0
edd@ron:~$
Run Code Online (Sandbox Code Playgroud)

您尚未提及任何有关数据生成过程的信息,但请放心,R 可能可以满足几乎任何要求,包括多元正态分布、t、偏斜t 等。R 中的(六个不同的)随机数生成器的质量也非常高。

R 还可以写入数据库,或从中读取参数,如果需要在 Windoze 上,则可以使用 Rscript 前端,而不是使用更小的前端。