标签: dummy-data

使用虚拟数据填充SQL表的最快方法

用虚拟数据填充SQL表的最快方法是什么?

我有一个包含大约40个不同类型字段(int,bit,varchar等)的宽表,需要进行一些性能测试.我正在使用SQL Server 2008.

谢谢!

sql sql-server dummy-data

32
推荐指数
4
解决办法
4万
查看次数

使用pandas中的多个值从列创建虚拟对象

我正在寻找一种pythonic方式来处理以下问题.

The pandas.get_dummies() method is great to create dummies from a categorical column of a dataframe. For example, if the column has values in ['A', 'B'], get_dummies() creates 2 dummy variables and assigns 0 or 1 accordingly.

Now, I need to handle this situation. A single column, let's call it 'label', has values like ['A', 'B', 'C', 'D', 'A*C', 'C*D'] . get_dummies() creates 6 dummies, but I only want 4 of them, so that a row could have multiple …

python dummy-data pandas categorical-data

30
推荐指数
2
解决办法
2万
查看次数

什么是存根/虚拟宁静的Web服务的简单方法?

我想创建一个Android应用程序,这个应用程序将对Web服务进行RESTful调用以获取一些数据.

我知道RESTful接口会是什么,但我不想要创建自己的实现的麻烦.有没有一种简单的方法来创建一个存根RESTful Web服务,它将返回一些静态数据而无需编写完整的WS应用程序来执行此操作?

rest android web-services stub dummy-data

27
推荐指数
4
解决办法
2万
查看次数

在bash中生成虚拟文件

我想在bash中生成虚拟文件.内容无关紧要,如果它是随机的那就很好,但所有相同的字节也是可以接受的.

我的第一次尝试是以下命令:

rm dummy.zip;
touch dummy.zip;
x=0;
while [ $x -lt 100000 ];
do echo a >> dummy.zip;
  x=`expr $x + 1`;
done;
Run Code Online (Sandbox Code Playgroud)

问题是它的表现不佳.我在Windows上使用GitBash,因此在Linux下可能要快得多,但脚本显然不是最佳的.

你能否建议我更快更好地生成给定大小的虚拟(二进制)文件?

bash dummy-data

24
推荐指数
5
解决办法
2万
查看次数

从JSON模式生成Python JSON虚拟数据

我正在寻找一个python库,我可以在其中提供我的JSON模式,并生成虚拟数据.我在javascript dummy-json中使用过类似的库.有没有人关于一个库可以在python中做同样的事情.

python json dummy-data

11
推荐指数
2
解决办法
5810
查看次数

scikit learn:如何检查系数的意义

我试图用SKLearn做一个LR,用于一个相当大的数据集,其中有600个虚拟数据集,只有很少的区间变量(我的数据集中有300 K行),结果混淆矩阵看起来很可疑.我想检查返回系数和ANOVA的重要性,但我找不到如何访问它.有可能吗?对于包含大量虚拟变量的数据,最佳策略是什么?非常感谢!

anova dummy-data scikit-learn logistic-regression

10
推荐指数
1
解决办法
8816
查看次数

R-生成"缺失值变量"

我正在使用R生成如何处理我正在教授的统计类的缺失数据的示例.一种方法需要生成"缺失值二进制变量",其中0表示包含缺失值的情况,1表示没有缺失值.例如

n  X  Y    Z  
1  4  300  2  
2  8  400  4  
3  10 500  7  
4  18 NA   10  
5  20  50  NA  
6  NA 1000 5  
Run Code Online (Sandbox Code Playgroud)

我想生成一个变量M,这样

n m  
1 1  
2 1   
3 1  
4 0  
5 0  
6 0  
Run Code Online (Sandbox Code Playgroud)

考虑到R处理缺失值的能力,这看起来应该很简单.我发现的最接近的是m <-ifelse(is.na(missguns),0,1),但所有这一切都会生成一个新的整个数据矩阵,其中0或1表示缺失.但是,我只想要一个变量来指示行是否包含缺失值.

r missing-data dummy-data

8
推荐指数
1
解决办法
1667
查看次数

MailChimp是否有一个带有虚拟数据的沙箱API用于测试?

我想开始使用MailChimp API来创建一个实用程序,它只是从用户的帐户中提取一些指标,例如订阅者,上次活动日期(不确定那个是否可用),开放率等.

我面临的一个关键问题是,虽然我有一个免费的MailChimp帐户,但没有任何数据(没有列表,订阅者,活动等),这使得它不太适合测试.

所以我想知道我最好的选择是什么,即:

  • 我应该手动创建一些虚拟数据(比如将自己添加为列表的订阅者,然后向自己发送一些电子邮件?),
  • 或者他们(MailChimp)提供一个"沙箱"帐户,其中已经有一些更丰富的测试/虚拟数据?要么,
  • 其他一些替代......

PS - 我正在使用MuleSoft进行此集成任务(我提到它,因为这个信息可能对答案有帮助).

rest sandbox mule mailchimp dummy-data

8
推荐指数
1
解决办法
6363
查看次数

当你不需要在python中使用索引时,如何制作For循环?

如果我需要python中的for循环

for i in range(1,42):
    print "spam"
Run Code Online (Sandbox Code Playgroud)

但不要使用"i"表示任何pylint抱怨未使用的变量.我该怎么处理?我知道你可以这样做:

for dummy_index in range(1,42):
    print "spam"
Run Code Online (Sandbox Code Playgroud)

但这样做对我来说似乎很奇怪,有更好的方法吗?

我是python的新手,请原谅我,如果我错过了一些明显的东西.

python coding-style pylint dummy-data

7
推荐指数
3
解决办法
2452
查看次数

Java:如何使用虚节点或将节点标记为虚节点

一个问题,要求您删除链接列表中的中间节点,只提供该节点.解决问题的方法是复制middle.next.elementmiddle.element,然后删除middle.next通过做middle.next=middle.next.next

有一种特殊情况,即middle.next是最后一个节点.答案说你可以将中间节点标记为虚拟节点.

我不熟悉"虚拟"的想法.如何将节点标记为虚拟节点以及如何在其他情况下使用虚拟节点?

一般虚拟数据怎么样?

java linked-list dummy-data

7
推荐指数
1
解决办法
2765
查看次数