标签: dummy-data

使用虚拟数据填充SQL表的最快方法

用虚拟数据填充SQL表的最快方法是什么？

我有一个包含大约40个不同类型字段(int,bit,varchar等)的宽表,需要进行一些性能测试.我正在使用SQL Server 2008.

谢谢!

sql sql-server dummy-data

Ale*_*lex

lucky-day

32
推荐指数

4
解决办法

4万
查看次数

The pandas.get_dummies() method is great to create dummies from a categorical column of a dataframe. For example, if the column has values in ['A', 'B'], get_dummies() creates 2 dummy variables and assigns 0 or 1 accordingly.

Now, I need to handle this situation. A single column, let's call it 'label', has values like ['A', 'B', 'C', 'D', 'A*C', 'C*D'] . get_dummies() creates 6 dummies, but I only want 4 of them, so that a row could have multiple …

python dummy-data pandas categorical-data

mkl*_*kln

2014 06-05

30
推荐指数

2
解决办法

2万
查看次数

什么是存根/虚拟宁静的Web服务的简单方法？

我想创建一个Android应用程序,这个应用程序将对Web服务进行RESTful调用以获取一些数据.

我知道RESTful接口会是什么,但我不想要创建自己的实现的麻烦.有没有一种简单的方法来创建一个存根RESTful Web服务,它将返回一些静态数据而无需编写完整的WS应用程序来执行此操作？

rest android web-services stub dummy-data

Jim*_*mmy

2012 01-09

27
推荐指数

4
解决办法

2万
查看次数

在bash中生成虚拟文件

我想在bash中生成虚拟文件.内容无关紧要,如果它是随机的那就很好,但所有相同的字节也是可以接受的.

我的第一次尝试是以下命令:

rm dummy.zip;
touch dummy.zip;
x=0;
while [ $x -lt 100000 ];
do echo a >> dummy.zip;
  x=`expr $x + 1`;
done;

Run Code Online (Sandbox Code Playgroud)

问题是它的表现不佳.我在Windows上使用GitBash,因此在Linux下可能要快得多,但脚本显然不是最佳的.

你能否建议我更快更好地生成给定大小的虚拟(二进制)文件？

bash dummy-data

jab*_*bal

2012 03-21

24
推荐指数

5
解决办法

2万
查看次数

从JSON模式生成Python JSON虚拟数据

我正在寻找一个python库,我可以在其中提供我的JSON模式,并生成虚拟数据.我在javascript dummy-json中使用过类似的库.有没有人关于一个库可以在python中做同样的事情.

python json dummy-data

use*_*735

lucky-day

11
推荐指数

2
解决办法

5810
查看次数

scikit learn:如何检查系数的意义

我试图用SKLearn做一个LR,用于一个相当大的数据集,其中有600个虚拟数据集,只有很少的区间变量(我的数据集中有300 K行),结果混淆矩阵看起来很可疑.我想检查返回系数和ANOVA的重要性,但我找不到如何访问它.有可能吗？对于包含大量虚拟变量的数据,最佳策略是什么？非常感谢!

anova dummy-data scikit-learn logistic-regression

dad*_*dam

lucky-day

10
推荐指数

1
解决办法

8816
查看次数

R-生成"缺失值变量"

我正在使用R生成如何处理我正在教授的统计类的缺失数据的示例.一种方法需要生成"缺失值二进制变量",其中0表示包含缺失值的情况,1表示没有缺失值.例如

n  X  Y    Z  
1  4  300  2  
2  8  400  4  
3  10 500  7  
4  18 NA   10  
5  20  50  NA  
6  NA 1000 5

Run Code Online (Sandbox Code Playgroud)

我想生成一个变量M,这样

Run Code Online (Sandbox Code Playgroud)

考虑到R处理缺失值的能力,这看起来应该很简单.我发现的最接近的是m <-ifelse(is.na(missguns),0,1),但所有这一切都会生成一个新的整个数据矩阵,其中0或1表示缺失.但是,我只想要一个变量来指示行是否包含缺失值.

r missing-data dummy-data

jer*_*ley

2013 05-27

8
推荐指数

1
解决办法

1667
查看次数

MailChimp是否有一个带有虚拟数据的沙箱API用于测试？

我想开始使用MailChimp API来创建一个实用程序,它只是从用户的帐户中提取一些指标,例如订阅者,上次活动日期(不确定那个是否可用),开放率等.

我面临的一个关键问题是,虽然我有一个免费的MailChimp帐户,但没有任何数据(没有列表,订阅者,活动等),这使得它不太适合测试.

所以我想知道我最好的选择是什么,即:

我应该手动创建一些虚拟数据(比如将自己添加为列表的订阅者,然后向自己发送一些电子邮件？),
或者他们(MailChimp)提供一个"沙箱"帐户,其中已经有一些更丰富的测试/虚拟数据？要么,
其他一些替代......

PS - 我正在使用MuleSoft进行此集成任务(我提到它,因为这个信息可能对答案有帮助).

rest sandbox mule mailchimp dummy-data

Dre*_*vid

lucky-day

8
推荐指数

1
解决办法

6363
查看次数

当你不需要在python中使用索引时,如何制作For循环？

如果我需要python中的for循环

for i in range(1,42):
    print "spam"

Run Code Online (Sandbox Code Playgroud)

但不要使用"i"表示任何pylint抱怨未使用的变量.我该怎么处理？我知道你可以这样做:

for dummy_index in range(1,42):
    print "spam"

Run Code Online (Sandbox Code Playgroud)

但这样做对我来说似乎很奇怪,有更好的方法吗？

我是python的新手,请原谅我,如果我错过了一些明显的东西.

python coding-style pylint dummy-data

Jac*_*xel

2012 04-12

7
推荐指数

3
解决办法

2452
查看次数

Java:如何使用虚节点或将节点标记为虚节点

一个问题,要求您删除链接列表中的中间节点,只提供该节点.解决问题的方法是复制middle.next.element到middle.element,然后删除middle.next通过做middle.next=middle.next.next

有一种特殊情况,即middle.next是最后一个节点.答案说你可以将中间节点标记为虚拟节点.

我不熟悉"虚拟"的想法.如何将节点标记为虚拟节点以及如何在其他情况下使用虚拟节点？

一般虚拟数据怎么样？

java linked-list dummy-data

fui*_*iii

2014 01-03

7
推荐指数

1
解决办法

2765
查看次数

标签统计

dummy-data ×10

python ×3

rest ×2

android ×1

anova ×1

bash ×1

categorical-data ×1

coding-style ×1

java ×1

json ×1

linked-list ×1

logistic-regression ×1

mailchimp ×1

missing-data ×1

mule ×1

pandas ×1

pylint ×1

r ×1

sandbox ×1

scikit-learn ×1

sql ×1

sql-server ×1

stub ×1

web-services ×1

标签 统计

标签统计