标签: normalization

我不是在询问索引还是分区,我在询问一个选择,在添加大号之间.列或将数据添加为行而不是.说明:我们目前有一个要求做出设计来处理多个属性和属性值对某些特定产品的产品可能会达到100万人次的纪录,并且每个产品可能有多个属性,因此对于ProductProperties表可能会达到数十亿美元.有些人想过将属性添加为ProductProperties表,Property1和value1,Property2和value2等中的列....如果产品不包含属性的值,则此属性的相关字段将为null.此外,他们还将添加大约80-100个属性,以便能够动态地覆盖各种属性.建筑师拒绝这种方法,因为这不是一个好的设计.任何人都可以告诉我如何达到良好的设计和良好的性能.谢谢

database performance normalization

Hos*_*sam

lucky-day

2
推荐指数

1
解决办法

931
查看次数

性能提升与规范化表格相比？

好的我知道你可能会因为问这个问题而杀了我,但是我和同事讨论了一个关于我们的数据库表的友好程序员问题,他问了一个我知道答案的问题,但我不能解释这是更好的方法.

为了简化问题,我将简化情况,我们有一个相当大的人/用户表.现在,在存储的其他数据中,所讨论的数据如下:我们有一个simNumber,cellNumber和该sim的ipAddress.

现在我说我们应该创建一个表,让它称之为SimTable并将这3个条目放入sim表中,然后在UsersTable中放入一个FK链接两者.为什么？因为这就是我一直教给你的桌子!好的,所以在这方面一切都很好.

但现在我的朋友对我说是的,但现在当你想查询用户的电话号码时,SQL现在必须去:

搜索用户
搜索sim fk
在sim数据库中搜索正确的sim行
得到电话号码

现在当我去请求10000个用户的电话号码时,完成的操作数量会严重增加.

与另一种方法相反

搜索用户
找到电话号码

现在这个论点纯粹基于表现.尽管我理解为什么我们会对数据进行规范化(删除冗余数据,可维护性,在一个表中对数据进行更改等等).在我看来,在一个表中使用数据的方法会更快或者至少会减少任务/操作给我我想要的数据？

那么这种情况是怎样的呢？我希望我没有问过任何愚蠢的事情,这是一大早所以如果我不清楚的话,请原谅我

MS SQL Server 2012中涉及的技术

[编辑]下面的这篇文章也涉及我上面提到的一些概念 http://databases.about.com/od/specificproducts/a/Should-I-Normalize-My-Database.htm

sql database sql-server database-design normalization

Zap*_*ica

2014 07-08

2
推荐指数

1
解决办法

558
查看次数

OLAP和OLTP中的规范化

尽管阅读了书籍和文章,但我无法找到下面的具体答案.

OLAP和OLTP的最小和最大标准化程度应该是多少？

我认为,OLTP的最小值是第3范式,OLAP的最大值是第2范式.

我们可以请详细说明以补充答案吗？

olap database-design oltp normalization database-normalization

Sri*_*niV

lucky-day

2
推荐指数

1
解决办法

1660
查看次数

Python Pandas Dataframe:将数据归一化到0.01到0.99之间？

我试图将数据帧中的每个值绑定在0.01和0.99之间

我使用以下方法成功地将0到1之间的数据标准化:.apply(lambda x: (x - x.min()) / (x.max() - x.min()))如下:

df = pd.DataFrame({'one' : ['AAL', 'AAL', 'AAPL', 'AAPL'], 'two' : [1, 1, 5, 5], 'three' : [4,4,2,2]})

df[['two', 'three']].apply(lambda x: (x - x.min()) / (x.max() - x.min()))

df

Run Code Online (Sandbox Code Playgroud)

现在我想绑定0.01到0.99之间的所有值

这是我尝试过的:

def bound_x(x):
    if x == 1:
        return x - 0.01
    elif x < 0.99:
        return x + 0.01

df[['two', 'three']].apply(bound_x)

Run Code Online (Sandbox Code Playgroud)

但是我收到以下错误:

ValueError: ('The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().', …

Run Code Online (Sandbox Code Playgroud)

python normalization dataframe pandas

jfi*_*ive

lucky-day

2
推荐指数

1
解决办法

3022
查看次数

非规范化数据

我使用此R代码将数据标准化为最小值和最大值:

normalize <- function(x) {
    return ((x - min(x)) / (max(x) - min(x)))
  }

mydata <- as.data.frame(lapply(mydata , normalize))

Run Code Online (Sandbox Code Playgroud)

如何对数据进行非规范化？

r normalization denormalization minmax

myI*_*D33

2018 05-10

2
推荐指数

1
解决办法

4394
查看次数

Python中的标准化/规范化测试数据

我正在做一个sklearn家庭作业,我不明白为什么要用训练平均值和sd标准化和标准化测试数据.我怎样才能在Python中实现它？这是我对列车数据的实施:

digits = sklearn.datasets.load_digits()
X= digits.data
Y= digits.target
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3,train_size=0.7)
std_scale = preprocessing.StandardScaler().fit(X_train)
X_train_std = std_scale.transform(X_train)
#X_test_std=??

Run Code Online (Sandbox Code Playgroud)

对于火车我认为这是正确的,但对于测试？

python normalization scikit-learn

Pao*_*ini

lucky-day

2
推荐指数

1
解决办法

4016
查看次数