我想知道如何在rails中规范化我的表,说我有一个包含id,用户名,电子邮件和可选字段的表(通常留空).我想将此可选字段移出到单独的表中,但仍将其用作模型中的属性.这可能吗?
在查看使用EAV概念设计的数据库时,我很困惑.EAV代表实体,属性和价值.我的问题是:EAV数据模型是否被视为数据库规范化的高级形式?是"必须使用"才能"更新"吗?
缩短事情:什么时候使用EAV而不是?
当一个表是外键时,表是否满足6NF?例如:
CREATE TABLE authors(
author_id serial NOT NULL PRIMARY KEY
);
-- other author attributes
CREATE TABLE books(
book_id serial NOT NULL PRIMARY KEY
);
CREATE TABLE books_author(
book_id int NOT NULL PRIMARY KEY REFERENCES books (book_id),
author_id int NOT NULL REFERENCES authors (author_id)
);
Run Code Online (Sandbox Code Playgroud)
如果不是,模型应如何处理外键关系?
如果M2M的关系,应该如何处理?连接表也应该是6NF吗?
我认为这是一个非常简单的问题,但我无法找到答案.
我有一个数组:
array([ 62519, 261500, 1004836, ... , 0, 0])
Run Code Online (Sandbox Code Playgroud)
我想将它转换为正态分布,最小值为0,最大值为1.
有什么建议?我在看sklearn.preprocess.normalize,但无法让它为我工作.
目的是我创建一个带有numpy的散点图,并希望使用这个第三个变量为每个点着色.但是,颜色必须在0和1之间,因为我有一些奇怪的异常值,我认为正态分布将是一个良好的开端.
如果这没有任何意义,请告诉我.谢谢和欢呼.
我正在阅读数据库规范化教程,我很难理解以下内容:
函数依赖性表示如果两个元组具有相同的属性A1,A2,...,An的值,那么这两个元组必须具有相同的属性B1,B2,...,Bn的值.
功能依赖性由箭头符号(→)表示,即X→Y,其中X在功能上确定Y.
以上两个是指什么?"功能决定"是什么意思?
我可以有一个元组,其中A1,A2,A3相同,但B1,B2,B3是不同的.
我正在开发一个群集程序,并且有一个双精度数据集,我需要对其进行规范化以确保每个双精度(变量)都具有相同的影响力。
我想使用min-max规范化,其中确定每个变量的min和max值,但是我不确定如何在Java数据集中实现此功能。有没有人有什么建议?
在这本书中:Regina Obe和Leo Hsu,《 PostgreSQL Up&Running》,第47页。101。它是作为PostgreSQL XML数据类型的简介编写的:
XML数据类型类似于JSON,在关系数据库中是“有争议的”,因为它违反了规范化的原则。
无需进一步解释。有人可以详细说明什么是规范化原则,以及XML为什么违反了其中一些原则。
我正试图找到一种方法来根据从excel导入的自定义用户数据调整音调的音高.
self.changePitch(30 + (parseInt(self.infoCollection.collection[j].array[i])-200/(3600)));
Run Code Online (Sandbox Code Playgroud)
上述代码适用于"正常值",最高可达5,000.但是,我想将它们标准化,使其始终介于最小和最大频率之间.(200和3800)
我已经尝试使用这里找到的公式:https:
//stats.stackexchange.com/questions/70801/how-to-normalize-data-to-0-1-range
说哪个使用(x-minval)/(maxval-minval)
但是,这不起作用对于所有情况.使用非常大的数字时.IE 5000万还会超过最高频率.
我试图找到一种方法,这将使任何有理数的数字正常化到数亿.
编辑:抱歉混乱.我正在创建一个基于图表上的数据播放声音的应用程序.目的是允许具有视觉障碍的用户使用声音更好地理解数据以获得彼此相对的值.我的问题是人类无法听到超过一定数量的频率,所以如果有超过5000左右的值,应用程序将不会播放该数字的任何声音.
示例:A公司的利润为200美元,B公司的利润为5000万美元.用户会听到公司A的声音,但不能听到公司B的声音,因为频率超出人类听觉范围.
我有关于NN的训练数据以及预期的输出。每个输入都是10维向量,并具有1个预期输出。我已经使用高斯对训练数据进行了归一化,但是由于它只有一维,所以我不知道如何对输出进行归一化。有任何想法吗?
例:
原始输入向量: -128.91,71.076,-100.75,4.2475,-98.811,77.219,4.4096,-15.382,-6.1477,-361.18
归一化输入向量: -0.6049、1.0412,-0.3731、0.4912,-0.3571、1.0918、0.4925、0.3296、0.4056,-2.5168
上述输入的原始预期输出为1183.6,但我不知道如何将其标准化。我是否应该将预期输出标准化为输入向量的一部分?
我是Keras / TF /深度学习的新手,我正在尝试建立模型来预测房价。
我有一些功能X(浴室数量等)和目标Y(大约$ 300,000至$ 800,000)
在将其拟合到模型之前,我曾使用sklearn的Standard Scaler来标准化Y。
这是我的Keras模型:
def build_model():
model = Sequential()
model.add(Dense(36, input_dim=36, activation='relu'))
model.add(Dense(18, input_dim=36, activation='relu'))
model.add(Dense(1, activation='sigmoid'))
model.compile(loss='mse', optimizer='sgd', metrics=['mae','mse'])
return model
Run Code Online (Sandbox Code Playgroud)
我在尝试解释结果时遇到了麻烦-0.617454319755的MSE是什么意思?
我是否必须对这个数字进行逆变换,然后对结果求平方,得到741.55美元的错误率?
math.sqrt(sc.inverse_transform([mse]))
Run Code Online (Sandbox Code Playgroud)
我为刚开始听起来很傻而道歉!
regression machine-learning normalization scikit-learn keras
normalization ×10
database ×4
6nf ×1
arrays ×1
double ×1
java ×1
javascript ×1
keras ×1
matplotlib ×1
models ×1
numpy ×1
perceptron ×1
python ×1
regression ×1
scikit-learn ×1
sql ×1
xml ×1