我正在尝试掌握1NF,并且想知道下表是否为1NF。我将假定为否,因为在列中可以重复first_name,last_name和full_name,因此需要将其转移到新表中,在该表中有user_id和first_name,last_name和full_name列。下图是参考数据库的屏幕截图。
我正在使用 Libgdx 库对 Android 应用程序中的加速度计信号进行 FFT。
我需要对信号进行归一化,因为我找到两个信号的点积,并且我希望其最大值为 1。
对于“归一化”,我的意思是信号的欧几里得范数是1。(欧几里得范数是向量模拟分量的乘积之和的平方根。当我找到它的值时,为了归一化信号,我将向量的所有分量除以标准值)。
点积位于频谱中,因此如果我在时域中对信号进行归一化,则频谱表示不是欧几里德归一化,那么我将再次进行欧几里德归一化。(我已经考虑在 FFT 之后按 1/N比例因子进行归一化,我认为这可能不会影响我的问题)。
如果我在 FFT 之前和之后进行欧几里得归一化,或者仅在 FFT 之后进行欧几里得归一化,会有什么区别?
编辑1:还要考虑Libgdx库中的FFT是复杂的DFT,并且我在输入中有真实信号,而输出信号对于0到(N/2)-1和N/2到N是对称的。我验证了Parseval定理如果我不应用窗口(如汉明窗口),则验证。那么,如果我使用 0 到 N/2-1 信号分量,我会得到 0 到 1 之间的点积吗?
我目前正面临着我设计的桌面问题(请参见下文).一个学生可以属于多个班级.我开始在以后的一列中存储多个值,以了解这是一个很大的不.例如,class_id在存储由逗号分隔的值时,faces会出现类型丢失和成为字符串的问题.我已阅读制作文章,它表示制作两个表一个用于课堂,另一个用于学生,但不确定如何插入基本上将学生链接到多个班级的数据.什么是最好的方法?
目前的做法:
------------ ---------- ------------ -------------
student_fname student_id class_name class_id
------------ ---------- ------------ -------------
james Vre94b3JpXO math,science 5697,5768
jim JzqQ2zRVNm1 art, music 7604,7528
jenny xgqv9P42eYL physical-ed 6422
kyle QLNM0Wbyqk0 computer,jrotoc 6315,8797
kimberly P2egAddWN0Q culinary-arts 8069
kayla EGNDjWAreAy science, art 5768,7604
noah bPeOyMMONGr math, music 5697,7528
nataly 9Op53GGmqk5 jrotc 8797
Run Code Online (Sandbox Code Playgroud)
建议的方法:
------------ ----------
class name class id
------------ ----------
math 5697
science 5768
computer 6315
physical-ed 6422
music 7528
art 7604
jrotc 8797
culinary-arts 8069
------------ ----------
student fname …Run Code Online (Sandbox Code Playgroud) 是否有一个 Java 库可以通过删除空格/特殊字符、小写所有字母来标准化字符串,例如:S-cube Abc' Inc.to scubeabcinc?
假设我想预测股票价格,并且我有训练数据,我知道其中的最小值和最大值。这似乎是使用 MinMaxScaler 的好例子,但我想知道以下内容。如果我从训练数据中知道最高值设置为 1,那么当测试数据中的股票价格达到比我一开始标准化为 1 的值更高时会发生什么?它是否只是覆盖它并将其指定为新的最大值?
我有一个矢量:
0.02
-0.02
0
-0.02
-0.08
-0.05
-0.04
-0.1
0
0.05
0.05
0.05
0.08
0.04
Run Code Online (Sandbox Code Playgroud)
如何使用从100开始的第一个值对此进行标准化?
尝试标准化数据框中的所有行,以便
A B C A B C
1 2 4 => 1 .3 .6
2 2 5 2 .3 .7
3 4 6 3 .4 .6
Run Code Online (Sandbox Code Playgroud)
这会返回一个警告,表明它正在强制转换为整数
outdf <- df[, names(df) := (.SD / rowSums(.SD)), .SDcols=x,by=y]
Run Code Online (Sandbox Code Playgroud)
这没有任何作用
outdf <- df[, names(df) := as.numeric(x)][,x:=(.SD / rowSums(.SD)), .SDcols=x,by=y][]
Run Code Online (Sandbox Code Playgroud)
这些都很接近。有没有更好的方法来改变类型或者更好的方法来规范化。(进入这一行的数据约为 42GB,因此 data.table 是正确的选择)
编辑:
x 和 y
x <- names(data)[14:ncol(data)]
y <- names(data)[1]
Run Code Online (Sandbox Code Playgroud)