所以,我有这个基于java的数据转换/屏蔽工具,我想在Oracle 10g上进行测试.Oracle 10g的优点在于,您可以获得大量包含50万条记录的示例模式.模式是:SH,OE,HR,IX等.所以,我安装了10g,发现安装脚本在ORACLE_HOME/demo/scripts下.
我稍微定制了这些脚本以便在批处理模式下运行.这解决了我的一半要求 - 为我的数据转换软件测试创建源数据.要求的后半部分是我在不使用任何数据的情况下以不同的名称(TR_HR,TR_OE等等)创建相同的模式.这些模式将代表我的目标模式.因此,简而言之,我的软件将从模式中的表中获取数据,并将其加载到不同模式中的同一个表中.
现在,我在创建目标模式并清空它时遇到两个问题.
有没有这么简单的方法,没有这么大惊小怪?我需要一个复杂的数据集用于我的测试(复杂的,如带有触发器的表,多个层次结构......例如,一个子表最多有5个级别,一个父表引用一个IOT表和一个IOT表指的是非IOT表等.).从数据集的角度来看,示例模式几乎是完美的.我看到的唯一挑战是自动化加载源模式的整个过程,然后创建目标模式并清空它们.感谢您的帮助和建议.
UPDATE
您需要运行以手动安装oracle示例模式的主脚本是mkplug.sql.以下是从dmp文件加载模式的行:
host imp "'sys/&&password_sys AS SYSDBA'" transport_tablespace=y file=&imp_file log=&imp_logfile datafiles='&datafile' tablespaces=EXAMPLE tts_owners=hr,oe,pm,ix,sh
Run Code Online (Sandbox Code Playgroud)
好吧,我尝试修改此行(在修复mkplug.sql和所有其他sql文件上的路径相关问题之后)到此:
host imp "'sys/&&password_sys AS SYSDBA'" rows=n transport_tablespace=y file=&imp_file log=&imp_logfile datafiles='&datafile' tablespaces=EXAMPLE tts_owners=hr,oe,pm,ix,sh
Run Code Online (Sandbox Code Playgroud)
而且......它没有不帮忙.尽管rows = n属性:(使用行数据创建了架构:(
我想通过使用C++(库libsndfile)获取WAV文件的最高音量级别的值?有关如何做的任何建议?
我正在使用本教程,并且正在从我的正面图像创建大量样本。我正在使用 Windows。
这是命令:
perl bin/createsamples.pl positives.txt negatives.txt samples 1500\ "C:\opencv_built\bin\Release\opencv_createsamples.exe -bgcolor 0 -bgthresh 0 -maxxangle 1.1\ -maxyangle 1.1 maxzangle 0.5 -maxidev 40 -w 80 -h 40"
Run Code Online (Sandbox Code Playgroud)
对于每个正面图像,这就是我得到的输出:
C:\opencv_built\bin\Release\opencv_createsamples.exe -bgcolor 0 -bgthresh 0 -max
xangle 1.1\ -maxyangle 1.1 maxzangle 0.5 -maxidev 40 -w 80 -h 40 -img 60inclin
ation_315azimuth.jpg -bg tmp -vec samples0inclination_315azimuth.jpg.vec -num 62
Info file name: (NULL)
Img file name: 60inclination_315azimuth.jpg
Vec file name: samples0inclination_315azimuth.jpg.vec
BG file name: tmp
Num: 62
BG color: 0
BG threshold: 0 …
Run Code Online (Sandbox Code Playgroud) opencv image-processing computer-vision training-data sample-data
我在WEKA中使用SMOTE过滤器来平衡数据.
我怀疑这两个参数nearestNeighbors
和percentage
.
nearestNeighbors - 要使用的最近邻居数.
percentage - 要创建的SMOTE实例的百分比.
我应该怎么设置它们?
我认为邻居的数量是它要创建的同步样本的数量.
那么百分比的含义是什么?它应该小于或等于邻居的数量,对吧?是否考虑了合成样本的百分比?
例如:
如果我把10个邻居和200%会发生什么?
谁能给我一些正确使用的例子?