小编DaT*_*omB的帖子

weka中看不见的名义价值

我有一个带有一些名义值的数据集作为特征.我所拥有的训练集有一组标称特征的值,这些值在我的测试集中是不存在的.例如,我在训练集中的特征对应于

@attribute h4 {br,pl,com,ro,th,np}

和测试集中的相同功能有

@attribute h4 {br,pl,abc,th,def,ghi,lmno}

我相信因此,weka不允许我重新评估我在我的测试集上的训练集上建立的模型.有没有解决的办法?我错过了什么吗?

编辑:我正在使用RandomForest分类器.

谢谢

machine-learning weka supervised-learning

8
推荐指数
1
解决办法
402
查看次数

使用Linux IMA重新测量文件

我正在尝试使用本指南http://linux-ima.sourceforge.net/linux-ima-content.html-20110907在RHEL中设置Linux IMA .我想设置系统,以便在文件发生变化时重新测量我选择的敏感文件(我陷入了与重新测量文件相关的部分).我/etc/fstab看起来像这样:

UUID = c8dbe0a9-8c0c-4aba-adff-bcf2dd4640da/ext4,iversion默认值为1 1

UUID = b1762b74-d517-4293-8b49-cdc06b94d78c/boot ext3默认值1 2

UUID = 8c6b8003-7176-4cf4-ae23-a124f8768c36 swap swap defaults 0 0

当我检查测量列表时,/sys/kernel/security/ima/ascii_runtime_measurements我只看到一个条目如下:

10 3f0d6c1e772444096d975aba704a10e4820eabab ima 7b739f0b35c61d68bd664d352b6631c366aee34f boot_aggregate

即使我在/ etc /中更改了某些文件或执行其他操作,我也没有观察到任何其他测量结果.什么可能出错?

linux rhel integrity rhel7

7
推荐指数
1
解决办法
355
查看次数

使用HL7识别设备

我正在寻找HL7消息,通过它我可以识别我的网络中的供应商和设备类型(例如Medlink - Xray,Alaris - IV泵).是否有特定的消息我应该考虑实现这一目标?PRT细分和OBX-18是相关的信息来源吗?

hl7 hl7-v2

7
推荐指数
1
解决办法
178
查看次数

Android中的RSA加密

我正在编写一个在Android中使用RSA的程序.我有以下问题:我收到了RSA密钥:

KeyPair kp = kpg.genKeyPair();
publicKey = kp.getPublic();
privateKey = kp.getPrivate();
Run Code Online (Sandbox Code Playgroud)

使用加密函数加密测试字符串:

String test ="test";
byte[] testbytes = test.getBytes();
Cipher cipher = Cipher.getInstance("RSA");
cipher.init(Cipher.ENCRYPT_MODE, publicKey);
byte[] cipherData = cipher.doFinal(testbytes);
String s = new String(cipherData);
Log.d("testbytes after encryption",s);
Run Code Online (Sandbox Code Playgroud)

在解密功能中,我正在解密数据以获得原始字符串

Cipher cipher2 = Cipher.getInstance("RSA");
cipher2.init(Cipher.DECRYPT_MODE, privateKey);
byte[] plainData = cipher.doFinal(cipherData);
String p  = new String(plainData);
Log.d("decrypted data is:",p);
Run Code Online (Sandbox Code Playgroud)

打印在日志中的'p'中的数据与原始字符串"test"不匹配.我在哪里错了?

java encryption android rsa

6
推荐指数
1
解决办法
5777
查看次数

用scikit选择层次凝聚聚类中的聚类数

关于确定数据集中群集数量的维基百科文章表明,在使用层次聚类时,我不需要担心这样的问题.然而,当我尝试使用scikit-learn的 凝聚聚类时,我发现我必须将聚类的数量作为参数"n_clusters"提供 - 没有它我得到两个聚类的硬编码默认值.在这种情况下,如何为数据集选择正确数量的聚类?维基文章错了吗?

artificial-intelligence cluster-analysis machine-learning unsupervised-learning scikit-learn

6
推荐指数
1
解决办法
1534
查看次数

在python中解析大型tcpdump文件

我有一个大型 tcpdump 捕获(.dump 文件中包含 > 1gb 的数据),我想对其进行解析以获取一些统计信息,例如发送流量所涉及的不同 IP 的数量等。我想知道是否有通过 python 访问二进制跟踪文件中此类数据的干净方法?我尝试这样做的方法是运行 tcpdump -r something.dump > myfile.out 然后尝试使用 python 代码解析 myfile.out 以获取我想要的数据。但上面的命令需要很长时间才能完成,并且希望使用更好的方法来完成此操作。

编辑:Wireshark 在尝试打开文件时内存不足。

python tcpdump wireshark

4
推荐指数
1
解决办法
1万
查看次数

将数据加载到Titan数据库中

我有一组平面文件形式的日志数据,我想从中形成一个图形(基于日志中的信息)并将其加载到Titan数据库中.这个数据的大小是几千兆字节.我正在探索批量加载选项Faunus和BatchGraph(我在https://github.com/thinkaurelius/titan/wiki/Bulk-Loading中读到过).选项卡分隔的日志数据我需要对文件的每一行进行一些处理,以形成我想到的图形节点和边缘.Faunus/BatchGraph会服务于这个用例吗?如果是,我的输入文件应采用什么格式才能使这些工具正常工作?如果没有,是否正在使用BluePrints API?由于我是新手,因此非常感谢您可以在建议中分享的任何资源.谢谢!

graph-databases titan faunus

4
推荐指数
1
解决办法
2766
查看次数

了解syslogd

任何人都可以解释以下代码行的作用

/bin/kill -HUP `cat /var/run/syslogd.pid 2> /dev/null` 2> /dev/null || true
Run Code Online (Sandbox Code Playgroud)

它与它有何不同?

test -f /var/run/syslogd.pid && kill -HUP `cat /var/run/syslogd.pid`
Run Code Online (Sandbox Code Playgroud)

[我知道它应该重启syslogd,但两者之间有区别吗?有点Linux的菜鸟,对不起]

linux shell syslog

3
推荐指数
1
解决办法
4768
查看次数

使用请求参数在下拉列表中选择一个选项

我对此有点新意,请耐心等待.我有一个来自db的值,需要在下拉列表中设置当前选择的值.这会作为请求参数传递给前端.我尝试将select ="parameter"属性与select标签一起使用,但似乎没有用.我也尝试过value ="",没有结果.任何帮助表示赞赏.谢谢

html jsp

2
推荐指数
2
解决办法
4万
查看次数

使用带有阻塞和非阻塞套接字的select的影响

如果我使用带有select()调用的非阻塞套接字而不是使用带有select()调用的阻塞套接字,我的程序将如何在行为上有所不同?

c network-programming nonblocking select-function

2
推荐指数
1
解决办法
6163
查看次数