是否在"音频分析"领域进行了先前的开源工作以检测人声(即尽管有一些背景噪声),确定说话者的性别,可能确定不.发言者,发言者的年龄和发言者的情绪?
我的预感是像CMU Sphinx这样的语音识别软件可能是一个很好的起点,但如果有更好的东西,它会很棒.
获得了异步事件流,其中每个事件都包含以下信息:
我需要做的是 -
根据服务实体,日期+时间和类数据关联事件,并创建合并的新事件.例:
事件#0021:{Agency ='XYZ',Agent ='ABC',Served-Entity ='MMN',Date + Time = '12 -03-2011/11:03:37',Class-Date ='miss-交付,不重复,无法解决,孤儿'}
事件#0193:{Agency ='KLM',Agent ='DAY',Served-Entity ='MMN',Date + Time = '12 -03-2011/12:32:21',Class-Date ='miss-送货,孤儿,丢失'}
事件#1217:{Agency ='KLM',Agent ='CARE',Served-Entity ='MMN',Date + Time = '12 -03-2011/18:50:45',Class-Date ='escalated' }
在这里,我发现3个事件间隔时间(超过7小时分离),这些事件是针对相同的服务实体(MMN),在特定时间窗口(例如24小时)内发生,具有匹配或相关的类数据.
最后创建一个统一(新)事件,它可以代表一个推理.
能够基于特定类别数据标签(例如,错过交付)等特定时间段内的每个服务实体来创建每个代理商,每个代理商的报告.这可以使用原始/输入事件或合成(推理)事件来完成.
虽然这不是今天的要求,但很可能在将来出现,但是类数据中出现的"标签"可能会增长,而无需任何人为干预.所以不确定是否应该将其视为非结构化数据.
也不是一个直接的要求,但将来可能需要确定事件发生的趋势/模式(即Event1导致Event2导致Event3).
事件到达率可能非常高......可能每分钟有数千个事件.也许更多.并且,我需要将原始/合成事件存档一段时间(一个月左右).
我的解决方案需要基于FOSS组件(最好).到目前为止进行的一些研究指出了CEP(复杂事件处理),贝叶斯网络/分类,预测分析的方向.
寻找有关采取措施的一些建议.我更倾向于采用符合我目标的路径,最小的难度/时间,或换句话说,"学习AI"或"正式的统计方法"不是我的短期目标:-)
目标硬件是一个相当低功耗的MCU(ARM Cortex-M3 @ 72MHz,只有大约64KB SRAM和256KB闪存),所以在这里走细线.我的主板确实有以太网,我最终会在其上运行lwIP(轻量级TCP/IP FOSS套件)(目前正在努力).但是,我还需要某种超轻量级替代SSL/TLS.我知道这些MCU有多种GPL的SSL/TLS实现,但它们的占用空间仍然相当大.虽然他们确实适合其他一切,但不要给别人留下太多空间.
我的流量不是HTTP,所以我不必担心HTTPS,我的客户端/服务器通信可以是完全专有的,所以非标准的解决方案是可以的.寻找关于什么可能是简约而健壮的建议(以及弱安全性毫无价值),替代方案可以帮助我 -
我将无法在ARMv7汇编级别优化库,因此完全依赖于我的编程技能和GNU-ARM编译器的优化.如上所述,任何可能是最佳选择的指针?
需要编码和解码字节流(可能包含非ascii字符),从/到uint16,uint32,uint64(它们的典型C/C++含义),处理字节序.什么是在Lua中做这样事情的有效且有希望的跨平台方式?
我的目标arch是64位x86_64,但是想保持它的可移植性(如果它在性能方面没有花费我的成本).
例如
解码(比如当前在Lua字符串中) - 0x00,0x1d,0xff,0x23,0x44,0x32(小端)as - uint16:(0x1d00)= 7424 uint32:(0x324423ff)= 843326463
如果有人可以用一个例子解释,那将会很棒.
analysis ×1
bytearray ×1
correlation ×1
decoding ×1
emotion ×1
encoding ×1
encryption ×1
endianness ×1
erlang ×1
lua ×1
python ×1
security ×1
speech ×1
ssl ×1