鹦鹉学习附近最常说的单词和短语,以便在不适当的时刻重复它们.那么你将如何创建一个软件版本?假设它可以访问麦克风并且可以随意录制声音,那么如何在不需要无限资源的情况下对其进行编码?
我能想到的最好的方法是使用声音中的静音来划分流,然后使用一些模式识别将每个模式编码为一个标记列表,在您遇到它们时存储新的标记.散列令牌序列并计算数据库中的出现次数,您可以构建最常出现的短语的图片.但鉴于短语种类繁多,你如何防止它成为一个巨大的名单?并且匹配的对数量绝对会从匹配的组合性质中产生许多误报.
你会使用神经网络吗,因为这是一只真正的鹦鹉如何管理它?或者是否有另一种更聪明的方法来匹配模拟数据中的大规模模式?
也许 - 不要尝试单独存储每个剪辑,而是与您想要学习的目标数字进行相似性匹配,比如可能是一打...因此会发出声音 - 您将与您正在跟踪的十几个剪辑中最接近的一个进行匹配- 当您找到与其中一个足够的模式匹配时,您将这个新声音平均到存储的版本中 - 给出一个新版本......
如果传入的声音与存储的任何内容不匹配 - 将其扔掉。
引导程序将是最困难的部分 - 区分目标短语的初始数量......
不管怎样——我的脑海里浮现出这样的想法。哈