ano*_*428 2 information-retrieval machine-learning web-crawler neural-network genetic-algorithm
嘿,我有一个任务要执行,这基本上是以某种方式检索与特定领域有关的powerpoint演示文稿或pdf文档.假设我想要检索有关生物信息学领域的ppt和pdf讲义.我想知道是否可以通过使用神经网络训练的神经机器人的方法来实现这个任务?我想在进一步实施之前确认这种方法并非完全错误.
如果有人想知道为什么在这种情况下需要神经网络或任何学习算法,这里是我的计划(这可能是错误的或者可能有更简单的方法来实现这一点,所以请随时纠正我):
我生成由神经网络训练的神经机器人(不确定这种训练是如何发生的,我假设通过使用某些ppt和pdf文件的样本训练集的监督学习)然后这些机器人检索与他们通过他们学到的相似的页面他们的训练.
那么上述方法是完成此任务的正确方法吗?
神经网络很复杂.您似乎有一个通用的文档分类问题.最简单的地方是使用某种朴素的贝叶斯模型与单词功能袋.我要采取的下一步是在同一个功能集上使用线性SVM或逻辑回归.如果在尝试更简单的事情之后仍然没有你想要的性能,那么可能继续尝试使用神经网络.
就像你不想说的那样,我想写一个电子邮件服务器,我将从编写一个操作系统开始,在更简单的事情失败之前,我倾向于警惕使用神经网络.
| 归档时间: |
|
| 查看次数: |
644 次 |
| 最近记录: |