Pic*_*ico 5 url machine-learning
我正在索引网站的内容,我想仅根据网址实现一些分类.
我想从导航页面告诉appart内容视图页面."内容查看页面"是指网页,通常可以看到产品或书面文章的详细信息."导航页面"是指(通常)由内容页面链接列表或其他更具体的列表页面组成的页面.
尽管一些站点使用站点范围的密钥系统来映射其内容,但是大多数站点都是一点一点地进行映射,因此这应该是可能的.
在实践中,我想要做的是从网站获取网址列表并按相似性对它们进行分组.我相信这可以通过机器学习完成,但我不知道如何.机器学习似乎是一个广泛的主题,我应该特别开始阅读什么?哪个概念,哪个算法,哪个工具?
归档时间: |
|
查看次数: |
1865 次 |
最近记录: |