小编And*_*w J的帖子

开发Dilbert漫画图像分类算法的一般方法

作为一个自我发展练习,我想开发一个简单的分类算法,给定Dilbert卡通片的特定单元格,能够识别出动画片中存在哪些角色(Dilbert,PHB,Ratbert等).

我认为最好的方法是(1)将一些算法应用于图像,将其转换为一组特征,以及(2)使用训练集和许多可能的机器学习算法之一来关联存在/没有特定特征存在于细胞中的某些特征.

所以我的问题是 - (a)这是正确的方法,(b)因为有许多分类算法和ML算法要测试,找到合适的算法的好方法是什么,以及(c)你会开始哪种算法因为我们基本上是在对卡通进行分类练习.

python classification machine-learning computer-vision feature-detection

And*_*w J

2011 11-15

31
推荐指数

1
解决办法

7993
查看次数

使用MySQL有效计算哪些点接近给定纬度/经度的最佳方法是什么？

我正在尝试设计一个MySQL模式,可以存储具有相关纬度和经度的用户列表.

然后,对于给定的用户,我想建立一个查询,该查询可以将最近的50个用户返回给他/她并按距离对这些用户进行排序(最近的用户首先显示).

鉴于此表中可能有数千名用户,存储和查询此数据的最有效方法是什么？

mysql geospatial computational-geometry

And*_*w J

lucky-day

8
推荐指数

2
解决办法

282
查看次数

MonogoDB如何为非常大的数据集堆叠,其中只有一些数据是易失性的

我正在开展一个项目,我们定期通过IMAP或POP收集大量电子邮件,对其进行分析(例如聚类到对话,提取重要句子等),然后通过网络呈现视图到最后用户.

主视图将是一个类似Facebook的个人资料页面,用于最近(大约20个)对话的每个联系人,每个对话都来自我们捕获的电子邮件.

对我们而言,能够经常快速地检索个人资料页面和最近20个项目非常重要.我们也可能经常在此Feed中插入最近的电子邮件.为此,文档存储和MongoDB的低成本原子写入看起来非常有吸引力.

然而,我们还会有大量的旧电子邮件会话,这些会话不会经常被访问(因为它们不会出现在最近的20个项目中,人们只会在他们搜索它们时看到它们,这将是相对罕见).此外,随着时间的推移,此数据的大小将比联系人存储的增长更快.

从我读过的内容来看,MongoDB似乎或多或少地要求整个数据集保留在RAM中,解决这个问题的唯一方法就是使用虚拟内存,这会带来很大的开销.特别是如果Mongo无法区分易失性数据(配置文件/提要)和非易失性数据(旧电子邮件),这可能最终会非常讨厌(因为它似乎将虚拟内存分配转移到操作系统,我不知道Mongo怎么可能这样做.

似乎唯一的选择是(a)购买足够的RAM来存储所有内容,这对于易失性数据来说很好,但是对于捕获TB的电子邮件几乎没有成本效益,或者(b)使用虚拟内存并且看到读取/写入我们的易失性数据慢慢爬行.

这是正确的,还是我错过了什么？MongoDB是否适合这个特殊问题？如果是这样,配置会是什么样的？

database storage database-design data-paging mongodb

And*_*w J

2017 09-23

8
推荐指数

1
解决办法

1067
查看次数

分支创建时出错:"警告:refname'master'不明确."

我已经在Git存储库中管理了简单的项目.到目前为止,我没有故意创建任何分支,但是当我今天尝试使用时创建我的第一个分支

$ git branch mybranch

Run Code Online (Sandbox Code Playgroud)

我看到这个错误:

warning: refname 'master' is ambiguous.
fatal: Ambiguous object name: 'master'.

Run Code Online (Sandbox Code Playgroud)

深层发掘:

$ git branch -a          
* master
remotes/master/HEAD -> master/master
remotes/master/master

Run Code Online (Sandbox Code Playgroud)

在Git看到这是正常的吗？我是否错误地克隆了我的存储库？解决此问题的最佳方法是什么？

git git-branch

And*_*w J

2012 09-08

7
推荐指数

2
解决办法

6714
查看次数

标签统计

classification ×1

computational-geometry ×1

computer-vision ×1

data-paging ×1

database ×1

database-design ×1

feature-detection ×1

geospatial ×1

git ×1

git-branch ×1

machine-learning ×1

mongodb ×1

mysql ×1

python ×1

storage ×1

开发Dilbert漫画图像分类算法的一般方法

使用MySQL有效计算哪些点接近给定纬度/经度的最佳方法是什么？

MonogoDB如何为非常大的数据集堆叠,其中只有一些数据是易失性的

分支创建时出错:"警告:refname'master'不明确."

标签 统计

小编And_w J的帖子

标签统计