Tra*_*ton 14 algorithm artificial-intelligence machine-learning
我的日常工作是基于在线浏览器的游戏,一个很小,工作人员很少的游戏.事实上,我们的大多数员工都是志愿者.
我今天专注于一个方面.我想创建一个人工智能系统来分析我们的用户数据库并报告可能由同一个用户运行的帐户 - 这显然违反了我们的条款和条件.这个"重复"是我们员工的主要时间流失,如果我可以通过给他们一个简短的名单列表来加快速度,我会这样做.
问题是,我不熟悉人工智能.我非常了解基础知识,但目前尚未成功实施解决方案.我一直在阅读启发式搜索,特别是A*搜索,我"认为"它可能适合我正在寻找的东西,但我不能确定.
所以我的问题是:使用A*搜索,是否可以准确分析两个用户帐户数据,如用户名,密码,电子邮件,帐户之间的互动,他人之间的互动,登录时间,活动时间等.如果不是,你知道一个系统可以分析这个数据量,并给出两个账户可能由同一个人运行的"概率"吗?
dou*_*oug 23
至少在很大程度上,这是我的日常工作.从您的问题来看,您似乎正在考虑机器学习的学科(而不是更广泛的规则,AI).我认为你的直觉是正确的 - ML算法非常适合欺诈预测/检测,因为它可以在高度非线性域上进行推广并且可以适应(当新数据被馈送到它时).所以,因为这两个主要特征,这是更为困难的骗子辨别算法的'规则’预测-因为这些规则实际上是一个复杂的网状集的软约束和随时间变化的算法学习反对新数据.(我可能会建议放弃A*,除非你有一个特别的理由相信寻路是你的问题的一个有用的启发式 - 我不愿意说没有联系,但如果有,它肯定是一个非正统的 - 我从未见过寻路应用于这类问题).
您提到的关于您有兴趣识别的在线欺诈类型的唯一事实是单个用户的多个帐户.毫无疑问,这里可以应用各种技术,但我会特别提到一种分析技术,因为:(i)我在你提到的场景中实际使用过它; 和(ⅱ)是其他的答案的范围之外,那么远.
该技术基于图论.
前提:由同一用户拥有的帐户通常最好不是通过他们的个人行为(点击流)来识别,而是通过他们彼此之间的关系来确定 - 换句话说就是他们的网络行为.
一个例子:在线扑克中的筹码倾销.在这里,个人在扑克网站上打开多个新账户(使用虚假信息),然后声明每个账户的广告奖金(例如,100美元的存款与100美元的奖金相匹配).当然,奖金具有高度限制性的"兑现规则,通常是在奖金变为现金之前玩的门槛数量,并且可以作为现金从玩家的账户中提取.
因此,芯片倾销的目标是将这些奖金转入真实现金.一个人打开五个独立的帐户(作为五个不同的人)然后再打开一个"合法"帐户(使用他们的真实身份).这六名球员-再实际上只是一个单一的播放器-将起到一个互相表和五个假帐户将很快失去他们的筹码,以合法的帐户,并迅速兑现了他们的,因为套现的限制,当然奖金奖金仅适用于他们最初获得的账户; 因此,完全规避了现金限制.
这类计划的难点在于,非法行为几乎不可能在个人账户的基础上发现 - *不良行为,勾结,是由一组共同拥有的账户*的相互作用引起的 - 换句话说,需要在网络层面研究兴趣行为.
因此,图论是一种自然的分析框架.
我应用的技术是基于Chau等人的学术论文.在Carnegie Mellon,题为" 检测在线拍卖网络中的欺诈性人格"(PDF).
在本文的心脏欺诈的情形是这样的:在eBay上卖家希望出售一个非常昂贵的物品(他们可能甚至不拥有,但在任何情况下,根本没有任何发货给买家意向)到愿意买家.为了促使买方无辜随便搞交易,欺诈性卖家首先获取非常高(虚高)的声誉在一些项目的买家群体的"成功"销售的参与; 这些买家通常是买方控制的虚假账户.
更具体地说,本文的作者使用信号传播算法在马尔可夫随机场上将数据跨越两个级别(帐户级别和网络级别)进行组合.
签名图形结构的方式,被称为一个二分芯,从一组具有该组的成员之间的非常高的交易数量,但很少超过该基团(即账户而产生的,其余的eBay社区).
| 归档时间: |
|
| 查看次数: |
2221 次 |
| 最近记录: |