ClickStream数据分析

Hem*_*apu 3 analytics hadoop bigdata clickstream

我是Bigdata分析的新手,我遇到了一个名为点击流数据分析的有趣场景.我所知道的是点击流数据.我想更多地了解这个和不同的场景,它可以用于业务的最佳利益,以及我们在每个场景的不同步骤中处理数据所需的工具集.

任何帮助,将不胜感激.谢谢.

Say*_*ane 12

什么是点击流数据?

这是用户在上网时留下的虚拟路径.点击流是用户在互联网上的活动记录,包括用户访问的每个网站和每个网站的每个页面,用户在页面或网站上的时间,页面访问的顺序,任何新闻组用户参与甚至用户发送和接收的邮件的电子邮件地址.ISP和个人网站都能够跟踪用户的点击流.

在此输入图像描述

点击流数据可能包括以下信息:浏览器高度宽度,浏览器名称,浏览器语言,设备类型(台式机,笔记本电脑,平板电脑,移动设备),收入,日期,时间戳,IP地址,URL,购物车中添加的产品数量,数量产品已删除,状态,国家/地区,帐单邮政编码,运输邮政编码等.

我们如何从Clickstream数据中提取更多信息?

在网络分析领域,网站访问者和潜在客户相当于基于主题的数据集中的主题.考虑以下点击流数据示例,基于主题的数据集按行和列结构(如Excel电子表格) - 数据集的每一行都是唯一的主题,每列都是关于该主题的一些信息.如果要进行基于客户的分析,则需要基于客户的数据集.点击流数据采用最精细的形式,如下图所示.来自同一位访客的点击数字一起进行了颜色编码. 在此输入图像描述

数据科学家从点击流数据中获取更多功能.对于每位访客,我们在访问期间有几次点击,并且在很长一段时间内我们有一系列访问.我们需要一种在访客级别组织数据的方法.像这样的东西:

在此输入图像描述 显然,有许多不同的方法可以聚合数据.对于页面浏览量,收入和视频观看等数字数据,我们可能希望使用平均值或总数等值.通过这样做,我们可以获得有关客户行为的更多信 如果您将观察汇总图表,您可以轻松地告诉该公司在周五赚取更多收入.

获得基于客户的数据集后,有许多不同的统计模型和数据科学技术可以让您在访客级别访问更深入,更有意义的分析.Data Science Consulting拥有利用这些方法的专业知识和经验:

  • 预测哪些客户处于流失风险最高的位置,并确定影响该风险的因素(允许您主动保留客户群)

  • 了解个人客户的品牌知名度

  • 通过个性化的相关优惠定位客户

  • 预测哪些客户最有可能转换并在统计上确定您的网站如何影响该决策

  • 确定访问者最有可能响应的网站内容类型,并了解内容参与如何推动高价值访问

  • 定义访问您网站的访问者的不同角色的个人资料和特征,并了解如何与他们互动.

您可能还对以下Coursera课程感兴趣:

https://www.coursera.org/learn/process-mining?recoOrder=6&utm_medium=email&utm_source=recommendations&utm_campaign=recommendationsEmail~recs_email_2016_06_26_17%3A57

它是在进程挖掘中,我认为这是一个特殊情况下的点击跟踪分析.