标签: analytics

给定许多唯一ID的时间序列,我需要每个时期的前100个增量

我在TSV中有一系列时间数据,如下所示:

ID \t Date \t Value
-------------------------------
1234567 \t 2009-01-01T00:00:00.000Z \t 121
12131 \t 2009-06-01T00:00:00.000Z \t 151
12131 \t 2009-07-01T00:00:00.000Z \t 15153
...
Run Code Online (Sandbox Code Playgroud)

它很容易适应RAM,但对于Excel来说太大了.

每个ID每月有一个值,但并非所有ID都有12个月的条目.

数据跨越12个月,但并非所有ID都有12个月.我想查看每个ID的数据,如果上个月有一个条目,请将当前月减去上个月并将其存储在新列中以获得增量.如果前一个月没有条目,则返回0.然后,对于每个月,我希望这些增量的前100个正面和负面以及ID.

我想在R中这样做,因为它在Excel中很难并且它一直在崩溃.我安装了R,Rattle等,我已经完成了基本的例子,但是......学习曲线很陡峭.我真的很感激一些帮助:)

analytics r

1
推荐指数
1
解决办法
235
查看次数

开放网络分析;有人正确实施热图吗?

开放网络分析的热图功能非常酷;如果你让它发挥作用。文档不完整,维基百科也完全不清楚。论坛没有任何进展,真是令人沮丧。谁在 OWA 中实现了热图并可以分享如何实现?

这是基本的示例代码:

<script type="text/javascript">
//<![CDATA[
var owa_baseUrl = 'http://stats.viewcom.nl/';
var owa_cmds = owa_cmds || [];
owa_cmds.push(['setSiteId', 'xxx']);
owa_cmds.push(['trackPageView']);
owa_cmds.push(['trackClicks']);
owa_cmds.push(['trackDomStream']);

(function() {
    var _owa = document.createElement('script'); _owa.type = 'text/javascript'; _owa.async = true;
    owa_baseUrl = ('https:' == document.location.protocol ? window.owa_baseSecUrl || owa_baseUrl.replace(/http:/, 'https:') : owa_baseUrl );
    _owa.src = owa_baseUrl + 'modules/base/js/owa.tracker-combined-min.js';
    var _owa_s = document.getElementsByTagName('script')[0]; _owa_s.parentNode.insertBefore(_owa, _owa_s);
}());
//]]>
Run Code Online (Sandbox Code Playgroud)

维基百科指的是:

http://wiki.openwebanalytics.com/index.php?title=Heatmap
Run Code Online (Sandbox Code Playgroud)

以某种方式在某处添加(不清楚):

//create the object
var heatmap = new owa.heatmap();
heatmap.generate();
Run Code Online (Sandbox Code Playgroud)

javascript analytics

1
推荐指数
1
解决办法
1377
查看次数

在 Python PANDAS 中合并两个文件?

我有两个文件需要从中获取data analysis. 我正在Python Pandas为此使用。任何有关如何执行此操作的帮助将不胜感激。

我已经知道如何使用 Python 合并 2 个文件 - 我PANDAS特别期待完成这项工作。

合并 2 个文件后,我需要从中获取一些分析数据。这两个文件在CSV格式上确实具有相同的数据结构。

python analytics pandas

1
推荐指数
1
解决办法
4765
查看次数

进行异步调用的 Express 中间件

我们有一个 NodeJS Express 应用程序,我们已经为其实现了自定义分析后端。现在,我们正在决定如何为功能手机等禁用 JS 的浏览器实现跟踪机制。

我们正在考虑的一种设计方法是创建一个中间件,它拦截每个请求,从请求/上下文中提取参数并将它们发送到后端。这是非常可扩展的,对于像我们这样的自定义分析解决方案非常有意义。

另一种方法是像谷歌分析一样创建一个跟踪像素,然后从中提取数据。但对于自定义跟踪解决方案来说,这似乎是一个可扩展性较差的解决方案,因为与 GA 不同,参数和数据结构可以随时更改或扩展。

我的问题是 - 制作发出异步请求的中间件是否有任何反面?在创建它时我们需要注意什么,因为对我们服务器的每个请求都将通过这个中间件?我们是一个相当大的应用程序,每分钟有数十万的流量。

analytics middleware node.js express snowplow

1
推荐指数
1
解决办法
2795
查看次数

Google Analytics V4 API:获取过去 30 天的数据

我正在使用 google Analytics 的报告 api v4。我想在后端显示一个图表,其中显示一些指标的过去 30 天。问题是,我只得到累积/求和值。

例如,这是我发送到 api 的正文

  body = {
    reportRequests: [{
      dateRanges: [
        {
          startDate: Date.parse('2016/10/01'),
          endDate: Date.parse('2016/10/31')
        }
      ],
      viewId: '12345',
      metrics: [{ expression: "ga:users" }],
      dimensions: [{ name: "ga:pagePath" }]
    }]
  }
Run Code Online (Sandbox Code Playgroud)

然后我得到很多 URL(当然,我没有过滤输出),如下所示:

{"reports"=>
  [{"columnHeader"=>
     {"dimensions"=>["ga:pagePath"],
      "metricHeader"=>
       {"metricHeaderEntries"=>[{"name"=>"ga:users", "type"=>"INTEGER"}]}},
    "data"=>
     {"rows"=>
       [{"dimensions"=>["/"], "metrics"=>[{"values"=>["2854"]}]},
        {"dimensions"=>["/?extlink_img=0"], "metrics"=>[{"values"=>["113"]}]},
        {"dimensions"=>["/?v=338"], "metrics"=>[{"values"=>["12"]}]},
        ...
Run Code Online (Sandbox Code Playgroud)

但是,当我想要最近 30 天的用户数以获取特定路线(例如)时,我应该如何查询 api /?这可能吗?

analytics google-analytics google-analytics-api universal-analytics

1
推荐指数
1
解决办法
2612
查看次数

使用 Ruby 查找数据趋势线?

我有一个包含来自我的站点的用户会话编号的数据集,如下所示:

page_1 = [4,2,4,1,2,6,3,2,1,6,2,7,0,0,0]
page_2 = [6,3,2,3,5,7,9,3,1,6,1,6,2,7,8]
...
Run Code Online (Sandbox Code Playgroud)

等等。

我想知道页面在增长方面是否具有正趋势线或负趋势线,但是我也想获得增长/下降超过某个阈值的页面。

Python 为此类任务提供了大量解决方案和库,但 Ruby 只有一个 gem(趋势线),其中没有代码。在我开始学习如何使用数学来做到这一点之前,也许有人有一个可行的解决方案?

ruby statistics analytics trendline

1
推荐指数
1
解决办法
473
查看次数

标签助手显示重复的 GTM 标签

我有一个小网站,我使用Barba.js在页面之间创建平滑的过渡。因此,它不会完全加载新页面,而是使用 AJAX 在后台加载内容并将其添加到现有文档中。

因此,为了触发 Google 分析页面查看事件,我在 GTM 中使用历史更改触发器。而且似乎运行良好。在 GA 中,它正确记录页面浏览量。但在 Google Tag Assistant 中,它会不断增加每次页面加载时 GTM 标签的数量。我已经检查过它没有在页面加载时添加 GTM 标记。它仅向不包含 GTM 标记的文档添加主要内容容器。

这是第三页加载后的 TAG Assistant 屏幕截图: 在此输入图像描述

Google Analytics 页面查看事件被触发 3 次,这是正确的,但 GTM 也被记录了 3 次。

analytics google-analytics single-page-application google-tag-manager

1
推荐指数
1
解决办法
4725
查看次数

Polars 相当于 pandas 表达式 df.groupby['col1','col2']['col3'].sum().unstack()

pandasdf=pd.DataFrame(
    {
        "A": [1, 2, 3, 4, 5],
        "fruits": ["banana", "banana", "apple", "apple", "banana"],
        "B": [5, 4, 3, 2, 1],
        "cars": ["beetle", "audi", "beetle", "beetle", "beetle"],
        "optional": [28, 300, None, 2, -30],
    }
)
pandasdf.groupby(["fruits","cars"])['B'].sum().unstack()
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

如何在极坐标中创建等效的真值表?

类似于下表的真值表

df=pl.DataFrame(
    {
        "A": [1, 2, 3, 4, 5],
        "fruits": ["banana", "banana", "apple", "apple", "banana"],
        "B": [5, 4, 3, 2, 1],
        "cars": ["beetle", "audi", "beetle", "beetle", "beetle"],
        "optional": [28, 300, None, 2, -30],
    }
)
df.groupby(["fruits","cars"]).agg(pl.col('B').sum()) #->truthtable
Run Code Online (Sandbox Code Playgroud)

代码的效率很重要,因为数据集太大(与 apriori 算法一起使用)

Polars 中的 unstack 函数是不同的,pd.crosstab …

python analytics data-analysis dataframe python-polars

1
推荐指数
1
解决办法
962
查看次数

Google Analytics(分析)GA4 内容组

我的网站上运行 ga4 谷歌分析,实时报告很棒

我想要一份使用“内容组”将网站页面 (+3000) 分组为 20 或 30 个基本主题的新报告

我尝试关注https://support.google.com/analytics/answer/11523339?hl=en 并添加

gtag('set', 'content_group', 'ZZZ'); 
Run Code Online (Sandbox Code Playgroud)

在我的 GA4 脚本中

gtag('config', 'G-nnnnn' );  
Run Code Online (Sandbox Code Playgroud)

ZZZ 根据每个网页而变化。ZZZ 可以取大约 30 个不同的值

48 小时后,虽然在 chrome 控制台中没有看到任何错误,但如果我转到 google Analytics ->“页面和屏幕:页面标题和屏幕类别”报告并按“内容组”过滤第一列,我只会得到一个空行,不是 ZZZ 值

我缺少什么?谢谢

javascript analytics google-analytics google-analytics-4

1
推荐指数
1
解决办法
755
查看次数

Google事件跟踪代码,对吗?

我正在尝试跟踪页面上表单上的提交按钮的点击,但它无法正常工作.我正在使用此代码:

    $('#edit-company-questions-submit').submit(function() {
      _gaq.push('_trackEvent', 'Forms', 'Submit', 'Sales contact');
    });
Run Code Online (Sandbox Code Playgroud)

这是正确的还是我误解了?

jquery analytics tracking google-analytics event-tracking

0
推荐指数
1
解决办法
184
查看次数