标签: analytics

给定许多唯一ID的时间序列,我需要每个时期的前100个增量

我在TSV中有一系列时间数据,如下所示:

ID \t Date \t Value
-------------------------------
1234567 \t 2009-01-01T00:00:00.000Z \t 121
12131 \t 2009-06-01T00:00:00.000Z \t 151
12131 \t 2009-07-01T00:00:00.000Z \t 15153
...

Run Code Online (Sandbox Code Playgroud)

它很容易适应RAM,但对于Excel来说太大了.

每个ID每月有一个值,但并非所有ID都有12个月的条目.

数据跨越12个月,但并非所有ID都有12个月.我想查看每个ID的数据,如果上个月有一个条目,请将当前月减去上个月并将其存储在新列中以获得增量.如果前一个月没有条目,则返回0.然后,对于每个月,我希望这些增量的前100个正面和负面以及ID.

我想在R中这样做,因为它在Excel中很难并且它一直在崩溃.我安装了R,Rattle等,我已经完成了基本的例子,但是......学习曲线很陡峭.我真的很感激一些帮助:)

analytics r

rju*_*ney

2015 12-02

1
推荐指数

1
解决办法

235
查看次数

开放网络分析；有人正确实施热图吗？

开放网络分析的热图功能非常酷；如果你让它发挥作用。文档不完整，维基百科也完全不清楚。论坛没有任何进展，真是令人沮丧。谁在 OWA 中实现了热图并可以分享如何实现？

这是基本的示例代码：

<script type="text/javascript">
//<![CDATA[
var owa_baseUrl = 'http://stats.viewcom.nl/';
var owa_cmds = owa_cmds || [];
owa_cmds.push(['setSiteId', 'xxx']);
owa_cmds.push(['trackPageView']);
owa_cmds.push(['trackClicks']);
owa_cmds.push(['trackDomStream']);

(function() {
    var _owa = document.createElement('script'); _owa.type = 'text/javascript'; _owa.async = true;
    owa_baseUrl = ('https:' == document.location.protocol ? window.owa_baseSecUrl || owa_baseUrl.replace(/http:/, 'https:') : owa_baseUrl );
    _owa.src = owa_baseUrl + 'modules/base/js/owa.tracker-combined-min.js';
    var _owa_s = document.getElementsByTagName('script')[0]; _owa_s.parentNode.insertBefore(_owa, _owa_s);
}());
//]]>

Run Code Online (Sandbox Code Playgroud)

维基百科指的是：

http://wiki.openwebanalytics.com/index.php?title=Heatmap

Run Code Online (Sandbox Code Playgroud)

以某种方式在某处添加（不清楚）：

//create the object
var heatmap = new owa.heatmap();
heatmap.generate();

Run Code Online (Sandbox Code Playgroud)

javascript analytics

Rub*_*tic

lucky-day

1
推荐指数

1
解决办法

1377
查看次数

在 Python PANDAS 中合并两个文件？

我有两个文件需要从中获取data analysis. 我正在Python Pandas为此使用。任何有关如何执行此操作的帮助将不胜感激。

我已经知道如何使用 Python 合并 2 个文件 - 我PANDAS特别期待完成这项工作。

合并 2 个文件后，我需要从中获取一些分析数据。这两个文件在CSV格式上确实具有相同的数据结构。

python analytics pandas

Pra*_*nar

lucky-day

1
推荐指数

1
解决办法

4765
查看次数

进行异步调用的 Express 中间件

我们有一个 NodeJS Express 应用程序，我们已经为其实现了自定义分析后端。现在，我们正在决定如何为功能手机等禁用 JS 的浏览器实现跟踪机制。

我们正在考虑的一种设计方法是创建一个中间件，它拦截每个请求，从请求/上下文中提取参数并将它们发送到后端。这是非常可扩展的，对于像我们这样的自定义分析解决方案非常有意义。

另一种方法是像谷歌分析一样创建一个跟踪像素，然后从中提取数据。但对于自定义跟踪解决方案来说，这似乎是一个可扩展性较差的解决方案，因为与 GA 不同，参数和数据结构可以随时更改或扩展。

我的问题是 - 制作发出异步请求的中间件是否有任何反面？在创建它时我们需要注意什么，因为对我们服务器的每个请求都将通过这个中间件？我们是一个相当大的应用程序，每分钟有数十万的流量。

analytics middleware node.js express snowplow

nik*_*ohn

lucky-day

1
推荐指数

1
解决办法

2795
查看次数

Google Analytics V4 API：获取过去 30 天的数据

我正在使用 google Analytics 的报告 api v4。我想在后端显示一个图表，其中显示一些指标的过去 30 天。问题是，我只得到累积/求和值。

例如，这是我发送到 api 的正文

  body = {
    reportRequests: [{
      dateRanges: [
        {
          startDate: Date.parse('2016/10/01'),
          endDate: Date.parse('2016/10/31')
        }
      ],
      viewId: '12345',
      metrics: [{ expression: "ga:users" }],
      dimensions: [{ name: "ga:pagePath" }]
    }]
  }

Run Code Online (Sandbox Code Playgroud)

然后我得到很多 URL（当然，我没有过滤输出），如下所示：

{"reports"=>
  [{"columnHeader"=>
     {"dimensions"=>["ga:pagePath"],
      "metricHeader"=>
       {"metricHeaderEntries"=>[{"name"=>"ga:users", "type"=>"INTEGER"}]}},
    "data"=>
     {"rows"=>
       [{"dimensions"=>["/"], "metrics"=>[{"values"=>["2854"]}]},
        {"dimensions"=>["/?extlink_img=0"], "metrics"=>[{"values"=>["113"]}]},
        {"dimensions"=>["/?v=338"], "metrics"=>[{"values"=>["12"]}]},
        ...

Run Code Online (Sandbox Code Playgroud)

但是，当我想要最近 30 天的用户数以获取特定路线（例如）时，我应该如何查询 api /？这可能吗？

analytics google-analytics google-analytics-api universal-analytics

23t*_*tux

2016 11-13

1
推荐指数

1
解决办法

2612
查看次数

使用 Ruby 查找数据趋势线？

我有一个包含来自我的站点的用户会话编号的数据集，如下所示：

page_1 = [4,2,4,1,2,6,3,2,1,6,2,7,0,0,0]
page_2 = [6,3,2,3,5,7,9,3,1,6,1,6,2,7,8]
...

Run Code Online (Sandbox Code Playgroud)

等等。

我想知道页面在增长方面是否具有正趋势线或负趋势线，但是我也想获得增长/下降超过某个阈值的页面。

Python 为此类任务提供了大量解决方案和库，但 Ruby 只有一个 gem（趋势线），其中没有代码。在我开始学习如何使用数学来做到这一点之前，也许有人有一个可行的解决方案？

ruby statistics analytics trendline

The*_* Oz

lucky-day

1
推荐指数

1
解决办法

473
查看次数

标签助手显示重复的 GTM 标签

我有一个小网站，我使用Barba.js在页面之间创建平滑的过渡。因此，它不会完全加载新页面，而是使用 AJAX 在后台加载内容并将其添加到现有文档中。

因此，为了触发 Google 分析页面查看事件，我在 GTM 中使用历史更改触发器。而且似乎运行良好。在 GA 中，它正确记录页面浏览量。但在 Google Tag Assistant 中，它会不断增加每次页面加载时 GTM 标签的数量。我已经检查过它没有在页面加载时添加 GTM 标记。它仅向不包含 GTM 标记的文档添加主要内容容器。

这是第三页加载后的 TAG Assistant 屏幕截图：

Google Analytics 页面查看事件被触发 3 次，这是正确的，但 GTM 也被记录了 3 次。

analytics google-analytics single-page-application google-tag-manager

Soh*_*ail

2021 09-22

1
推荐指数

1
解决办法

4725
查看次数

Polars 相当于 pandas 表达式 df.groupby['col1','col2']['col3'].sum().unstack()

pandasdf=pd.DataFrame(
    {
        "A": [1, 2, 3, 4, 5],
        "fruits": ["banana", "banana", "apple", "apple", "banana"],
        "B": [5, 4, 3, 2, 1],
        "cars": ["beetle", "audi", "beetle", "beetle", "beetle"],
        "optional": [28, 300, None, 2, -30],
    }
)
pandasdf.groupby(["fruits","cars"])['B'].sum().unstack()

Run Code Online (Sandbox Code Playgroud)

如何在极坐标中创建等效的真值表？

类似于下表的真值表

df=pl.DataFrame(
    {
        "A": [1, 2, 3, 4, 5],
        "fruits": ["banana", "banana", "apple", "apple", "banana"],
        "B": [5, 4, 3, 2, 1],
        "cars": ["beetle", "audi", "beetle", "beetle", "beetle"],
        "optional": [28, 300, None, 2, -30],
    }
)
df.groupby(["fruits","cars"]).agg(pl.col('B').sum()) #->truthtable

Run Code Online (Sandbox Code Playgroud)

代码的效率很重要，因为数据集太大（与 apriori 算法一起使用）

Polars 中的 unstack 函数是不同的，pd.crosstab …

python analytics data-analysis dataframe python-polars

gkb*_*aby

lucky-day

1
推荐指数

1
解决办法

962
查看次数

Google Analytics（分析）GA4 内容组

我的网站上运行 ga4 谷歌分析，实时报告很棒

我想要一份使用“内容组”将网站页面 (+3000) 分组为 20 或 30 个基本主题的新报告

我尝试关注https://support.google.com/analytics/answer/11523339?hl=en 并添加

gtag('set', 'content_group', 'ZZZ');

Run Code Online (Sandbox Code Playgroud)

在我的 GA4 脚本中

gtag('config', 'G-nnnnn' );

Run Code Online (Sandbox Code Playgroud)

ZZZ 根据每个网页而变化。ZZZ 可以取大约 30 个不同的值

48 小时后，虽然在 chrome 控制台中没有看到任何错误，但如果我转到 google Analytics ->“页面和屏幕：页面标题和屏幕类别”报告并按“内容组”过滤第一列，我只会得到一个空行，不是 ZZZ 值

我缺少什么？谢谢

javascript analytics google-analytics google-analytics-4

作者

2023 05-11

1
推荐指数

1
解决办法

755
查看次数

Google事件跟踪代码,对吗？

我正在尝试跟踪页面上表单上的提交按钮的点击,但它无法正常工作.我正在使用此代码:

    $('#edit-company-questions-submit').submit(function() {
      _gaq.push('_trackEvent', 'Forms', 'Submit', 'Sales contact');
    });

Run Code Online (Sandbox Code Playgroud)

这是正确的还是我误解了？

jquery analytics tracking google-analytics event-tracking

Joh*_*ahl

lucky-day

0
推荐指数

1
解决办法

184
查看次数

标签统计

analytics ×10

google-analytics ×4

javascript ×2

python ×2

data-analysis ×1

dataframe ×1

event-tracking ×1

express ×1

google-analytics-4 ×1

google-analytics-api ×1

google-tag-manager ×1

jquery ×1

middleware ×1

node.js ×1

pandas ×1

python-polars ×1

r ×1

ruby ×1

single-page-application ×1

snowplow ×1

statistics ×1

tracking ×1

trendline ×1

universal-analytics ×1

标签 统计

标签统计