我在TSV中有一系列时间数据,如下所示:
ID \t Date \t Value
-------------------------------
1234567 \t 2009-01-01T00:00:00.000Z \t 121
12131 \t 2009-06-01T00:00:00.000Z \t 151
12131 \t 2009-07-01T00:00:00.000Z \t 15153
...
Run Code Online (Sandbox Code Playgroud)
它很容易适应RAM,但对于Excel来说太大了.
每个ID每月有一个值,但并非所有ID都有12个月的条目.
数据跨越12个月,但并非所有ID都有12个月.我想查看每个ID的数据,如果上个月有一个条目,请将当前月减去上个月并将其存储在新列中以获得增量.如果前一个月没有条目,则返回0.然后,对于每个月,我希望这些增量的前100个正面和负面以及ID.
我想在R中这样做,因为它在Excel中很难并且它一直在崩溃.我安装了R,Rattle等,我已经完成了基本的例子,但是......学习曲线很陡峭.我真的很感激一些帮助:)
开放网络分析的热图功能非常酷;如果你让它发挥作用。文档不完整,维基百科也完全不清楚。论坛没有任何进展,真是令人沮丧。谁在 OWA 中实现了热图并可以分享如何实现?
这是基本的示例代码:
<script type="text/javascript">
//<![CDATA[
var owa_baseUrl = 'http://stats.viewcom.nl/';
var owa_cmds = owa_cmds || [];
owa_cmds.push(['setSiteId', 'xxx']);
owa_cmds.push(['trackPageView']);
owa_cmds.push(['trackClicks']);
owa_cmds.push(['trackDomStream']);
(function() {
var _owa = document.createElement('script'); _owa.type = 'text/javascript'; _owa.async = true;
owa_baseUrl = ('https:' == document.location.protocol ? window.owa_baseSecUrl || owa_baseUrl.replace(/http:/, 'https:') : owa_baseUrl );
_owa.src = owa_baseUrl + 'modules/base/js/owa.tracker-combined-min.js';
var _owa_s = document.getElementsByTagName('script')[0]; _owa_s.parentNode.insertBefore(_owa, _owa_s);
}());
//]]>
Run Code Online (Sandbox Code Playgroud)
维基百科指的是:
http://wiki.openwebanalytics.com/index.php?title=Heatmap
Run Code Online (Sandbox Code Playgroud)
以某种方式在某处添加(不清楚):
//create the object
var heatmap = new owa.heatmap();
heatmap.generate();
Run Code Online (Sandbox Code Playgroud) 我有两个文件需要从中获取data analysis. 我正在Python Pandas为此使用。任何有关如何执行此操作的帮助将不胜感激。
我已经知道如何使用 Python 合并 2 个文件 - 我PANDAS特别期待完成这项工作。
合并 2 个文件后,我需要从中获取一些分析数据。这两个文件在CSV格式上确实具有相同的数据结构。
我们有一个 NodeJS Express 应用程序,我们已经为其实现了自定义分析后端。现在,我们正在决定如何为功能手机等禁用 JS 的浏览器实现跟踪机制。
我们正在考虑的一种设计方法是创建一个中间件,它拦截每个请求,从请求/上下文中提取参数并将它们发送到后端。这是非常可扩展的,对于像我们这样的自定义分析解决方案非常有意义。
另一种方法是像谷歌分析一样创建一个跟踪像素,然后从中提取数据。但对于自定义跟踪解决方案来说,这似乎是一个可扩展性较差的解决方案,因为与 GA 不同,参数和数据结构可以随时更改或扩展。
我的问题是 - 制作发出异步请求的中间件是否有任何反面?在创建它时我们需要注意什么,因为对我们服务器的每个请求都将通过这个中间件?我们是一个相当大的应用程序,每分钟有数十万的流量。
我正在使用 google Analytics 的报告 api v4。我想在后端显示一个图表,其中显示一些指标的过去 30 天。问题是,我只得到累积/求和值。
例如,这是我发送到 api 的正文
body = {
reportRequests: [{
dateRanges: [
{
startDate: Date.parse('2016/10/01'),
endDate: Date.parse('2016/10/31')
}
],
viewId: '12345',
metrics: [{ expression: "ga:users" }],
dimensions: [{ name: "ga:pagePath" }]
}]
}
Run Code Online (Sandbox Code Playgroud)
然后我得到很多 URL(当然,我没有过滤输出),如下所示:
{"reports"=>
[{"columnHeader"=>
{"dimensions"=>["ga:pagePath"],
"metricHeader"=>
{"metricHeaderEntries"=>[{"name"=>"ga:users", "type"=>"INTEGER"}]}},
"data"=>
{"rows"=>
[{"dimensions"=>["/"], "metrics"=>[{"values"=>["2854"]}]},
{"dimensions"=>["/?extlink_img=0"], "metrics"=>[{"values"=>["113"]}]},
{"dimensions"=>["/?v=338"], "metrics"=>[{"values"=>["12"]}]},
...
Run Code Online (Sandbox Code Playgroud)
但是,当我想要最近 30 天的用户数以获取特定路线(例如)时,我应该如何查询 api /?这可能吗?
analytics google-analytics google-analytics-api universal-analytics
我有一个包含来自我的站点的用户会话编号的数据集,如下所示:
page_1 = [4,2,4,1,2,6,3,2,1,6,2,7,0,0,0]
page_2 = [6,3,2,3,5,7,9,3,1,6,1,6,2,7,8]
...
Run Code Online (Sandbox Code Playgroud)
等等。
我想知道页面在增长方面是否具有正趋势线或负趋势线,但是我也想获得增长/下降超过某个阈值的页面。
Python 为此类任务提供了大量解决方案和库,但 Ruby 只有一个 gem(趋势线),其中没有代码。在我开始学习如何使用数学来做到这一点之前,也许有人有一个可行的解决方案?
我有一个小网站,我使用Barba.js在页面之间创建平滑的过渡。因此,它不会完全加载新页面,而是使用 AJAX 在后台加载内容并将其添加到现有文档中。
因此,为了触发 Google 分析页面查看事件,我在 GTM 中使用历史更改触发器。而且似乎运行良好。在 GA 中,它正确记录页面浏览量。但在 Google Tag Assistant 中,它会不断增加每次页面加载时 GTM 标签的数量。我已经检查过它没有在页面加载时添加 GTM 标记。它仅向不包含 GTM 标记的文档添加主要内容容器。
Google Analytics 页面查看事件被触发 3 次,这是正确的,但 GTM 也被记录了 3 次。
analytics google-analytics single-page-application google-tag-manager
pandasdf=pd.DataFrame(
{
"A": [1, 2, 3, 4, 5],
"fruits": ["banana", "banana", "apple", "apple", "banana"],
"B": [5, 4, 3, 2, 1],
"cars": ["beetle", "audi", "beetle", "beetle", "beetle"],
"optional": [28, 300, None, 2, -30],
}
)
pandasdf.groupby(["fruits","cars"])['B'].sum().unstack()
Run Code Online (Sandbox Code Playgroud)
如何在极坐标中创建等效的真值表?
类似于下表的真值表
df=pl.DataFrame(
{
"A": [1, 2, 3, 4, 5],
"fruits": ["banana", "banana", "apple", "apple", "banana"],
"B": [5, 4, 3, 2, 1],
"cars": ["beetle", "audi", "beetle", "beetle", "beetle"],
"optional": [28, 300, None, 2, -30],
}
)
df.groupby(["fruits","cars"]).agg(pl.col('B').sum()) #->truthtable
Run Code Online (Sandbox Code Playgroud)
代码的效率很重要,因为数据集太大(与 apriori 算法一起使用)
Polars 中的 unstack 函数是不同的,pd.crosstab …
我的网站上运行 ga4 谷歌分析,实时报告很棒
我想要一份使用“内容组”将网站页面 (+3000) 分组为 20 或 30 个基本主题的新报告
我尝试关注https://support.google.com/analytics/answer/11523339?hl=en 并添加
gtag('set', 'content_group', 'ZZZ');
Run Code Online (Sandbox Code Playgroud)
在我的 GA4 脚本中
gtag('config', 'G-nnnnn' );
Run Code Online (Sandbox Code Playgroud)
ZZZ 根据每个网页而变化。ZZZ 可以取大约 30 个不同的值
48 小时后,虽然在 chrome 控制台中没有看到任何错误,但如果我转到 google Analytics ->“页面和屏幕:页面标题和屏幕类别”报告并按“内容组”过滤第一列,我只会得到一个空行,不是 ZZZ 值
我缺少什么?谢谢
我正在尝试跟踪页面上表单上的提交按钮的点击,但它无法正常工作.我正在使用此代码:
$('#edit-company-questions-submit').submit(function() {
_gaq.push('_trackEvent', 'Forms', 'Submit', 'Sales contact');
});
Run Code Online (Sandbox Code Playgroud)
这是正确的还是我误解了?
analytics ×10
javascript ×2
python ×2
dataframe ×1
express ×1
jquery ×1
middleware ×1
node.js ×1
pandas ×1
r ×1
ruby ×1
snowplow ×1
statistics ×1
tracking ×1
trendline ×1