假设我的 cSPADE 输出类似于以下内容,如何防止单节点。因为我更关心获得两个或多个元素之间的模式。无论如何我可以输入最小长度吗?
sequence support
1 <{A}> 1.00
2 <{B}> 1.00
3 <{D}> 0.50
4 <{F}> 1.00
**5 <{A,F}> 0.75
6 <{B,F}> 1.00
7 <{D},{F}> 0.50
8 <{D},{B,F}> 0.50**
Run Code Online (Sandbox Code Playgroud) 我需要开发一个内部实时分析解决方案(例如类似于 GA 或 mixpanel)来收集:
\n\n.. 并通过单像素图像请求将此数据发送到服务器。与 GA 和其他解决方案的工作原理类似:
\n\n\n\n\nGoogle Analytics(分析)的工作原理是在您网站的页面上包含一段 JavaScript 代码。当您网站的用户查看页面时,此 JavaScript 代码会引用JavaScript 文件,然后该文件执行Analytics 的跟踪操作。跟踪操作通过各种方式检索有关页面请求的数据,并通过附加到单像素图像请求的参数列表将此信息发送到分析服务器。
\n
我想知道是否有任何开源项目可以完成这部分工作,我可以将其用作进一步构建的基础。但它Piwik的功能太丰富,而且对于我的要求来说太重了。
编辑添加:我正在对数据做一些特定的事情,否则我只会使用现有的解决方案。
\n我生成了自己虚构的销售数据以执行时间序列分析。
它应该代表一家成长中的公司,因此我与趋势合作。但是,我阅读了一些教程并经常阅读信息,即 auto.arima 函数不应预测非平稳时间序列。
但是我收到了有意义的结果,如果我要区分数据(我也是这样做的),输出就没有多大意义。
所以我的问题来了:我可以对auto.arima我的数据使用这个函数吗,这显然有一个趋势?
最好的问候并提前致谢,弗朗西斯科
eps <- rnorm(100, 30, 20)
trend <- seq(1, 100, 1)
trend <- 3 * trend
Sales <- trend + eps
timeframe<-seq(as.Date("2008/9/1"),by="month",length.out=100)
Data<-data.frame(Sales,timeframe)
plot(Data$timeframe,Data$Sales)
ts=ts(t(Data[,1]))
plot(ts[1,],type='o',col="black")
md=rwf(ts[1,],h=12,drift=T,level=c(80,95))
auto.arima(ts[1,])
Run Code Online (Sandbox Code Playgroud)
使用预测函数,我们可以绘制下一年的预期销售额: plot(forecast(auto.arima(ts[1,]),h=12))
将预测功能与我们的自动化 ARIMA 结合使用可以帮助我们计划下一个季度
forecast(auto.arima(ts[1,]),h=4)
plot(forecast(auto.arima(ts[1,])))
Run Code Online (Sandbox Code Playgroud)
另一种方法是使用自动绘图功能
fc<-forecast(ts[1,])
autoplot(fc)
Run Code Online (Sandbox Code Playgroud)
下一步是分析我们的时间序列。我执行adf test,它具有数据非平稳的零假设。因此,对于 5% 的默认阈值,我们的 p 值必须大于 0.05 才能被证明是非平稳的。
library(tseries)
adf=adf.test(ts[1,])
adf
Run Code Online (Sandbox Code Playgroud)
输出表明数据是非平稳的:
acf
acf=Acf(ts[1,])
Acf(ts[1,])
Run Code Online (Sandbox Code Playgroud)
自相关几乎稳步下降,这也指向非平稳数据。做 akpss.test应该验证我们的数据是非平稳的,因为它的零假设与 adf 测试相反。
我们是否期望值小于 0.05
kpss=kpss.test(ts[1,])
kpss
Run Code Online (Sandbox Code Playgroud)
我们得到 0.01 的 p 值,进一步证明数据有趋势
ndiffs(ts[1,]) …Run Code Online (Sandbox Code Playgroud) 我有以下问题。我用 Keras 创建了一个神经网络。这是我的数据帧的一部分。我的数据框看起来像:
Id MainCl Class Other Options...
1016178069 0 30 1
1016178012 0 25 0
Run Code Online (Sandbox Code Playgroud)
我的结果向量给出了结果可以分类到哪个类的概率。例子:
Prob_isClass_A Prob_isClass_b
0.756686 0.243314
0.999843 0.000157006
0.999818 0.000182159
Run Code Online (Sandbox Code Playgroud)
现在主要问题是:有没有办法获得对结果负责的特征的最高概率?喜欢:
Prob_isClass_A Prob_isClass_b Most_Probability_Reason Probability
0.756686 0.243314 Main_CL_Feature 0.75
0.999843 0.000157006 Class_Feature 0.8
0.999818 0.000182159 Other_Option_Feature 0.7
Run Code Online (Sandbox Code Playgroud) 没有关于与 xamarin 的分析集成的官方文档。只有 Xamarin Google Analytics Sample正式可用。
但是我们发现微软提供的官方 Firebase nuget 包Xamarin.Firebase.Analytics可用于分析。
但是没有合适的文档来使用 xamarin 配置 firebase。我们已经为我们的应用程序创建了从 Firebase 控制台生成的应用程序 ID 和 .json 文件。但是没有参考在 xamarimn android 应用程序中配置这些。
android analytics google-analytics xamarin firebase-analytics
Azure Application Insights有两个不同的功能,称为User Flows和Funnels。
用户流的文档说明:
用户流工具从您指定的初始页面视图、自定义事件或异常开始。鉴于此初始事件,用户流会显示用户会话期间前后发生的事件。不同粗细的线条显示用户遵循每条路径的次数。
对于漏斗:
如果您的应用程序涉及多个阶段,您需要知道大多数客户是在整个过程中取得进展,还是在某个时刻结束了过程。Web 应用程序中一系列步骤的进展称为漏斗。可以使用 Azure Application Insights Funnels 深入了解用户并监控逐步转化率。
题:
这两个功能看起来很相似,尤其是当我看到这些语句时,即使它们是不同的:
如果用户有任何重复事件,比如在网站上执行完全相同的步骤,那么一旦您想做出决定,它们是否可以互换使用?
任何澄清表示赞赏,谢谢!
Internet部署的软件(例如Google Analytics)有很多统计/分析提供商,但我正在寻找一种集成到基于LAN/Intranet的Web应用程序的分析工具.
我知道AWStats,但我更喜欢具有类似于Google Analytics的设计的东西,其中Javascript回调可以嵌入到应用程序中并回调给分析服务器.这不需要任何类型的额外应用程序服务器配置和运行访问权限.
我认为没有什么不是专有/付费的,但我很想被告知我错了!
本周我每天都试图通过我的piwik实例进行每日访问.
目前,此查询返回整周的所有访问量的总和.有没有办法把它分成几天?
http://piwikexample.com/?module=API&method=VisitsSummary.getVisits&idSite=1&period=range&date=2011-08-18,2011-08-25&format=json&token_auth=#########
Run Code Online (Sandbox Code Playgroud) 我有一个基于网络的仪表板,可以向医院的护士等显示关键的时间敏感信息.面临的挑战是,如果仪表板未打开或最小化,它们将无法看到消息并能够响应.我目前跟踪应用程序运行的时间百分比(它每10秒通过AJAX轮询一次新消息,这样我就可以很容易地看到它每小时执行的请求数量等等),但这并不能告诉我应用程序是否已最小化.
一种方法是使用onfocus/ onblur,但效果有限,因为部署它的大多数计算机都是双监视器机器,并且它们通常会在另一个屏幕上使用临床信息系统时在一个屏幕上保持仪表板打开.使用焦点/模糊方法,此状态将被视为"未聚焦",但我希望将其视为"打开"我的统计数据.
检测窗口可见性的任何想法?我想可能包括一个微小的Flash"像素"并检测是否可见 - 任何其他想法?
1个作业是否可能被2个不同的sidekiq线程处理两次?我正在使用sidekiq将一些分析事件异步插入到mongodb集合中.我看到该系列中有大约15个重复.我的猜测是,2个工作线程同时选择了相同的工作,并添加到集合中.
sidekiq是否确保仅通过1个线程挑选作业.我们可以忽略重启情况,因为作业很小并且将在不到8秒内完成.
使用sidekiq异步发射分析事件不是一个好习惯吗?我有什么选择?我可以为事件添加一个唯一的密钥,并在插入之前检查它以避免插入重复项,但这会添加我永远不会使用的数据(+开销/查询)(并且它会增加数百万个事件).我可以通过sidekiq以某种方式确保作业只处理一次吗?
谢谢你的帮助.
analytics ×10
javascript ×2
r ×2
android ×1
api ×1
asynchronous ×1
azure ×1
intranet ×1
keras ×1
matomo ×1
open-source ×1
python ×1
redis ×1
sequential ×1
sidekiq ×1
time-series ×1
xamarin ×1