嗨,我正在寻找一个库,该库将从文本中删除停用词Javascript,我的最终目标是计算tf-idf,然后将给定的文档转换为向量空间,而所有这些都是Javascript。任何人都可以将我指向一个可以帮助我做到这一点的库。只需一个库来删除停用词也很棒。
既然大多数人都在禁用 3rd 方 cookie 的情况下浏览,那么如何实现跨域网络跟踪服务(例如,用于行为广告)?
更明确地说,第三方跟踪服务如何识别对不同域的两个请求来自同一个人?
我想到了一些选择:
那么,它是如何完成的呢?
编辑:我刚刚注意到禁用 3rd 方 cookie 只会阻止创建新的 cookie,但现有的 cookie 仍然很容易发送到第三方域。因此,人们可以以某种方式将用户重定向到 3rd 方跟踪服务,该服务设置了第一方 cookie,然后可以被网络错误读取。有趣的。
我想查看按 ISO 3316 语言分组的Demographic -> Language网格上的数据,(可选)ISO639 国家/地区代码国家变体之间没有差异。
例如,而不是看到:
| Language | Visits |
|----------|--------|
| it | 56,027 |
| it-it | 35,130 |
| en-us | 5,878 |
| en | 1,211 |
| es | 897 |
| es-es | 576 |
| ... | ... |
Run Code Online (Sandbox Code Playgroud)
我想看到这样的事情:
| Language | Visits |
|----------|--------|
| it | 91,157 |
| en | 7,089 |
| es | 1473 |
|----------|--------|
Run Code Online (Sandbox Code Playgroud)
是否可以?
我希望为我的Tastypie驱动的API添加某种分析.我非常喜欢常规网站的Google Analytics(分析),但很明显它不适用于API.您如何对API进行分析?是否有任何可用于Tastypie的软件包可以添加分析 - 至少一些基础知识:资源URL,时间,代理,请求标头等?
当我使用Tastypie时,同样的问题可以被问及django-piston和django-rest-framework.
是否可以通过JavaScript 中的Ctrl+了解我的用户在我的网页上搜索的内容F?因此,当用户使用Ctrl+F进行搜索时,JavaScript 可以捕获此操作(和搜索短语)并将其发送回服务器。
可能的?如何?
我想做的事
我想跟踪应用程序从精简版到付费版的升级,包括 a) 点击 CTA 进行升级 b) 从点击到实际安装的转化 c) 点击行为的用户群有何不同(如果有的话)通过其他方式发现该应用程序的用户。这当然适用于不具有原生应用内购买功能的应用。
b) 是最重要的。

语境
我一直在审查一些服务,这些服务允许您跟踪点击到应用安装 -
Apsalar - https://apsalar.com/products/apscience/
我已经看到您无法从移动 Safari 中获取 iOS 的 IDFA。
据我考虑它是如何工作的(以 Apsalar 为例)
题
它实际上是如何工作的?或者有哪些选择范围?当然,在我的情况下,如果他们点击升级,我会在应用程序的精简版中获得设备 IDFA。并检查 IDFA 是否稍后出现在付费用户组中。但我认为这需要相当长的时间。
更新 #1
因此,收到来自 Distimo 的电子邮件后,这似乎是使用设备指纹识别。
更新 #2
最好使用 identifierForVendor 调用生成唯一的#,然后将其传递给分析包,以便在应用程序的精简版和付费版本之间跟踪不同的用户?
我有一个大型数据集,专门用于生物学期刊,由不同的人组成很长一段时间.因此,数据不是单一格式.例如,在"AUTHOR"栏中,我可以找到John Smith,Smith John,Smith J等,而它是同一个人.我无法执行最简单的操作.例如,我无法弄清楚作者撰写的文章最多.
在R中是否有任何方法来确定不同名称中的大多数符号是否相同,将它们视为相同的元素?
我正在讨论是否在我的 iOS 应用程序中包含(谷歌)分析。显然我想要分析数据,但我关心的是是简单地告知用户正在收集数据,还是特别请求他们的同意。
是否需要特定的同意,或者可以通过加载页面或网站隐私政策页面简单地通知用户?Apple 有关于同意的规则,但这是否一定会转化为显示带有同意/不同意按钮的对话框?
谢谢!
我们正在实施我们自己的分析,因为我们公开了一个需要调用的 Web 服务,该服务将捕获我们数据库中的数据。
问题是,由于这是分析,我们将进行大量调用(例如每个页面加载、每个 js 之后调用、CSS 加载等),因此会有很多这样的调用。所以我不希望服务器加载大量请求,以便更精确地等待响应。因为我们得到的回应对我们几乎没有任何用处。
那么有什么方法可以只触发 Web 服务请求而忘记我已经触发了它?
我知道每个 HTTP 请求也会有响应。
因此,让我想到的一件事是,如果我们将请求超时设置为零秒会怎样?但我不确定这是否是正确的做法。
请为我提供更多建议
基于此演讲:https://www.youtube.com/watch?v = srfaKA2wJ0s
我想在GraphQL中实现分析/时间序列查询
query {
sales(date: { start: ‘2017-01-01’, end: ‘2018-01-01’ }) {
revenue(stat: mean)
daily: interval(by: day) {
date
revenue
}
}
}
Run Code Online (Sandbox Code Playgroud)
revenue(stat:mean)是基于一个统计信息的聚合(在这种情况下是指)每日是按小时/天/月的数据点列表
如何使用mongodb或postgresql/mysql数据库以高效的方式实现这一点?
analytics ×10
ios ×2
javascript ×2
api ×1
app-store ×1
browser ×1
cookies ×1
data-mining ×1
graphql ×1
httpclient ×1
httprequest ×1
httpresponse ×1
java ×1
openrefine ×1
privacy ×1
r ×1
stemming ×1
tastypie ×1
time-series ×1
tracking ×1