如何检测客户端使用的浏览器类型.我有一个问题,我必须要求人们使用不同的浏览器(Firefox)而不是IE.我怎样才能获得这些信息.
我知道http请求有这个信息(Header).我如何从Django框架中的view.py获取navigator.appName?
我必须使用python计算文本中的单词频率.我想把字词保存在字典中并对每个单词进行计数.
现在,如果我必须根据出现次数对单词进行排序.我可以使用相同的字典而不是使用新的字典,其中键作为计数和单词数组作为值吗?
我正在尝试实现一种天真的bayseian方法来查找给定文档或单词流的主题.是否有朴素贝叶斯方法,我可以找到这个?
此外,我正在尝试改进我的字典,因为我继续.最初,我有一堆映射到主题的单词(硬编码).取决于已映射的单词以外的单词的出现次数.根据这些单词的出现,我想将它们添加到映射中,从而改进和学习映射到主题的新单词.并且还改变了单词的概率.
我该怎么做呢?我的方法是正确的吗?
哪种编程语言最适合实现?
有人能给我一个C++中Decorator设计模式的例子吗?我遇到过它的Java版本,但发现很难理解它的C++版本(从我发现的例子中).
谢谢.
当您在Google"100F to C"中搜索时,如何将华氏温度转换为摄氏温度?同样,从不同货币转换和简单计算.
使用的数据结构是什么,还是匹配字符串的简单模式?
给出一个单词词典和一个初始字符.通过在单词中连续添加一个字符,找到字典中最长的单词.在任何给定的实例中,该单词应该是字典中的有效单词.
例如: - > - > - >猫 - >购物车 - >图表....
我有一个矩阵,每列代表一个特征随着时间的推移.我需要找到给定窗口大小的这些值的移动平均值.
有没有像一个功能一个在MATLAB?
output = tsmovavg(vector, 's', lag, dim)
Run Code Online (Sandbox Code Playgroud) 我们有一个集群(hadoop,pig),它可以生成数据350Gb(每周增长几GB).
所有这些数据都需要提供给Google Analytics.
我们有一个带有星型模式的Msyql解决方案(只有部分数据加载到此).但
关注的是人们可以伸展多远?
我应该像Hive那样关注NoSQL进行数据分析吗?
我读了这篇文章http://anders.com/cms/282/Distributed.Data/Hadoop/Hbase/Hive
大数据有多大,何时我应该远离MySQL?Mysql的结构刚性会导致问题吗?
目前数据只有几GB(在MySQL中),但它肯定会增长.MySQL集群怎么样?
我应该走这条路吗?
什么是使用单词本身作为任何机器学习算法中的功能的最佳方法?
我必须从特定段落中提取单词相关功能的问题.我应该使用字典中的索引作为数字特征吗?如果是这样,我将如何规范这些?
一般来说,单词本身如何在NLP中用作特征?
是否有任何良好的基于Web的开源前端分析工具可以与HIVE/HDFS进行数据交流?
algorithm ×2
hive ×2
nlp ×2
string ×2
c++ ×1
data-mining ×1
decorator ×1
django ×1
django-forms ×1
financial ×1
hadoop ×1
http-headers ×1
matlab ×1
mysql ×1
naivebayes ×1
nosql ×1
octave ×1
python ×1
sorting ×1
suffix-tree ×1
time-series ×1
user-agent ×1