假设我有一个数据框,其中包含值列和另一列,表示观察到该值的次数:
x <- data.frame(value=c(1,2,3), count=c(4,2,1))
x
# value count
# 1 1 4
# 2 2 2
# 3 3 1
Run Code Online (Sandbox Code Playgroud)
我知道我可以weighted.mean使用weighted.median几个软件包提供的函数来获取数据的加权平均值和加权中值(例如limma),但是如何获得我的数据的其他加权统计数据,例如第一和第三四分位数,也许是标准的偏差?使用"扩展"数据rep不是一种选择,因为sum(x$count)大约30亿(人类基因组的大小).
我正在考虑使用马尔可夫链等创建一个聊天机器人,但我不完全确定如何让它工作.根据我的理解,您可以根据具有给定单词的数据创建表格,然后根据后面的单词创建表格.在训练机器人时是否可以附加任何类型的概率或计数器?这是一个好主意吗?
问题的第二部分是关键字.假设我已经可以从用户输入中识别关键字,如何生成使用该关键字的句子?我并不总是想用关键字开始这个句子,那么如何为马尔可夫链种子?
有没有一种简单的方法来选择div(或任何其他元素)中的所有元素jQuery?
本周我一直在搜索几个小时,我会继续用脑袋敲击键盘.
<div class="Someclass">
<img src="" title="" />
<ul>
<li></li>
<li><a href="" alt="" /></li>
</ul>
</div>
Run Code Online (Sandbox Code Playgroud)
我想要一种简单的方法来选择所有元素,.Someclass而不必调用每个元素.
以下问题与我之前提到过的问题有关:帮助解析简单的JSON(使用JSON for JAVA ME)
JSON密钥需要是唯一的吗?例如,我在解析以下XML时遇到了问题(使用JSON ME):
{"name" : "JACK","name" : "JILL","name" : "JOHN","name" : "JENNY","name" : "JAMES","name" : "JIM"}
Run Code Online (Sandbox Code Playgroud)
而且,显然,它因为键必须是唯一的.我只是想知道在所有情况下是否都是真的.例如,如果我使用的不是JSON ME,我是否可以解析所有这些名称?
谢谢.
我需要提交一个赋值,但我只想包含我实际使用的boost头文件(我使用了boost :: shared_ptr和boost :: function).我尝试手动这样做,但我缺少一些头文件,每次我去添加它们,事实证明我错过了更多.有没有一种快速简便的方法可以找出我真正需要的标题?
谢谢
以下代码编译正常:
template<typename T>
void f(const T &item) { return; }
int main()
{
f("const string literal");
}
Run Code Online (Sandbox Code Playgroud)
汇编在ideone上成功:http://ideone.com/dR6iZ
但是当我提到返回类型时,它不会编译:
template<typename T>
T f(const T &item) { return item; }
int main()
{
f("const string literal");
}
Run Code Online (Sandbox Code Playgroud)
现在它给出了错误:
prog.cpp:6:错误:没有匹配函数来调用'f(const char [21])'
代码:ideone:http://ideone.com/b9aSb
即使我创建了返回类型const T,它也不会编译.
我的问题是:
这是我的代码:
print str(float(1/3))+'%'
Run Code Online (Sandbox Code Playgroud)
它显示:
0.0%
Run Code Online (Sandbox Code Playgroud)
但我想得到 33%
我能做什么.
当我们用C或C++谈论Bit Operation时.位是从bit0还是bit1开始的?哪一个更有意义?据我所知,有点可以采用两个值中的任何一个:1或0.
我有一个GIT存储库,我为我的办公室管理.由于公司政策,我们不能使用GitHub等外部托管服务提供商.所以,我只能通过本地网络尽我所能.
每个人都管理自己的本地存储库,但我们也有一个远程存储库,我们的用户可以推送(并且可以被Hudson和Fisheye等应用程序访问),类似于中央存储库在subversion中的工作方式.每个用户都有公钥设置,因此他们也可以对托管我们的远程存储库的盒子执行无密码身份验证.
对于我们的远程存储库,我将它们配置为以"组"模式共享:
git config core.sharedRepository group
Run Code Online (Sandbox Code Playgroud)
我们所有的用户也都是git组的成员,但这不是许多用户的主要组.当git在"push"上创建或更新任何对象时,它会使用用户的主要组.相反,我需要它使用每个用户都是成员的常见"git"组.我之前在网上看到过关于设置粘滞位的文档,但它似乎因源而异,并没有真正解决创建公共组的问题(如果我只是将文件随意写入,我不妨让他们777).
更新:
使用Matthew Flaschen的答案如下
chgrp -R git repo.git
find repo.git -type d -exec chmod g+rws {} +
Run Code Online (Sandbox Code Playgroud)
我能够创建一个每个人都可以一起推送和拉出的存储库.我也会研究一下gitolite,但我的需求非常基本,我们的环境允许自动配置用户和密钥,所以它的使用并不是关键.但是,我想确保我正在处理这个问题.
我的存储库结构包括一个顶级目录(remote-repos),以及我的每个存储库(app-1.git,app-2.git,library-1.git等)的子目录.我应该能够将chmod g + rws {} +应用到顶级目录(remote-repos)而不是每个单独的repo,对吗?find命令
find /opt/remote-repos -type d -exec ...
Run Code Online (Sandbox Code Playgroud)
查找/ opt/remote-repos位置下的所有目录,并对它们执行命令.命令(chmod g + rws)确保组可以读取和写入这些文件,以及设置粘性下注,以便在执行时始终使用指定的组.(我不知道使用{} +部分,我假设这与find exec选项有关).
无论如何,只是想确认我对这个解决方案的理解是正确的.
更多参考文献:
我想知道如何转换类似于以下内容的文本:
Chapter 3 Convex Functions 97
3.1 Definitions 98
3.2 Basic Properties 103
Run Code Online (Sandbox Code Playgroud)
至:
("Chapter 3 Convex Functions 97" "#97")
("3.1 Definitions 98" "#98")
("3.2 Basic Properties 103" "#103")
Run Code Online (Sandbox Code Playgroud)
通过使用一些方便但功能强大的文本操作语言和/或实用程序,如sed,awk,regex,perl,python,...
感谢致敬!
注意:在每一行中,重复最后一个数字.