假设我想计算项目中的代码行数.如果所有文件都在同一个目录中,我可以执行:
cat * | wc -l
Run Code Online (Sandbox Code Playgroud)
但是,如果有子目录,则不起作用.为此,cat必须具有递归模式.我怀疑这可能是xargs的一项工作,但我想知道是否有更优雅的解决方案?
我想用R来制作一系列按中值排序的箱形图.假设我执行:
boxplot(cost ~ type)
Run Code Online (Sandbox Code Playgroud)
这将给我一些箱形图,成本显示在y轴上,类型类别在x轴上可见:
----- -----
| |
[ ] |
| [ ]
| |
----- -----
A B
Run Code Online (Sandbox Code Playgroud)
但是,我想要的是从最高到最低中值排序的箱线图.我怀疑的是,我需要做的是更改类型(A或B)的标签,以数字方式指示哪个是最低和最高中值,但我想知道是否有更聪明的方法来解决问题.
假设我有一个文本文件,其中的数据由空格分隔成列.我想编写一个shell脚本,它将文件名和数字N作为输入,只打印出该列.使用awk我可以执行以下操作:
awk < /tmp/in '{print $2}' > /tmp/out
Run Code Online (Sandbox Code Playgroud)
此代码打印出第二列.
但是如何在shell脚本中包装它以便在argv中传递任意列?
在操纵矩阵时,通常可以方便地改变它们的形状.例如,将N x M大小的矩阵转换为长度为NX M的向量.在MATLAB中,存在一个重塑函数:
RESHAPE(X,M,N)返回M-by-N矩阵,其元素从X列中逐列获取.如果X不具有M*N个元素,则会产生错误.
在矩阵和向量之间进行转换的情况下,我可以使用Mathematica函数Flatten,它利用Mathematica的嵌套列表表示矩阵.作为一个简单的例子,假设我有一个矩阵X:

使用Flatten [X]我可以得到向量{1,2,3,...,16}.但更有用的是类似于应用Matlab的重塑(X,2,8),这将产生以下矩阵:

只要维度等于N*M,这将允许创建任意矩阵.据我所知,没有内置任何东西让我想知道是否有人没有编写自己的重塑功能.
我的目标是分析一些语料库(现在的推特)的情感内容.就在今天,我意识到搜索词干会有一点意义,而不是有一个详尽的情感词干列表.所以我一直在探索nltk.stem,只是意识到有4种不同的词干分析器.我想问一下stackoverflow语言学家,LancasterStemmer,PorterStemmer,RegexpStemmer,RSLPStemmer或WordNetStemmer是否最好有一些理由.
作为一个小项目,我一直在考虑创建一个类似Google Earth的动画.我希望在将地球旋转到各个城市的中心时播放时间轴.目前,我可以使用默认视图设置来渲染具有由点指示的城市的地球.

当我尝试使用俯视城市的视图向量(例如丹佛)来定位摄像机时,我最终得到以下信息:

需要针对地球上空的某些点计算ViewVector.然而,我的试验并没有达到任何形式的连贯观点,而大多数人看起来都像是在"全球"内部.
我需要帮助的是一个功能,给定城市的纬度和经度选择ViewVector将城市放置在摄像机视图的"中心".产生"全球内部"视图的代码如下:
SC[{lat_, lon_}] := {Cos[lon \[Degree]] Cos[lat \[Degree]],
Sin[lon \[Degree]] Cos[lat \[Degree]], Sin[lat \[Degree]]};
Graphics3D[{
Opacity[0.75],
Sphere[{0, 0, 0}, 0.99 ],
Map[Line[
Map[SC,
CountryData[#, "SchematicCoordinates"], {-2}]] &,
CountryData["Countries"]], {Yellow, PointSize[Medium],
Point[SC[CityData["Denver", "Coordinates"]]]
}
},
Boxed -> False,
SphericalRegion -> True,
ViewVector -> {{0, 0, 0}, SC[CityData["Denver", "Coordinates"]]}
]
Run Code Online (Sandbox Code Playgroud) 假设您正在实现发布数据库并创建迁移以表示不同的发布.每个出版物都有一个与之相关的"年份".
t.column :year, ???
今年最好表示为整数,日期或日期时间吗?
在一个问题中,我有一组向量.每个矢量都有传感器读数,但长度不同.我想计算每个这些向量的相同描述性统计数据.我的问题是,我应该如何将它们存储在R中.使用c()连接向量.使用list()似乎导致mean()行为不端.数据框是否是正确的对象?
如果不同的大小,将相同的函数应用于向量的最佳实践是什么?假设数据驻留在SQL服务器中,应该如何导入?
我有一个长期项目正在完成SICP的所有练习.我注意到最近的练习有些奇怪.我正在测试一个霍夫曼编码树.当我在DrScheme中执行以下代码时,我得到了预期的结果:
(a d a b b c a)
Run Code Online (Sandbox Code Playgroud)
但是,如果我通过调用(加载"2.67.scm")或运行mzscheme -f 2.67.scm在mzscheme中执行相同的代码,它会报告:
symbols: expected symbols as arguments, given: (leaf D 1)
Run Code Online (Sandbox Code Playgroud)
我的问题是:为什么?是因为mzscheme和drscheme使用不同的规则来加载程序定义吗?程序代码如下.
;; Define an encoding tree and a sample message
;; Use the decode procedure to decode the message, and give the result.
(define (make-leaf symbol weight)
(list 'leaf symbol weight))
(define (leaf? object)
(eq? (car object) 'leaf))
(define (symbol-leaf x) (cadr x))
(define (weight-leaf x) (caddr x))
(define (make-code-tree left right)
(list left
right
(append (symbols left) (symbols right)) …Run Code Online (Sandbox Code Playgroud) 我想定期将文件放在我的网络服务器的/ tmp目录中进行分享.令人讨厌的是每当我scp文件时我都必须设置权限.根据另一个问题的建议,我编写了一个复制文件的脚本,设置权限然后打印URL:
#!/bin/bash
scp "$1" SERVER:"/var/www/tmp/$1"
ssh SERVER chmod 644 "/var/www/tmp/$1"
echo "URL is: http://SERVER/tmp/$1"
Run Code Online (Sandbox Code Playgroud)
当我用我的实际主机替换SERVER时,一切都按预期工作......直到我用包含空格的参数执行脚本.虽然我怀疑解决方案可能是使用$ @我还没弄明白如何让间隔文件名工作.