Tal*_*ili 14 statistics r
统计分析/编程,正在编写代码.无论是描述性的还是推论性的,您都可以编写代码:导入数据,清理数据,分析数据和编译报告.
分析数据可能涉及许多曲折的统计程序,以及您查看数据的角度.最后,您有许多文件,包含许多代码行,可以对您的数据执行任务.其中一些是可重复使用的,你将它封装为"有好处"的功能.
这个"统计分析"过程对我来说就像"编程"一样,但我不确定每个人的感受是否一致.
术语软件开发通常用于指计算机编程的活动,计算机编程是编写和维护源代码的过程,而术语的更广泛意义包括所需软件的概念到软件的最终表现形式.因此,软件开发可能包括研究,新开发,修改,重用,重新设计,维护或导致软件产品的任何其他活动.对于通常由一组人开发的较大的软件系统,通常遵循某种形式的过程来指导软件的生产阶段.
根据这个简单的定义(以及我的拙见),这听起来非常像建立统计分析.但我想这不是那么简单.
这引出了我的问题:你能在两个活动之间勾勒出什么样的差异?
它可以是技术方面,不同的策略或工作方式,以及您认为相关的其他内容.
这个问题来自以下主题:
Sha*_*ane 12
正如我在回答你的另一个问题时所说,你所描述的是编程.所以简短的回答是:没有区别.稍微长一点的答案是统计和科学计算应该比其他编程需要更多的控制开发.
可以使用Excel或使用SPSS,SAS,Matlab或S-Plus(例如)的点击式方法进行一定比例的统计分析.使用涉及编程的那些程序(或R)之一进行的更复杂的分析显然是软件开发的一种形式.这种统计计算可以从遵循软件开发的所有最佳实践中受益匪浅:源代码控制,文档,项目计划,范围文档,错误跟踪/变更控制等.
此外,与任何编程项目一样,有不同类型的统计分析可以遵循不同的方法:
我建议任何统计学家都会从阅读"完整代码"这本书中受益(请看这篇文章中的其他顶级书籍):你的分析越有条理,成功的可能性就越大.
在某种意义上,统计分析需要围绕版本控制和文档的更多良好实践,而不是其他编程.如果您的程序只是满足某些业务需求,那么只要程序按规范要求的方式运行,所使用的算法或软件就非常重要.另一方面,通过科学和统计计算,准确性和可重复性是至关重要的.这是John Chambers(S语言的创建者)在"数据分析软件"中的主要重点之一.这是添加文字编程(例如使用Sweave)作为统计学家工具箱中的重要工具的另一个原因.
如果您使用 R,那么您可能会编写代码来解决统计问题,因此从这个意义上说,统计分析是编程的一个子集。
另一方面,有很多 SPSS 用户从未尝试过通过点击来解决统计问题。对我来说,这感觉不像编程。