几种主流数据统计研究软件优缺点体会

上一篇 / 下一篇  2010-07-24 11:45:14

文章来源
  • 文章来源:转载
数据统计分析软件是绝大部分学科研究者必须掌握的工具。下表中列出了学习和研究过程中对于几种主流数据分析和统计软件的优缺点总结体会,其中一些运用较自如,有的还属“没吃过猪肉,只见猪跑路”阶段。
 
软件名
优势
缺点
常见应用领域
定位与前景
Matlab
功能全面;
算法工具箱;
统计图形;
需编程基础;
统计学功能不完善;
工科;
数值计算老大,或能一统江湖
SPSS
易用;
统计学功能全面;
版本功能升级快;
不灵活;
运行效率不高;
社会科学;
统计学入门级软件
SAS
统计学功能强大;
大样本分析;
需编程;
 
社会科学;
统计学;
理科;
进阶的统计学软件
Stata
易用;
类似于SPSS;
 
数学;
自然科学;
 
Excel
极其易用;
统计图形;
运行效率低;
样本量限制;
统计学功能不完善;
商务运用更多
小样本数据初步分析
R
免费;
统计图形;
统计学功能;
 
数学;
统计学;
经济学;
 
Origin
优秀的统计图形;
版本功能升级快;
统计学功能不完善;
 
统计图形绘制老大,或能一统江湖
注:(1)空白不代表没有,只是不知该怎么描述。(2)Origin实际上并不完全算是统计分析软件,其统计功能正在不断增添中,但已经很多研究者直接使用其作为统计分析工具。
 
以上仅是个人肤浅体会,望斧正、补充。
一点建 议是,研究不应为工具所累。纯熟一种,熟悉两种,知道三种即可。灵活运用,相互补充。以研究问题选择工具,而不是工具或方法导向式进行研究。也不建议耗费 过多时间专门学习工具,而应以研究题目为驱动,实践中掌握,熟能生巧。精习一种软件后,自当触类旁通。掌握学习方法后,定会无师自通。


分析化学  仪器分析  红外光谱



TAG:

有问题?有问题找我啊! 引用 删除 hi123   /   2010-07-29 10:06:32
刚发的那12种软件,应该都是跨平台可用了,这个内容是基于FreeBSD操作系统写的,都是可以在FreeBSD上运行的统计软件,当然,这些软件也可以在其它操作系统上运行,不过,客观来说,做数理统计,还是使用FreeBSD,Linux等比较合适。
有问题?有问题找我啊! 引用 删除 hi123   /   2010-07-29 10:03:28
以下是开源统计软件:
原文链接:http://www.freebsdchina.org/forum/viewtopic.php?t=31848&start=0

[1] R(与AT&T的S语言兼容,最伟大的统计软件之一)
[2] maxima(符号计算)
[3] octave(matlab的替代品,octave-forge提供了很多包)
[4] fbm(flexible Bayesian modelling,贝叶斯统计推断工具和贝叶斯神经网络)
[5] jags(Gibbs sampler,随机模拟工具)
[6] surf(代数几何工具软件,画曲线曲面,只要奇点个数不是太多,都不在话下。algebraic geometry是数学里最难的分支,FB的ports里竟然连这个工具都有,真是牛×。)
[7] gap(强有力的有限群计算工具,包括群表示、自动机理论等)
[8] gnuplot(强大的画图工具)
[9] xgraph(古老、简单的数据显示工具,fbm缺省用它)
[10]qhull(计算几何工具,实现凸包、三角剖分等算法,matlab和octave都用它)。
[11]fftw(快速傅立叶变换,octave用到它)、atlas、lapack……都是非常优秀的。
[12] femlab(偏微分方程),xppaut(常微分方程、随机微分方程),pari(数论)我没用过,有人说好,就把它们列在最后吧。

有个神经网络的,叫snns(R也有神经网络packages),也不错,提供了大量和神经网络有关的C函数,有网络的2D和3D显示,dependency很简单,用于科研、教学两相宜。用于模式识别教学的还有libsvm包(support vector machine,支持向量机),网上也可以找到Joachims的svm-light的源码,R里有个叫e1071包里也有libsvm的实现,后续处理很方便。

我不喜欢scilab(源码未公开),对比matlab做得太粗,packages也少。Unix下用命令行的octave比GUI的scilab更容易让人接受,而在Windows下谁还会舍弃matlab而选scilab呢?scilab不敌matlab想必是软件本身的问题(octave在兼容性上,更接近matlab)。话虽这么说,选择octave还是scilab终归还得由个人的意愿和喜好来决定。

自由软件R在奥地利维护,现在已成为最主流的统计工具,为啥?除了根红苗正,开源呗。近几年随着bioinformatics的迅猛发展,Bioconductor项目专为生物信息学提供了诸多的R-packages。对比S-PLUS、SAS等商用软件,开源的R大有坐上统计软件第一把交椅的趋势。

纵观FB的math ports,总体水平是相当地高,选择余地是相当地大,许多工具之间都有良好的接口。对于模式识别、机器学习、数学、数理统计、计算机科学、生物信息学等领域的学者和学生,FB无论从稳定性和高效性上讲都无疑是一个上好的平台,值得推崇和推广(当然,在各种linux下工作也同样鼓励)。
★◆◆功夫熊猫◆◆★ 引用 删除 snwxf   /   2010-07-29 10:00:52
R is a language and environment for statistical computing and graphics. It is a GNU project which is similar to the S language and environment which was developed at Bell Laboratories (formerly AT&T, now Lucent Technologies) by John Chambers and colleagues. R can be considered as a different implementation of S. There are some important differences, but much code written for S runs unaltered under R.

R provides a wide variety of statistical (linear and nonlinear modelling, classical statistical tests, time-series analysis, classification, clustering, ...) and graphical techniques, and is highly extensible. The S language is often the vehicle of choice for research in statistical methodology, and R provides an Open Source route to participation in that activity.

One of R's strengths is the ease with which well-designed publication-quality plots can be produced, including mathematical symbols and formulae where needed. Great care has been taken over the defaults for the minor design choices in graphics, but the user retains full control.

R is available as Free Software under the terms of the Free Software Foundation's GNU General Public License in source code form. It compiles and runs on a wide variety of UNIX platforms and similar systems (including FreeBSD and Linux), Windows and MacOS.
★◆◆功夫熊猫◆◆★ 引用 删除 snwxf   /   2010-07-29 10:00:12
R网站:http://www.r-project.org/
 

评分:0

我来说两句

显示全部

:loveliness: :handshake :victory: :funk: :time: :kiss: :call: :hug: :lol :'( :Q :L ;P :$ :P :o :@ :D :( :)

Open Toolbar