SPSS和Python,单纯地说哪个好,是没有意义的,还要看你用来干什么?
我来帮你区分一下这些术语。
1、分析工具:Excel、SPSS、Tableau属于分析工具类;
2、分析语言:Python、R属于分析脚本语言。
分析工具类,如果细分还可以分为统计工具和挖掘工具。
- 1)统计工具: 比如像Excel/Tableau/PowerBI都属于统计工具,此类工具的很简单,是基于统计(比如分类汇总)的分析工具,通过统计指标,查看业务的规律、变化、趋势等等,来作出对业务的判断并给出合适的业务策略。所以,此类工具侧重于业务的描述性分析(业务规律、业务变化、业务周期),常用有的分析方法有:对比分析、分布分析、结构分析、趋势分析等等。
- 2)挖掘工具: 像SPSS/SAS类就属于挖掘工具。此类挖掘工具侧重探索隐藏得比较深的业务知识和模式,挖掘工具侧重于业务的影响因素分析、预测性分析等等,讲究分析模型(比常规的分析方法要复杂),在分析模型中不见得有统计指标,而是模式。常用的分析模型:影响因素分析(相关/方差/列联分析)、数据预测模型(回归预测/时序预测)、分类预测模型(决策树、神经网络、支持向量机等),当然还其它更多的模型,比如聚类、关联等等。
理论上,使用高级的数据挖掘工具也是可以进行常规的数据统计分析的,即Excel能够实现的,理论上SPSS也可以实现。但坦白地说,用挖掘工具来做统计工具分析,其效率反而没有统计工具高。
不过,当前绝大多数公司,都是在用Excel/SQL来做数据分析,可见他们并没有什么复杂的业务问题需要用到更高级的分析工具,简单的工具已经足以胜任平时的业务数据分析了。
最后再来说分析语言Python/R。
3)分析语言。
当然你也可以认为分析语言本身也是一种分析工具。只是这种分析工具与Excel/SPSS相比不一样,Excel/SPSS只需要通过拖拉就能够实现数据分析结果,但Python/R则需要通过写脚本写代码的方式来运行分析。
作为工具,Excel/SPSS中已经内置和封装了很多常用的分析方法、分析模型,所以你不需要花太多的时间去弄明白是怎样实现的,甚至你有时不需要知道数据公式和原理(如果知道的话就更好了),你只需要聚焦在业务层面,就可以实现业务数据分析,得到良好的分析结果。
但是,如果你们公司需要一些特殊的分析模型,或者需要对原有的模型进行修改或优化,而分析工具又不支持的话,那么此时你就得要使用分析语言Python来实现自定义的分析流程了。而且,当你使用Python分析语言时,你就得必须了解分析模型的原理及实现,还得懂编程的一系列技能,那么你得花大量的时间在如何实现模型上,无法聚焦在业务问题的解决上了。所以,比起用分析工具,用Python的好处是可以任意修改或定制化模型、可以自动化实现分析流程,但坏处也是显而易见的(分析复杂、周期较长、效果不一定好)。你拥有了定制化,就失去了简洁;你拥有强的功能,就增加了复杂度,此即有得就必有失了。
所以,一般人我是不建议他们学习Python的。因为学习难度高,学习周期长,还不一定有Excel/SPSS好用和效果好。除非你本身就具有编程能力,此时转学Python就相对容易了。
关于就业,最后说一下:
- ----实际情况,当前绝大多数的企业,业务简单到只需要用Excel等分析工具,就能够解决工作中80%的业务问题,部分复杂问题只需要用SPSS也可以基本解决;
- ----当然,如果你说你懂什么Python/Hadoop等,那绝对是装B的加分项。尽管有很多公司领导甚至不知道这两个英文是什么意思。