Bootstrap

Python 机器学习库

转载自 http://blog.chinaunix.net/uid-22414998-id-4143709.html

一、前提

     在Pthon下做机器学习, 需要科学计算包和绘图库的支持,科学计算则是NumPy或SciPy,似乎NumPy更流行些。画图工具包则必定为matplotlib。这些 都是开源、免费使用的,选择这些库主要的原因是做线性代数中的矩阵计算极为便利,而且效率比自己开发高的多

二、机器学习库
(1)scikit-learn
    [http://scikit-learn.org/]

     Python下做机器学习, 首推 scikit-learn。该项目文档齐全、讲解清晰 ,功能齐备,使用方便,而且社区活跃。

(2)Orange
    [ http://orange.biolab.si/ ]
    机器学习是其的功能之一,主要还是侧重数据挖掘,可以用可视化语言或Python进行操作,拥有机器学习组件,还具有生物信息学以及文本挖掘的插件。

(3)shogun
    [ http://shogun-toolbox.org/ ]
    shogun,非日本的老外弄的一个机器学习库,还专门配了 一个我们能看懂的日文名“将军”(是日本幕府时代的将军)。文档齐全,开发活跃,更新快,运算速度也很快。主攻大尺度的核函数,尤其是大尺度核函数下的SVM。具有很多SVM的高级用法,比如多核配用等。支持Python、R、C++、Matlab等语言。

(4)其它
      A.pyml(a python module for machine learning,支持svm/knn/k-means==)
         http://mlpy.sourceforge.net/
     B.milk(python的机器学习工具包,主要是针对监督学习,包括svm/knn/决策树)
         http://pypi.python.org/pypi/milk/
;