==>> 点击下载文档 |
机器“学习”的对象是客观存在的规律
机器学习的对象是某种客观存在的规律。这种规律可以非常浅显,比如教
给计算机勾股定理,机器就拥有了计算直角三角形边长的智慧。规律也可
以相当复杂,如指纹识别系统学习的是不同指纹图像之间差异的规律,苹
果语音助手Siri学习的是人类语言的声信号和背后表达意义的规律,无人
驾驶学习的是当前路况和驾驶行为的规律。有的规律甚至连人类自己都无
法完美诠释,如AlphaGo学习的是围棋落子和胜负之间的规律,智能投顾
学习的是资本市场中投资决策和收益之间的规律
机器学习遵循基本的流程
机器学习往往遵循一些基本的流程,主要步骤包括:数据获取、特征提取、
数据转换、模型训练、模型选择和模型预测。数据获取可以通过数据库以
及网络爬虫技术,途径日趋多元化。特征提取基于人的经验和探索,优质
的特征能够起到事半功倍的效果。数据转换包括缺失值填充,标准化和降
维。机器学习模型可分为监督学习,非监督学习和强化学习。模型选择通
常借助交互验证和一系列评价指标
监督学习寻找特征和标签之间的规律,应用极为广泛
监督学习由使用者给出特征和标签,由算法挖掘规律,学习一个模式,并
且根据此模式预测新的特征所对应的标签。监督学习应用更广泛,学习效
果好。我们从最简单的线性回归模型开始,介绍包括线性回归、岭回归、
Lasso回归、逻辑回归、线性判别分析和二次判别分析、支持向量机、决
策树、随机森林、AdaBoost、神经网络、深度学习和K最近邻算法在内的
众多监督学习方法
无监督学习通常用来挖掘数据自身的规律
无监督学习不给出标签,由算法仅仅根据原始特征寻找模式,挖掘数据自
身蕴含的规律。聚类和降维是常用的无监督学习方法。聚类包括K均值聚
类、分层聚类和谱聚类。降维包括以主成分分析为代表的线性降维,以及
以流形学习为代表的非线性降维
风险提示:机器学习的结果是历史经验的总结,存在失效的可能
相关研究
金工研究/深度研究 | 2017年06月01日
谨请参阅尾页重要声明及华泰证券股票和行业评级标准 2
正文目录
本文研究导读 ........ 4
机器学习基本框架 . 5
机器“学习”什么? .. 5
机器学习基本流程 ..... 5
交互验证 ........ 7
模型评价 ........ 9
机器学习方法介绍 ........... 11
广义线性模型 .......... 11
从线性回归开始 ........... 11
岭回归和Lasso回归 ... 12
逻辑回归 .......... 12
多分类问题 ...... 14
线性判别分析和二次判别分析 ......... 15
支持向量机 ........
。。。以上简介无排版格式,详细内容请下载查看