![]() |
◆简评:本次的AlphaGo Zero相比之前版本的AlphaGo除了将策略网络
与价值网络一起训练共享参数,同时简化了蒙特卡洛树搜索之外,一个非
常重要的变化是不再让机器先经过“打谱”进行有监督学习,而是完全从
零开始通过自我对弈的强化学习就达到了更好的效果,而这个效果仅仅用
了490万的自我对弈,相比围棋高达10170的状态空间复杂度而言无疑是
沧海一粟。一个可能的解释是首先CNN(卷积神经网络)的模型适用范围非
常适合围棋的规则,能得到非常完美的表达;其次之前借助人类棋谱的有
监督学习或许一定程度上“误导”了机器的思路,导向了局部最优解而不
是全局最优解;另外强化学习在规则清晰的随机系统序列决策问题中有望
获得超过人类经验的效果,拓宽认知的边界
强化学习是机器学习的一种,通过与“环境”交互逐步进行学习。在交互
过程中,机器的“行动”与所面对的“环境”互相影响,而且每一个行为
带来的后果会有一个延迟。因此强化学习是针对过程的决策,追求的是全
局最优解。比如一局机器最终取胜的围棋比赛中,到底是其中的一次妙手,
还是之前的伏笔抑或之后看似不经意的某一步带领机器获胜几乎是无法判
断的。在这种情形下,人类是无法给某一步贴上对或错的标签。只能在每
次对弈后根据胜负结果给予机器代理不同程度的奖励,而机器代理所要做
的则是努力让自己每盘棋积累的奖励最大化
强化学习有望在在自动驾驶汽车、飞行器控制、机器人等领域取得很好的
应用效果。以自动驾驶汽车为例,自动驾驶过程可以分为感知、决策和控
制三大部分,目前机器视觉等已经能较好的解决感知过程的问题,而感知
过程完成之后如何根据感知的结果作出合理的决策无疑至关重要。而强化
学习通过与“环境”的交互学习进而进行决策,能够根据变化的“环境”
采取每步获取最大价值的策略,有望取得很好的应用效果
◆创业之星:中科虹霸,领跑虹膜识别行业
中科虹霸成立于2006年12月,由中国科学院自动化研究所发起设立,从
事生物特征识别领域的技术研究、产品开发与成果转化,致力于为客户提
供基于虹膜识别的身份认证平台。目前,公司的虹膜识别产品已广泛应用
于金融、军事、公安安全、移动终端、矿山等众多领域,取得了良好的应
用效果。公司是国际上少数拥有虹膜识别核心技术专利的企业之一,掌握
具有完全自主知识产权虹膜识别技术。随着三星推出虹膜识别功能后,其
他智能手机巨头有望相继入局,消费电子虹膜市场未来五年CAGR约为
35.18%,公司将充分受益
◆风险提示:
计算能力提升不及预期的风险;模型算法改进缓慢的风险;平台发展
缓慢的风险
买入(维持)
分析师
姜国平 (执业证书编号:S0930514080007)
021-22169167
jianggp@ebscn
卫书根 (执业证书编号:S0930517090002)
021-22167336
weishugen@ebscn
行业与上证指数对比图
-40%
-25%
-10%
5%
20%
08-1611-1602-1705-17
计算机行业沪深300
智能大时代,数据驱动未来
·· 2016-10-09
谷歌发布第二代TPU芯片
·· 2017-05-28
苹果发布智能音箱Home Pod
·· 2017-06-12
四大行联姻互联网巨头共建科技金融
·· 2017-06-25
阿里发布智能音箱产品“天猫精灵”
·· 2017-07-10
联想发布智能音箱SmartCast+
·· 2017-07-23
小米发布首款AI智能音箱“小爱”
·· 2017-08-06
寒武纪A轮融资1亿美元,成全球AI芯片
首个独角兽
·· 2017-08-21
医疗影像领域人工智能大有可为
·· 2017-08-27
蚂蚁金服与肯德基共同落地“刷脸支付”
·· 2017-09-02
百度云发布XPU、ABC一体机
·· 2017-09-18
谷歌发布系列硬件新品
·· 2017-10-08
2017-10-22 计算机行业
敬请参阅最后一页特别声明 -2- 证券研究报告
目 录
1、 强化学习,拓宽认知的边界 ...... 3
2、 创业之星:中科虹霸,领跑虹膜识别行业 ......... 3
2.1、 虹膜识别应用领域广泛,具有极大的潜在空间 ... 4
2.2、 发力消费者智能终端市场6
3、 A股:近两周人工智能指数下跌1.82%7
4、 融资并购: 地平线机器人A+轮融资近亿美元,英特尔领投 .... 9
4.1、 基础层:数据软件公司MongoDB拟通过IPO融资1.92亿美元 ........... 9
4.2、 技术层:中科视拓获数千万pre-A轮融资 ........ 10
4.3、 应用层:地平线机器人A+轮融资近亿美元,英特尔领投 ......... 10
5、 行业动态:英特尔成功开发新型超导量子计算芯片 ..... 13
5.1、 基础层:联合Facebook,英特尔发布深度学习系列处理器Intel Nervana NNP ......... 13
5.2、 技术层:计算机视觉顶级会议ICCV 2017,腾讯优图入选12篇论文,含3篇Oral ... 15
5.3、 应用层:百度计划2018年量产无人驾驶巴士 .. 16
5.4、 其他:十九大报告称将推动互联网、大数据、人工智能和实体经济深度融合.. 17
6、 风险提示 ......... 18
中信产业投资基金管理有限公司
2017-10-22 计算机行业
敬请参阅最后一页特别声明 -3- 证券研究报告
1、强化学习,拓宽认知的边界
事件:10月19日,nature杂志上线了DeepMind团队的最新研究成果:
新一代的AlphaGo Zero完全从零开始,不需要任何历史棋谱的指引,通过
自我对弈490万棋局后,以100:0的成绩击败了上一版的AlphaGo
相比之前版本的AlphaGo,本次的AlphaGo Zero除了将策略网络与价
值网络一起训练共享参数,同时简化了蒙特卡洛树搜索之外,一个非常重要
的变化是不再让机器先经过“打谱”进行有监督学习,而是完全从零开始通
过自我对弈的强化学习就达到了更好的效果,而这个效果仅仅用了490万的
自我对局,相比围棋高达10170的状态空间复杂度而言无疑是沧海一粟。一
个可能的解释是首先CNN(卷积神经网络)的模型适用范围非常适合围棋的
规则,能得到非常完美的表达;其次之前借助人类棋谱的有监督学习或许一
定程度上“误导”了机器的思路,导向了局部最优解而不是全局最优解;另
外强化学习在规则清晰的随机系统序列决策的问题中往往能够获得超过人
类经验的效果,拓宽认知的边界
强化学习是机器学习的一种,与有监督学习和无监督学习相比,强化学
习更需要通过与“环境”的交互逐步进行学习。在与“环境”交互的过程中,
机器的“行动”与所面对的“环境”互相影响,而且每一个行动的后果并不
会立马显现出来,会有一个延迟。因此强化学习是针对过程的决策,追求的
是全局最优解。比如一局机器最终取胜的围棋比赛中,到底是其中的一次妙
手,还是之前的伏笔抑或之后看似不经意的某一步带领机器获胜几乎是无法
判断的。在这种情形下,人类是无法给某一步贴上对或错的标签。只能在每
次对弈后根据胜负结果给予机器代理不同程度的奖励,而机器代理所要做的
则是努力让自己每盘棋积累的奖励最大化
强化学习在自动驾驶汽车、飞行器控制、机器人等领域有望得到了很好
的应用。以自动驾驶汽车为例,自动驾驶过程可以分为感知、决策和控制三
大部分,目前机器视觉等已经能较好的解决感知过程的问题,而感知过程完
成之后如何根据外界环境的变化和情况作出合理的决策无疑至关重要。而强
化学习通过与“环境”的交互学习进而进行决策,能够根据变化的“环境”
采取每步获取最大价值的策略,有望带来很好的应用效果
2、创业之星:中科虹霸,领跑虹膜识别行业
北京中科虹霸科技有限公司成立于2006年12月,由中国科学院自动化
研究所发起设立,从事生物特征识别领域的技术研究、产品开发与成果转化,
致力于为客户提供基于虹膜识别的身份认证平台。目前,公司的虹膜识别产
品已广泛应用于金融、军事、公安安全、移动终端、矿山等众多领域,取得
了良好的应用效果,得到了广大用户的高度认可。公司是国际上少数拥有虹
膜识别核心技术专利的企业之一,掌握完全自主知识产权虹膜识别技术,其
核心技术来源于在虹膜识别领域深耕十数年的中科院模式识别国家重点实
验室
2017-10-22 计算机行业
敬请参阅最后一页特别声明 -4- 证券研究报告
产品:公司产品包括公共安全、移动终端、金融、门禁四大解决方案,
便捷式、嵌入式、隔爆型等多种型号的虹膜识别仪、虹膜识别模组、以及手
机、平板等
商业模式:主要面向To B市场销售虹膜识别仪和识别模组,公司此前
推出的移动终端,如智能手机和平板,也主要面向政府和公共行业。未来公
司将逐渐将产品推广至消费者市场,今年4月份公司与国美合作推出的智能
终端K1,就是其在国内的第一次尝试
融资情况:公司完成新一轮战略融资后,将以虹膜识别技术为核心,依
托海量数据积累,加速创新产品研发,建设生物特征云服务认证平台
表1:融资情况
时间 融资情况
2017.7 获得由蚂蚁金服提供的战略投资
2014.8 获得由中关村发展集团投资的3000万人民币C轮融资
2009.7 获得由联想集团投资的2500万人民币A轮融资
2008.1 获得由联想之星投资的300万人民币天使轮融资
资料来源:光大证券研究所整理
2.1、虹膜识别应用领域广泛,具有极大的潜在空间
虹膜识别在安全性和准确性上均优于目前常见的其他生物识别方式。人
的眼睛结构由巩膜、虹膜、瞳孔三部分构成,虹膜是位于黑色瞳孔和白色巩
膜之间的圆环状部分,是眼球中瞳孔周围的深色部分,其包含有很多相互交
错的斑点、细丝、冠