首页 > 资料专栏 > IT > IT技术 > 人工智能 > 【国盛证券】ChatGPT技术篇:智能背后的秘密PDF

【国盛证券】ChatGPT技术篇:智能背后的秘密PDF

诸葛一凡
V 实名认证
内容提供者
热门搜索
ChatGPT 证券 国盛证券
资料大小:3147KB(压缩后)
文档格式:PDF
资料语言:中文版/英文版/日文版
解压密码:m448
更新时间:2023/6/8(发布于上海)
阅读:4
类型:积分资料
积分:15分 (VIP无积分限制)
推荐:升级会员

   点此下载 ==>> 点击下载文档


“【国盛证券】ChatGPT技术篇:智能背后的秘密PDF”第1页图片 图片预览结束,如需查阅完整内容,请下载文档!
文本描述
证券研究报告|行业周报
2023 年 02 月 26 日
计算机
ChatGPT 技术篇:智能背后的秘密
ChatGPT 表现惊艳,网站流量一路狂飙式成长。根据数据统计机构 增持(维持)
Similarweb 的估计,chat.openai 网站(即ChatGPT 官网)在
2023/1/27-2023/2/3 这一周吸引的每日访客数量高达约 2500 万,在
1 月 31 日的流量高峰日,该网站吸引了 2800 万次访问。并且在 1/3- 行业走势
2/3 这一个月里,该网站的流量平均每天增长3.4%,增速惊人。
从 Transformer 到 ChatGPT,有哪些历史性突破?ChatGPT用户数 计算机 沪深300
高速增长的根本原因,来源于其突破性的表现,其中最突出的有两点16%
体现:1)ChatGPT与人类“对齐”了偏好,其应答更适应人类习惯, 0%
并且能驳回一些反道德的提问,展现出显著优于前代的智能度。2)
-16%
ChatGPT 具备了思维链(Chain-of-Thought,CoT)能力,能够处理一
定程度的复杂思维逻辑。3)ChatGPT在算数、国际音标转写、单词解-32%
读、问答、事实性问答、基础概念映射、多任务自然语义理解、上下 -48%
文单词理解等8 个指标上表现出全面综合的能力。 2022-02 2022-06 2022-10 2023-02
量变到质变,规模超过特定阈值后模型性能陡增。根据谷歌发布的论
文《Emergent Abilities of Large Language Models》,可以看到多个
NLP 任务随着模型规模扩大的性能变化曲线:前期性能和模型规模大 作者
致呈线性关系;然而当模型规模大到一定程度时,任务性能有了明显
分析师 刘高畅
的“飞升”。
执业证书编号:S0680518090001
海量代码训练,模型习得代码背后隐含的逻辑能力。根据熵简科技介 邮箱:liugaochang@gszq
绍,“代码”可以理解为一种具备高度逻辑性的文本语料,不具备强
相关研究
逻辑性的代码会无法执行,而不像普通文本语料那样有着较高的逻辑
自由度。模型从对大量代码的学习过程中,逐渐掌握了隐藏在代码背 1、《计算机:首批 Azure OpenAI 服务落地万科,大模
后的抽象能力与逻辑能力,进而涌现出我们在 ChatGPT 上感受到的 型商业化进程持续加速》2023-02-21
“智能”。
2、《计算机:ChatGPT 算力需求是如何扩张的》2023-
训练过程加入了人类反馈,模型偏好向人类看齐。通过有人类反馈的 02-19
加强学习(RLHF)训练,人类手动对 AI 给出的回复进行排名,让AI
3、《计算机:Chatgpt 需要多少算力》2023-02-12
模型理解人类偏好。由于训练过程中加入了人类反馈,有别于前代
GPT-3 单纯使用海量数据的训练方法,ChatGPT 能够更好地理解用户
指令,并作出反应。
投资建议。建议关注:1)应用型公司:金山办公、光云科技、当虹科
技、同花顺、万兴科技、立方数科、云赛智联、神思电子、宇信科技、
360、高伟达、寺库、知乎、汉王科技等;2)算力公司:浪潮信息、
中科曙光、海光信息、寒武纪、景嘉微、世纪华通、光通信产业链公
司;3)相关技术公司:科大讯飞、云从科技、拓尔思、海天瑞声、海
康威视、萤石网络、百度、阿里、腾讯;4)软件开发效率提升:赛意
信息、润和软件、法本信息、游戏公司等;5)机器人:三花智控、鸣
志电器、绿的谐波、晶品特装、微创机器人等。
风险提示:AI技术迭代不及预期风险;经济下行超预期风险;行业竞争
加剧风险。
请仔细阅读本报告末页声明扫码进群领取
1、优质研报免费获取,行业报告定期打包
2、每日推送行业最新深度研报(精选10篇)
3、最新行业报告、公司研究、专业大咖分享2023 年 02 月 26 日
内容目录
1.从 Transformer 到 ChatGPT,有哪些历史性突破? ............. 3
2.ChatGPT 背后的秘密:智能来自何方? ............... 5
2.1 量变到质变,规模超过特定阈值后模型性能陡增 ............ 5
2.2 海量代码训练,模型习得代码背后隐含的逻辑能力 ................ 6
2.3 训练过程加入了人类反馈,模型偏好向人类看齐 ............ 7
3、投资建议 ..................... 8
4、风险提示 ..................... 9
图表目录
图表 1:ChatGPT 每日点击访问量统计 .................. 3
图表 2:ChatGPT 会主动驳回一些具有潜在道德风险的危险提问.......... 4
图表 3:ChatGPT 已经具备了思维链能力 ............... 5
图表 4:模型规模超过特定阈值后模型性能陡增 ................... 6
图表 5:ChatGPT 模型家族谱系 ..................... 7
图表 6:ChatGPT 使用 RLHF 方法进行训练 ................... 8
P.2请仔细阅读本报告末页声明
2023 年 02 月 26 日
1.从 Transformer到 ChatGPT,有哪些历史性突破?
ChatGPT 流量以每日3.4%的速度快速成长,每日用户数已超 2500 万。根据数据统
计机构 Similarweb 的估计,chat.openai 网站(即 ChatGPT 官网)在2023/1/27-
2023/2/3 这一周吸引的每日访客数量高达约 2500 万,在 1 月 31 日的流量高峰日,该
网站吸引了2800 万次访问。并且在 1/3-2/3 这一个月里,该网站的流量平均每天增长
3.4%,增速惊人。
图表 1:ChatGPT 每日点击访问量统计
资料来源:Similarweb,国盛证券研究所
ChatGPT 用户数高速增长的根本原因,来源于其突破性的表现,其中最突出的有两点
体现:
1)ChatGPT 与人类“对齐”了偏好,其应答更适应人类习惯,并且能驳回一些反道德的
提问,展现出显著优于前代的智能度。ChatGPT模型比以往的人机对话模型(例如 GPT3
等)更强大,例如,其敢于质疑不正确的前提和假设、主动承认错误以及一些无法回答
的问题、主动给拒绝不合理的问题、提升了对用户意图的理解以及结果的准确性。与之
前的 GPT3 不同,相比于此前海量学习数据进行训练,ChatGPT 中,人对结果的反馈成
为了 AI 学习过程中的一部分。初次之外,ChatGPT 甚至会主动驳回一些危险提问,例
如:如果提问“如何霸凌 John”,上一代的模型 InstructGPT 会给出几种方法作为解答,
而 ChatGPT 给出的答案则是“霸凌是不对的”。
P.3请仔细阅读本报告末页声明
2023 年 02 月 26 日
图表 2:ChatGPT 会主动驳回一些具有潜在道德风险的危险提问
资料来源:ChatGPT 官网,国盛证券研究所
2)ChatGPT 具备了思维链(Chain-of-Thought,CoT)能力,能够处理一定程度的
复杂思维逻辑。对于一些逻辑较为复杂的问题,直接向大规模语言模型提问可能会得到
不准确的回答,但是如果以提示(prompt)的方式在输入中给出有逻辑的解题步骤(即
将复杂问题拆解为多个子问题解决再从中抽取答案)的示例后再提出问题,大模型就能
给出正确题解。有时,甚至不用给示例,在输入后面接一句“Let’s think step by step”,
模型的输出就是一步一步“思考”后的各个子问题的结果,再将该输出拼到输入后构造
第二次输入数据,大模型就能进一步将上一步的输出整合,得出正确的复杂问题的解。
P.4请仔细阅读本报告末页声明