【国盛证券】ChatGPT技术篇：智能背后的秘密PDF -管理资源网

首页 > 资料专栏 > IT > IT技术 > 人工智能 > 【国盛证券】ChatGPT技术篇：智能背后的秘密PDF

【国盛证券】ChatGPT技术篇：智能背后的秘密PDF

诸葛一凡: V 实名认证

内容提供者

联系反馈

热门搜索

ChatGPT 证券国盛证券

资料大小：3147KB(压缩后)
文档格式：PDF
资料语言：中文版/英文版/日文版
解压密码：m448
更新时间：2023/6/8(发布于上海)
阅读：4
类型：积分资料
积分：15分 (VIP无积分限制)
推荐：升级会员

下载地址

文档软件 | 转换工具

==>> 点击下载文档

相关下载

推荐资料

文本描述

证券研究报告|行业周报
2023 年 02 月 26 日
计算机
ChatGPT 技术篇：智能背后的秘密
ChatGPT 表现惊艳，网站流量一路狂飙式成长。根据数据统计机构增持（维持）
Similarweb 的估计，chat.openai 网站（即ChatGPT 官网）在
2023/1/27-2023/2/3 这一周吸引的每日访客数量高达约 2500 万，在
1 月 31 日的流量高峰日，该网站吸引了 2800 万次访问。并且在 1/3- 行业走势
2/3 这一个月里，该网站的流量平均每天增长3.4%，增速惊人。
从 Transformer 到 ChatGPT，有哪些历史性突破？ChatGPT用户数计算机沪深300
高速增长的根本原因，来源于其突破性的表现，其中最突出的有两点16%
体现：1）ChatGPT与人类“对齐”了偏好，其应答更适应人类习惯， 0%
并且能驳回一些反道德的提问，展现出显著优于前代的智能度。2）
-16%
ChatGPT 具备了思维链（Chain-of-Thought，CoT）能力，能够处理一
定程度的复杂思维逻辑。3）ChatGPT在算数、国际音标转写、单词解-32%
读、问答、事实性问答、基础概念映射、多任务自然语义理解、上下 -48%
文单词理解等8 个指标上表现出全面综合的能力。 2022-02 2022-06 2022-10 2023-02
量变到质变，规模超过特定阈值后模型性能陡增。根据谷歌发布的论
文《Emergent Abilities of Large Language Models》，可以看到多个
NLP 任务随着模型规模扩大的性能变化曲线：前期性能和模型规模大作者
致呈线性关系；然而当模型规模大到一定程度时，任务性能有了明显
分析师刘高畅
的“飞升”。
执业证书编号：S0680518090001
海量代码训练，模型习得代码背后隐含的逻辑能力。根据熵简科技介邮箱：liugaochang@gszq
绍，“代码”可以理解为一种具备高度逻辑性的文本语料，不具备强
相关研究
逻辑性的代码会无法执行，而不像普通文本语料那样有着较高的逻辑
自由度。模型从对大量代码的学习过程中，逐渐掌握了隐藏在代码背 1、《计算机：首批 Azure OpenAI 服务落地万科，大模
后的抽象能力与逻辑能力，进而涌现出我们在 ChatGPT 上感受到的型商业化进程持续加速》2023-02-21
“智能”。
2、《计算机：ChatGPT 算力需求是如何扩张的》2023-
训练过程加入了人类反馈，模型偏好向人类看齐。通过有人类反馈的 02-19
加强学习（RLHF）训练，人类手动对 AI 给出的回复进行排名，让AI
3、《计算机：Chatgpt 需要多少算力》2023-02-12
模型理解人类偏好。由于训练过程中加入了人类反馈，有别于前代
GPT-3 单纯使用海量数据的训练方法，ChatGPT 能够更好地理解用户
指令，并作出反应。
投资建议。建议关注：1）应用型公司：金山办公、光云科技、当虹科
技、同花顺、万兴科技、立方数科、云赛智联、神思电子、宇信科技、
360、高伟达、寺库、知乎、汉王科技等；2）算力公司：浪潮信息、
中科曙光、海光信息、寒武纪、景嘉微、世纪华通、光通信产业链公
司；3）相关技术公司：科大讯飞、云从科技、拓尔思、海天瑞声、海
康威视、萤石网络、百度、阿里、腾讯；4）软件开发效率提升：赛意
信息、润和软件、法本信息、游戏公司等；5）机器人：三花智控、鸣
志电器、绿的谐波、晶品特装、微创机器人等。
风险提示：AI技术迭代不及预期风险；经济下行超预期风险；行业竞争
加剧风险。
请仔细阅读本报告末页声明扫码进群领取
1、优质研报免费获取，行业报告定期打包
2、每日推送行业最新深度研报（精选10篇）
3、最新行业报告、公司研究、专业大咖分享2023 年 02 月 26 日
内容目录
1.从 Transformer 到 ChatGPT，有哪些历史性突破？ ............. 3
2.ChatGPT 背后的秘密：智能来自何方？ ............... 5
2.1 量变到质变，规模超过特定阈值后模型性能陡增 ............ 5
2.2 海量代码训练，模型习得代码背后隐含的逻辑能力 ................ 6
2.3 训练过程加入了人类反馈，模型偏好向人类看齐 ............ 7
3、投资建议 ..................... 8
4、风险提示 ..................... 9
图表目录
图表 1：ChatGPT 每日点击访问量统计 .................. 3
图表 2：ChatGPT 会主动驳回一些具有潜在道德风险的危险提问.......... 4
图表 3：ChatGPT 已经具备了思维链能力 ............... 5
图表 4：模型规模超过特定阈值后模型性能陡增 ................... 6
图表 5：ChatGPT 模型家族谱系 ..................... 7
图表 6：ChatGPT 使用 RLHF 方法进行训练 ................... 8
P.2请仔细阅读本报告末页声明
2023 年 02 月 26 日
1.从 Transformer到 ChatGPT，有哪些历史性突破？
ChatGPT 流量以每日3.4%的速度快速成长，每日用户数已超 2500 万。根据数据统
计机构 Similarweb 的估计，chat.openai 网站（即 ChatGPT 官网）在2023/1/27-
2023/2/3 这一周吸引的每日访客数量高达约 2500 万，在 1 月 31 日的流量高峰日，该
网站吸引了2800 万次访问。并且在 1/3-2/3 这一个月里，该网站的流量平均每天增长
3.4%，增速惊人。
图表 1：ChatGPT 每日点击访问量统计
资料来源：Similarweb，国盛证券研究所
ChatGPT 用户数高速增长的根本原因，来源于其突破性的表现，其中最突出的有两点
体现：
1）ChatGPT 与人类“对齐”了偏好，其应答更适应人类习惯，并且能驳回一些反道德的
提问，展现出显著优于前代的智能度。ChatGPT模型比以往的人机对话模型（例如 GPT3
等）更强大，例如，其敢于质疑不正确的前提和假设、主动承认错误以及一些无法回答
的问题、主动给拒绝不合理的问题、提升了对用户意图的理解以及结果的准确性。与之
前的 GPT3 不同，相比于此前海量学习数据进行训练，ChatGPT 中，人对结果的反馈成
为了 AI 学习过程中的一部分。初次之外，ChatGPT 甚至会主动驳回一些危险提问，例
如：如果提问“如何霸凌 John”，上一代的模型 InstructGPT 会给出几种方法作为解答，
而 ChatGPT 给出的答案则是“霸凌是不对的”。
P.3请仔细阅读本报告末页声明
2023 年 02 月 26 日
图表 2：ChatGPT 会主动驳回一些具有潜在道德风险的危险提问
资料来源：ChatGPT 官网，国盛证券研究所
2）ChatGPT 具备了思维链（Chain-of-Thought，CoT）能力，能够处理一定程度的
复杂思维逻辑。对于一些逻辑较为复杂的问题，直接向大规模语言模型提问可能会得到
不准确的回答，但是如果以提示（prompt）的方式在输入中给出有逻辑的解题步骤（即
将复杂问题拆解为多个子问题解决再从中抽取答案）的示例后再提出问题，大模型就能
给出正确题解。有时，甚至不用给示例，在输入后面接一句“Let’s think step by step”，
模型的输出就是一步一步“思考”后的各个子问题的结果，再将该输出拼到输入后构造
第二次输入数据，大模型就能进一步将上一步的输出整合，得出正确的复杂问题的解。
P.4请仔细阅读本报告末页声明