首页 > 资料专栏 > 财税 > 有价证券 > 证券债券 > 2023年德邦证券-传媒行业AIGC专题一:探析AIGC的技术发展和应用PDF

2023年德邦证券-传媒行业AIGC专题一:探析AIGC的技术发展和应用PDF

伊藤博爱
V 实名认证
内容提供者
资料大小:2097KB(压缩后)
文档格式:PDF
资料语言:中文版/英文版/日文版
解压密码:m448
更新时间:2023/5/27(发布于山东)

类型:积分资料
积分:15分 (VIP无积分限制)
推荐:升级会员

   点此下载 ==>> 点击下载文档


相关下载
推荐资料
“2023年德邦证券-传媒行业AIGC专题一:探析AIGC的技术发展和应用PDF”第1页图片 “2023年德邦证券-传媒行业AIGC专题一:探析AIGC的技术发展和应用PDF”第2页图片 图片预览结束,如需查阅完整内容,请下载文档!
文本描述
[Table_Main]
证券研究报告 | 行业专题
传媒
2023 年 02 月 10 日
传媒AIGC 专题一:探析 AIGC 的技术发
优于大市(维持) 展和应用
证券分析师 [Table_Summary]
投资要点:
马笑
资格编号:S0120522100002 AIGC 成为新的内容生产方式,跨模态生成值得重点关注。区别于PGC 与 UGC,
邮箱:maxiao@tebon AIGC 是利用人工智能技术自动生成内容的新型生产方式。按照模态区分,AIGC
可分为音频生成、文本生成、图像生成、视频生成及图像、视频、文本间的跨模态
研究助理 生成,细分场景众多,其中,跨模态生成需要重点关注。
自然语言处理(NLP)赋予了 AI 理解和生成能力,大规模预训练模型是 NLP 的发
展趋势。NLP的两个核心任务分别是自然语言理解(NLU)和自然语言生成(NLG)。
市场表现
以 ELMo、BERT、GPT为代表的预训练模型,降低了 NLP 的技术门槛。ELMo 解
沪深300决了“一词多义”的问题;BERT 通过 MLM(类似于完形填空)和 NLP(判断句
5%子是否相连)进行预训练,增强了上下文的理解能力。 通过预测下一个词,
0% GPT
-5% 获得了生成能力;GPT-3 在此基础上使用了更大的数据和更大模型,无需针对下游
-10% 任务进行传统的微调,并且采用了小样本学习提升生成效果。
-15%
-20%
-24%2022-02 2022-06 2022-10
ChatGPT 是 NLP 发展中具有里程碑式意义的模型之一。ChatGPT 是 OpenAI 从
-29%
GPT-3.5 系列中的模型进行微调产生的聊天机器人模型。它能够通过学习和理解人
类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交
流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。
相关研究
1.《传媒互联网行业周报:ChatGPT生成模型赋予了 AI 创造力,扩散模型是最前沿的技术之一。AIGC 的快速发展归
加速商业化,AIGC 或带来泛娱乐和 功于生成算法领域的技术积累。GAN的核心思想是“生成”与“对抗”,相比传统
互联网的革新》,2023.2.5 的深度神经网络,GAN能产生更好的生成样本,但是仍需解决应用中的问题。扩
2.《分众传媒(002027.SZ)首次覆散模型较GAN 更接近人的思维模式,是基于马尔科夫链,通过学习噪声来生成数
盖报告:当风轻借力,一举入高空》, 据。扩散模型实现了跨模态应用,包括 OpenAI 的 GLIDE 和 DALL·E 2、谷歌的
2023.2.1Imagen、Stability AI 的 Stable Diffusion 等。
3.《腾讯控股(0700.HK)22Q4 业绩
前瞻及观点更新:宏观经济波动致收 人工智能由单模态智能,向多种模态融合方向发展。建立统一的、跨场景、多任务
入端承压,降本增效成果释放带来利 的多模态基础模型或将成为人工智能发展的主流趋势之一。CLIP模型将语言信息
润端高增速》,2023.1.31 和图像信息联合训练,能够链接文本和图片,成为跨模态生成应用的一个重要节点,
4.《百度集团-SW(9888.HK)22Q4 “CLIP+其他模型”在跨模态生成领域成为一种较为通用的做法。2022 年,微软
及 2022 年全年业绩前瞻:疫情扰动提出的 BEiT-3 多模态基础模型,在视觉-语言任务处理上具备出色表现,包括视觉
或致经营短期承压,展望后续收入业 问答、图片描述生成和跨模态检索等。多模态提高了基础模型的灵活性,使其在其
绩双端修复》,2023.1.30 他模态的应用中发挥新的潜质。
5.《春节档期票房超 65 亿,行业持
续 复 苏 估 值 业 绩 双 升 可 期 》, 未来,值得关注的技术要素包括:长文本生成、开放式文本生成、NeRF 模型、扩
2023.1.28散模型、跨模态大型预训练模型(支持的模态数据类型、模态对齐架构设计、支持
的下游应用)、小样本学习及自监督算法、强化学习及环境学习等。
投资建议:把握 AIGC 技术催化和商业落地的投资机会。技术发展有望促进生产效
率提升,并进一步创造新的消费和需求,有利于文娱内容和互联网行业。在AIGC
和 ChatGPT 方面,我们建议持续关注技术发展和应用情况,把握技术催化和商业
化落地带来的投资机会:1)具备 AIGC 和 ChatGPT 的技术探索和应用的公司:
百度集团-SW、商汤-W、万兴科技、拓尔思等;2)具有海量内容素材且具有 AIGC
探索布局的,图片/文字/音乐/视频内容及平台公司腾讯控股,阅文集团、美图公司、
视觉中国、中文在线、汉仪股份、昆仑万维、天娱数科、风语筑等。
风险提示:技术发展不及预期、监管政策变化、知识产权相关问题等。
请务必阅读正文之后的信息披露和法律声明 行业专题 传媒
内容目录
1. AIGC 的跨模态生成值得重点关注 .......... 5
2. 基于大模型预训练的 NLP 赋予了 AI 理解和生成能力 ....... 5
2.1. ELMo 将输出的词向量作为特征,解决了“一词多义” ........ 7
2.2. BERT 通过上下文预训练,提高了理解能力 ....... 8
2.3. GPT-3 利用超大数据和超大模型,省去了微调的过程 ...... 9
2.3.1. ChatGPT 趋近人类价值观及意图,有望进一步商业化 ........ 11
3. 基于大模型的主流生成模型赋予了 AI 创造力 ........... 12
3.1. GAN 是基于“生成”与“对抗”提出的生成模型 ............. 13
3.2. 扩散模型更接近人的思维模式,实现了跨模态应用 ....... 13
3.2.1. 扩散模型实现了从文本到图像的跨模态应用 .......... 14
4. 人工智能由单模态智能,向多种模态融合方向发展 ......... 16
5. AIGC 技术不断发展,有望带来更多商业化价值 ....... 16
6. 投资建议:把握 AIGC 技术催化和商业落地的投资机会 ......... 18
7. 风险提示 .................. 19
2 / 20 请务必阅读正文之后的信息披露和法律声明
行业专题 传媒
图表目录
图 1:内容生产模式的四个发展阶段 .......... 5
图 2:自然语言处理的发展历史 ................. 6
图 3:大规模预训练模型大幅提升研发效率 ............. 6
图 4:BERT 的每一层都是双向模型;GPT 为单向模型;ELMo 为单项模型叠加 .... 7
图 5:大规模预训练语言模型的发展趋势之一是参数量不断增加 ........ 7
图 6:ELMo 基于 RNN,双向RNN 可以利用前后文信息...... 8
图 7:ELMo 将词嵌入作加权和,给出最终的词向量 ............. 8
图 8:ELMo 解决了一词多义问题,且兼顾语义与词性 ......... 8
图 9:BERT 的结构是Transformer 中的 Encoder 部分 ......... 9
图 10:BERT 采用了预训练+微调的两阶段模型 ............. 9
图 11:NSP 任务中输入向量生成示意图 .......... 9
图 12:GPT 模型结构 ................ 10
图 13:GPT-3 将例子直接作为模型输入 ......... 10
图 14:Few Shot 较 Zero Shot 在模型增大后表现提升更显著 .......... 10
图 15:GPT-3.5 的进化树 ................. 11
图 16:RLHF 工作原理 .............. 11
图 17:ChatGPT 的训练模式 ............ 11
图 18:ChatGPT 能够进行对话,甚至能完成撰写代码 ....... 12
图 19:ChatGPT 上线 2 个月后月度用户数量破1 亿 .......... 12
图 20:OpenAI 推出付费订阅项目 ChatGPT Plus,价格$20/月 ....... 12
图 21 :不同生成模型之间的区别 ............. 13
图 22:GAN 的基本思想 ............ 13
图 23:训练后的 GAN 生成案例 .............. 13
图 24:Diffusion Model 基于马尔科夫链,通过学习噪声来生成数据 ....... 14
图 25:GLIDE 可以进行文本到图像的生成 ............ 14
图 26:GLIDE 可以执行图像修复 ............ 14
图 27:unCLIP 模型示意图 ............... 15
图 28:DALL·E 2 的生成案例 ........... 15
图 29:Image 的架构示意图 ............. 15
图 30:Image 的生成案例 ................. 15
图 31:Stable Diffusion 生成效果 ............ 16
图 32:Stable Diffusion 2.0 引入了图像深度扩散模型 ......... 16
3 / 20 请务必阅读正文之后的信息披露和法律声明
dWdVeYPBpPtQ6M9R7NsQoOpNpMjMmMnPeRoPmObRtRtRvPqMnMxNqRuN 行业专题 传媒
图 33:AIGC 相关技术场景及成熟度分类 .............. 17
表 1:ELMo、BERT与 GPT 系列的对比 ......... 6
表 2:国外主要 AIGC 预训练模型一览表 ............... 17
表 3:部分公司在 AIGC 领域的布局(截至 2023/2/6) ........ 18
4 / 20 请务必阅读正文之后的信息披露和法律声明
行业专题 传媒
1. AIGC 的跨模态生成值得重点关注
根据中国信息通信研究院发布的《人工智能生成内容(AIGC)白皮书》,目
前,对 AIGC 这一概念的界定,尚无统一规范的定义。国内产学研各界对于AIGC
的理解是“继专业生成内容(Professional Generated Content, PGC)和用户生
成内容(User Generated Content, UGC)之后,利用人工智能技术自动生成内容
的新型生产方式”。传统 AI 关注对于现有数据的分析能力,而 AIGC 注重生成创
造新事物的能力。按照模态区分,AIGC 可分为音频生成、文本生成、图像生成、
视频生成及图像、视频、文本间的跨模态生成,细分场景众多,其中,跨模态生成
需要重点关注。
自然语言处理(NLP)与生成模型是 AIGC 发展的重要技术支柱。自然语言
处理增强 AIGC 的认知能力,使得人类语言与计算机语言之间实现互通;生成模
型升级 AIGC 内容创作能力,使生成的作品更接近人类思维与偏好。
图 1:内容生产模式的四个发展阶段
资料来源:《AIGC 发展趋势报告 2023》,德邦研究所
AIGC 近年来的快速发展依赖于生成模型、预训练模型和多模态等技术的融
合。生成模型从GAN 发展到后续的扩散模型,不断趋近人的思维模式。预训练模
型提高了 AIGC 技术的灵活性和效果质量。基于大量数据训练的巨量参数模型可
以轻松应用到下游任务中,降低了使用门槛和技术成本,推动了自然语言处理、
计算机视觉等技术的发展。多模态技术提高了 AIGC 的通用性,使得图像、声音、
语言等互相融合。
2. 基于大模型预训练的 NLP 赋予了AI 理解和生成能力
自然语言处理(NLP)主要研究用计算机来理解和生成自然语言的各种理论
和方法,属于人工智能领域的一个重要甚至核心的分支。自然语言处理(NLP)
的两个核心任务分别是自然语言理解(NLU)和自然语言生成(NLG);四大任务
是序列标注(分词、语义标注等)、分类任务(文本分类、情感计算等)、句子关系
判断、生成式任务(机器翻译、文本摘要等)。人工智能应用领域的快速拓展对自
然语言处理提出了巨大的应用需求。
2018 年,NLP 正式进入“预训练”时代,简化了下游任务模型的接入,降低
了 NLP 的技术门槛。预训练是指,首先在一个源任务上训练一个初始模型,然后
在下游任务(也称目标任务)上继续对该模型进行精调,从而达到提高下游任务
准确率的目的。预训练的优势在于,一是对庞大的文本语料库进行预处理,可以
学习通用的语言表征,帮助完成下游任务;二是预训练提供了更好的模型初始化,
带来更好的普适性并加速与目标任务的衔接;三是,预训练可以看作是一种正则
化方法(regularization),以避免对小数据的过度拟合。
5 / 20 请务必阅读正文之后的信息披露和法律声明