中国人工智能系列白皮书——大模型技术.pdf

想预览更多内容,点击预览全文

申明敬告:

本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己完全接受本站规则且自行承担所有风险,本站不退款、不进行额外附加服务;如果您已付费下载过本站文档,您可以点击这里二次下载

文档介绍

中国人工智能系列白皮书——大模型技术(2023版)中国人工智能学会二○二三年九月目录第1章大模型技术概述51.1大模型技术的发展历程51.2大模型技术的生态发展91.3大模型技术的风险与挑战11第2章语言大模型技术132.1Transformer架构132.2语言大模型架构172.2.1掩码语言建模172.2.2自回归语言建模182.2.3序列到序列建模182.3语言大模型关键技术192.3.1语言大模型的预训练192.3.2语言大模型的适配微调212.3.3语言大模型的提示学习242.3.4语言大模型的知识增强262.4.5语言大模型的工具学习27第3章多模态大模型技术293.1多模态大模型的技术体系293.1.1面向理解任务的多模态大模型293.1.2面向生成任务的多模态大模型313.1.3兼顾理解和生成任务的多模态大模型333.1.4知识增强的多模态大模型353.2多模态大模型的关键技术363.2.1多模态大模型的网络结构设计3623.2.2多模态大模型的自监督学习优化373.2.3多模态大模型的下游任务微调适配39第4章大模型技术生态414.1典型大模型平台414.2典型开源大模型444.2.1典型开源语言大模型444.2.2典型开源多模态大模型534.3典型开源框架与工具574.4大模型的训练数据604.4.1大模型的训练数据处理流程和特点604.4.2大模型常用的公开数据集63第5章大模型的开发训练与推理部署665.1大模型开发与训练665.2大模型推理部署685.2.1大模型压缩695.2.2大模型推理与服务部署705.3软硬件适配与协同优化715.3.1大模型的软硬件适配725.3.2大模型的软硬件协同优化72第6章大模型应用746.1信息检索746.2新闻媒体756.3智慧城市766.4生物科技766.5智慧办公776.6影视制作786.7智能教育7836

最近下载