近期,"ChatGPT"、"文心一言"、"盘古Chat"等大型人工智能(AI)模型的热潮推动了新一轮的AI技术发展。我国在人工智能领域的早期部署为大型模型的发展奠定了坚实基础,并在政府、产业界、学术界和研究界的共同推动下,建立了涵盖理论方法和软硬件技术的系统化研发能力,大型模型的研发正呈现蓬勃发展的势头。
一、行业市场现状
1.AI产业的核心规模
人工智能是推动新一轮科技革命和产业变革的重要力量。近年来,我国在技术创新、产业生态、融合应用等方面取得了积极进展,成为全球领先的人工智能产业。根据cn信通院的测算,2022年我国的人工智能核心产业规模达到5080亿元,同比增长18%。我国已经形成了完整的人工智能产业体系,成为新的增长引擎,企业数量接近4000家。
2.AI大型模型的数量
大数据和大算力推动了人工智能发展进入大型模型时代。大型AI模型是指通过大规模数据训练,并经过微调后能够适应广泛下游任务的模型。随着参数规模的不断扩大,大型AI模型在语言处理、视觉处理、推理、人机交互等领域展现出新的能力。目前,cn和美国开发的大型模型数量占全球总数的80%以上,cn在大型模型数量方面仅次于美国。我国在人工智能领域的早期部署为大型模型的发展奠定了坚实基础,已经建立了涵盖理论方法和软硬件技术的系统化研发能力,形成了紧跟世界前沿的大型模型技术群。数据显示,截至2023年,我国参数规模超过10亿的大型模型总数达到79个。
3.各领域大型模型的数量统计
目前,cn约有14个省市正在开展大型模型的研发工作,其中北京和广东的研发活动最为活跃,地域集中度相对较高。从领域分布来看,自然语言处理(NLP)仍然是目前大型模型研发最为活跃的重点领域,数量达到49个。其次是多模态领域,数量达到16个。相比之下,计算机视觉和智能语音等领域的大型模型数量相对较少。
4.AI大型模型的开发模式
在大型模型的开发模式方面,国内的大学、科研机构和企业等不同创新主体都积极参与了大型模型的研发工作。在我国超过10亿参数规模的79个大型模型中,有36个是由企业独立开发的,29个是由高校和科研机构独立开发的,还有14个是由高校和企业联合开发的。这表明学术界和产业界之间的合作与联合开发仍有较大的发展空间。
5.AI大型模型的产业化路径
大型模型的产业化应用可以沿着两个路径发展。一是通用类大型模型不断拓展应用领域。cn已经涌现出了一批通用化大型模型,如"文心一言"、"通义千问"、"紫东太初"、"星火认知"等,正在快速发展,打造跨行业的通用人工智能能力平台。这些通用模型的应用正在从办公、生活和娱乐等领域向医疗、工业和教育等领域加速渗透。二是垂直领域的专业类大型模型不断深化落地。针对生物制药、遥感、气象等垂直领域,已经出现了一批专用的大型模型,发挥着在特定领域的优势,提供高质量的专业解决方案。
6.AI大型模型企业的布局情况
随着百度、腾讯、华为、阿里等互联网巨头积极布局人工智能产业,并推出了一系列通用化大型模型,如"文心一言"、"混元AI大模型"、"盘古Chat"、"通义千问"等,我国的AI大型模型产业化发展正在加速。从开源情况来看,国内已有超过半数的大型模型实现了开源,其中高校和科研机构是开源的主要力量,清华大学的ChatGLM-6B、复旦大学的MOSS、百度的文心系列大型模型在开源方面具有较大的影响力。
二、行业发展前景
1.政策支持行业发展
人工智能作为国家战略的重要组成部分,是未来国际竞争的焦点和经济发展的新引擎。近年来,cn人工智能行业得到各级政府的高度重视和国家产业政策的重点支持。政府陆续出台了多项政策,鼓励人工智能行业的发展与创新。例如,国家互联网信息办公室于今年4月发布了《生成式人工智能服务管理办法(征求意见稿)》,首次明确了生成式人工智能提供者的法定责任及法律依据,以及人工智能产品的安全评估规定和管理办法。此外,北京、上海、深圳等地也相继发布了支持人工智能产业发展的政策文件,从拓展人工智能应用场景到加强相关领域人才培养等方面进行多方面的部署,为人工智能产业的良性发展提供了有力的政策支持。
2.AI基础数据服务规模增长
在人工智能产业链中,算法、算力和数据是技术发展的三大核心要素。算法模型从技术理论到应用实践的落地过程都离不开大量的训练数据。训练数据的数量、完整性和质量越高,模型推断的结果越可靠。随着人工智能、區塊鏈、物联网等新兴技术的发展,cn乃至全球的基础数据服务规模都在快速增长。未来智能制造、元宇宙、生成式人工智能等复杂智能场景的实现,将对人工智能基础数据服务提出更高的要求。
3.算力基础设施建设加快
发展AI大型模型离不开强大的算力支持。加快算力基础设施的建设,优化算力资源的布局和提升算力的应用强度至关重要。随着全国一体化算力网络国家枢纽Node的部署和"东数西算"工程的推进,我国算力基础设施建设正在快速发展,算力规模不断扩大。根据国家信息中心和浪潮信息联合发布的《智能计算中心创新发展指南》,目前全国有超过30个城市正在建设或计划建设智能计算中心。在"十四五"期间,对智能计算中心的投资预计可以带动人工智能核心产业增长约2.9-3.4倍。这种算力基础设施的加快建设将为AI大模型的发展提供更强的支持和保障。
三、AI大模型应用加速落地
随着AI大模型的不断发展和成熟,其应用在各行各业中的落地也在加速推进。大模型的应用在以下几个方面表现出了明显的特点和优势:
1.拓展应用领域:通用类大模型正在持续拓展应用领域,例如文心一言、通义千问、紫东太初、星火认知等一批cn的通用化大模型正在快速发展,打造跨行业通用化人工智能能力平台。这些大模型的应用正在从办公、生活、娱乐等领域逐渐渗透到医疗、工业、教育等领域,为各行各业提供更加智能化的解决方案。
2.垂直领域专业化:同时,垂直领域的专业化大模型也在不断深化落地。针对生物制药、遥感、气象等特定领域的专用大模型,充分发挥其在领域内的纵深优势,提供高质量的专业化解决方案。这些专业化大模型的应用可以更好地满足特定行业的需求,提高生产效率和决策精度。
3.企业布局加速:百度、腾讯、华为、阿里等互联网头部企业正在竞相布局AI产业,并推出一系列通用化大模型,如文心一言、混元AI大模型、盘古Chat、通义千问等。这些企业的布局加速了AI大模型产业化的发展,推动了相关技术和应用的进步。同时,国内的大学和科研机构也积极参与大模型的研发,校企联合研发的模型数量不断增加,学术界与产业界之间的合作仍有较大的发展空间。
4.开源影响力扩大:国内已有超过半数的大模型实现了开源,其中高校和科研机构在开源方面发挥了主导作用。清华大学的ChatGLM-6B、复旦大学的MOSS、百度的文心系列大模型等在开源领域具有较大影响力。开源的大模型促进了技术的共享和合作,加速了行业的发展和创新。
随着AI大模型应用的加速落地,各行业迎来了新的发展机遇:
1.医疗领域:AI大模型在医疗诊断、疾病预测、药物研发等方面发挥着重要作用。通过分析大量的医疗数据和病例信息,大模型可以提供准确的诊断结果和个性化的治疗方案,帮助医生做出更好的决策,提高医疗效率和精准度。
2.工业领域:AI大模型在工业生产、设备维护、质量控制等方面具有广阔的应用前景。通过对大量的传感器数据和生产数据进行分析,大模型可以实现智能化的生产调度和故障预警,提高生产效率和产品质量。
3.教育领域:AI大模型在教育智能化、个性化教学、智能辅导等方面发挥着重要作用。通过对学生的学习数据和行为进行分析,大模型可以根据学生的特点和需求提供个性化的学习内容和指导,帮助学生提升学习效果和兴趣。
4.金融领域:AI大模型在风险评估、投资决策、欺诈检测等方面具有重要价值。通过对大量的金融数据和市场信息进行分析,大模型可以帮助金融机构进行风险控制和投资优化,提高金融决策的准确性和效益。
5.媒体和娱乐领域:AI大模型在内容生成、推荐系统、虚拟人物等方面有广泛应用。大模型可以生成高质量的文本、音频和图像内容,提供个性化的推荐服务,甚至可以创造虚拟人物和角色,丰富媒体和娱乐体验。
综上所述,随着AI大模型的应用加速落地,各行业迎来了新的发展风口。政府、企业和研究机构需要继续加大投入和支持,推动AI大模型的研发和创新,为行业的智能化转型和升级提供强有力的技术支持。同时,也需要关注数据隐私和伦理道德等问题,确保AI大模型的应用安全可靠,避免潜在的风险和滥用。
为了推动AI大模型应用的落地和普及,还需要解决以下几个关键问题:
1.算力支持:AI大模型的训练和推理需要大量的计算资源支持。政府和企业可以加大对算力基础设施的投资,建设更多的智能计算中心和云计算平台,提供高性能的计算资源,满足大模型应用的需求。
2.数据质量与隐私保护:AI大模型的性能和效果受制于训练数据的质量和规模。政府和企业应加强数据采集、清洗和标注工作,提高数据的质量和可用性。同时,要加强数据隐私保护,确保个人隐私信息不被滥用和泄露。
3.人才培养和交流:AI大模型的研发和应用需要具备跨学科的人才团队,包括算法专家、领域专家、工程师等。政府和高校可以加强人才培养计划,开展相关的学科交叉培训和合作研究,提高人才队伍的素质和创新能力。
4.法律法规和标准建设:AI大模型的应用涉及到众多法律法规和伦理准则的问题。政府需要制定相关的法规和政策,明确大模型应用的边界和规范,保障公众利益和数据安全。同时,还需要加强国际合作,制定统一的标准和规范,推动全球AI大模型的健康发展。
总之,AI大模型应用的加速落地为各行业带来了新的发展机遇。政府、企业和研究机构应共同努力,加大投入和支持,解决技术、数据、人才和法律等方面的挑战,推动AI大模型的创新和应用,促进行业的智能化转型,实现经济社会的可持续发展。同时,也需要注意引导和监管,确保AI大模型的应用安全可靠,符合伦理和法律的要求,为人类社会带来真正的福祉。