AIGC大模型:开创工程与科学双重革命时代

蓝衫云

人工智能大模型是什么

人工智能大模型是指在机器学习和深度学习领域中,利用大规模数据和复杂网络结构构建的庞大神经网络模型。

这种发展是一场工程革命,而非仅仅是科学革命。在过去的十余年中,大型语言模型的数据量呈指数级增长,这种趋势也存在于其他领域的大模型中。随着大模型数据量的增加,通用性也将发生质的变化。

在实际应用中,不是参数规模越大越好,而是需要综合考虑多个因素来确定最适合的模型规模。针对不同行业的特点,有针对性地进行知识增强将发挥重要作用。随着技术的演进,大模型产业将朝着推进构建和部署模型的自动化进程,以降低行业用户获得人工智能能力的门槛。

国内外大模型总体表现

以下数字基于SuperCLUE(中文语言理解测评基准)测算数据,SuperCLUE是大模型时代CLUE基准的延续和发展,专注于对通用大模型进行全面评估。

国内外的大模型表现存在明显差距。GPT4-Turbo总分90.63分遥遥领先,高于其他国内和国外大模型。国内最好的模型文心一言4.0(API)总分79.02分,距离GPT4-Turbo有11.61分的差距,距离GPT4(网页)有4.9分的差距。

值得注意的是,过去一年国内大模型已经有了长足的进步,有11个模型的综合能力超过了GPT3.5和Gemini-Pro。例如,百度的文心一言4.0、阿里云的通义千问2.0和Qwen-72B-Chat、OPPO的AndesGPT、清华&智谱Al的智谱清言、以及字节跳动的云雀大模型等都表现比较好。

此外,国内开源模型在中文上的表现要优于国外开源模型,例如百川智能的Baichuan2-13B-Chat、阿里云的Qwen-72B和Yi-34B-Chat都优于Llama2-13B-Chat。

图1 国内外大模型SuperCLUE基准得分

大模型的分类

通用大模型是指能够处理多种自然语言任务的大型神经网络模型,其特点是具有强大的语言理解和生成能力,能够处理多种自然语言任务,如文本分类、情感分析、问答系统等。通用大模型包括谷歌开发的BERT、OpenAI开发的GPT-2、Facebook开发的RoBERTa等。

垂类大模型是指针对特定领域或任务进行优化的大型神经网络模型,其特点是具有更高的精度和效率,能够更好地适应特定领域的需求。垂类大模型包括医疗领域的BioBERT、金融领域的FinBERT、法律领域的LegalBERT等。

图2 中文大模型全景图

大模型服务是指将大型神经网络模型应用于实际业务场景中,提供相应的服务和解决方案,其特点是具有高度的定制化和灵活性,能够满足不同客户的需求。大模型服务包括智能客服、智能推荐、智能风控等。

图3 大模型架构图

大模型驱动下的产业效率革命

大模型将引发产业效率的革命。通过深度学习和大规模数据的训练,大模型能够实现多模态、生成式、可解释以及对话式的智能互动。

在面向更加具体的领域与场景时,结合知识图谱、迁移学习和联合学习等技术,高效结合不同垂直领域的专业知识,构建具有领域专长和业务逻辑的专业大模型。这样的模型能够为各行各业的特定场景和问题提供智能解决方案,从根本上降低大模型的下游应用成本和门槛,使更多企业和机构能够方便地应用大模型的强大能力,提高自身效率和创新力。

以大模型为关键驱动的数字经济深度融合实体经济,推动实体经济的强化、优化和扩大。例如,汽车制造、能源、交通等行业可以通过大模型在智能客服、供应链、系统调度等领域进行创新,促进产业的数字化转型和智能化提升。

图4 AI数据产业图谱

此外,大模型相对于传统AI模型具有以下优势

  • 解决了AI碎片化和多样化问题,提高了模型的泛用性。传统AI模型需要定制化的开发、调整和优化,增加了人力投入,而大模型采用了“预训练+微调”方式,存储了大量信息并进行了微调,极大提高了泛用性。
  • 具备自监督学习功能,降低了训练研发成本。通过自监督学习,降低了对数据标注的需求,使得大量无标记数据也能被充分利用,降低了人力成本,并实现了小样本训练。
  • 摆脱了结构变革带来的局限,开启了模型精度的上限。以往要提升模型精度主要依赖于对网络结构的变革,但随着结构设计技术的成熟,这种方式变得困难。研究表明,更大的数据规模能够提高模型的精度上限。

大模型发展趋势

2023年,人工智能大模型市场经历准备期、成长期最终达到百舸争流的爆发期,其中成长期代表模型有百度发布文心一言,下半年的爆发期如GPT-4发布的Turbo。

图5 2023大模型发展时间线

其中,GPT 快速迭代,从 GPT1.0 迅速步入 3.5 时代 。GPT是大型无监督语言模型,包括GPT-1、GPT-2和GPT-3。GPT-1利用了无监督预训练和有监督微调,具有较好泛化能力;但GPT-2采用了多任务模式以提高泛化能力,验证了模型容量和数据量越大,潜能越大;GPT-3在海量参数和训练数据的基础上超越了传统技术,在多种任务中表现出色。GPT3.5引入了人类反馈强化学习,其变体code-davinci-002经过微调后催生了ChatGPT,使用了基于人类反馈的强化学习的版本指令微调模型。

图6 大模型发展迭代图

人工智能大模型市场迅速扩张是趋势所在,自2020年以来,大型预训练模型在自然语言处理、计算机视觉、语音识别和推荐系统等领域展现出卓越性能,引发了行业的广泛关注。

同时,政府的支持和投资以及科技企业的推动,加强了人才培养和引进,促进了中国大模型产业的发展。随着技术的进一步突破和创新,中国有望在大模型领域取得更多成果,并与全球领先国家共同推动人工智能大模型的发展和应用。

更多内容请参考

国内哪个工具可以平替ChatGPT?

用AI助力农业产业化发展|AI如何推动农业生产保质增效

AI+医疗大模型|探索AIGC在国内医疗领域的未来

最好用的ai画图工具是什么?

gpts惊艳亮相:精英集结,让无数智能体成为你的后盾