纵览2023世界人工智能大会：百模大战4个月，中国AI产业怎么样了？

2023-07-08

光锥智能关注

文图

广东工具软件

最近威廉希尔中文网站：收购|未披露|2014-05-23

我要联系

一片欣欣向荣之中，大模型产业链同频进步

编者按：本文来自微信公众号光锥智能（ID：guangzhui-tech），作者：刘雨琦，编辑：王一粟，创业邦经授权转载

身处大模型的浪潮之中，AI的热度一波接着一波。

7月6日，2023年世界人工智能大会在上海召开，一度冲上了微博热搜榜。在5万平方米的会场中，400多家企业的展台员工都在不遗余力地讲解着自家新产品，参会的人们不断穿梭其中，“脚都走麻了，但心情还是很澎湃。”有观众说道。

在现场，光锥智能发现大会的展台均是按行业部署，软件、硬件、芯片“一家人整整齐齐”的排列着。阿里、百度、腾讯三连座，无异于同台竞技，而观众们能在5分钟之内纵览全国最新大模型，边看边对比。

作为国内最大的AI盛会，此次与往届不同的是，通用人工智能的曙光似乎就在咫尺之间，群雄逐鹿的战意感染了每一个见证者。

特斯拉创始人、CEO埃隆·马斯克连线开场，图灵奖得主、中国科学院院士、上海期智研究院院长姚期智主持讨论此次大会，不仅集齐了百度文心、阿里通义、华为盘古、讯飞星火、商汤日日新等30余个海内外大模型，还有80余位国内外院士，特斯拉、微软、华为、阿里等50余位海内外大咖，学术界与科技界正在合力推开时代厚重的大门。

最为基础的大模型层，技术平台迎来新的迭代升级，如何赋能千行百业，推进产业落地成为新阶段的探讨主题。

AI infra结构虽然尚不成熟，但大模型的配套设施跟了上来，适应大模型计算存储的向量数据库成为热门赛道，保证大模型安全运行的AI安全监测平台顺势而生。

应用落地抢在了大模型成熟的前面，软件应用渗透至各行各业场景，硬件端又催生了一批机器人新产品。

中国大模型跑出了中国速度，技术层、配套设施层、应用层，同时在各个环节同步崛起，而不是等着底层大模型技术成熟后才慢慢跟上。一面继续夯实地基，一面遍地开花，整舰加速前进，衍生出更多的中国大模型模式。

大模型，两条腿走路

从3月如雨后春笋般冒头至今，短短4个月的时间，大模型正在从“通用型”走向“产业落地”。

通用大模型是一场“赢家通吃”的大逃杀，把大模型用起来，比做出来更重要。在此次世界人工智能大会上，所有大模型升级的关键词都是“产业”。

作为大模型的提供方，蚂蚁、腾讯、百度、阿里、华为、网易等大厂结合此前已有领域的经验优势，快速探索垂类场景应用。

阿里的通义千问大模型，就率先用在了智慧金融。通过将自然语言理解和生成能力与金融场景结合，通义千问与中金财富、杭州银行、恒生电子等合作，通过智能问答、智能外呼、智能助手，来帮助企业识别市场风险、理解客户需求。

以游戏和教育为主的网易，则将大模型率先与这两个领域结合。在教育领域，网易有道自研了国内首个教育大模型“子曰”，在此次大会还发布了最新应用成果——虚拟人口语教练，可以1V1体验类似真人的口语私教。

而在自动驾驶领域积累多年的百度，把大模型投入了汽车交通领域。在汽车制造领域，百度智能云为长安汽车提供了人工智能基础设施平台和数字人平台，与吉利汽车一起打造了汽车行业大模型，构建了工厂数字化大脑，帮助降低管理运维成本。

正如华为轮值董事长胡厚崑提到，“人工智能的发展关键是走深向实，着力点放在让人工智能为千行百业的生产活动服务，为科研创新服务。”

不过，这波中国大模型们产业落地的姿势虽各不相同，但在优势领域站稳后，都开始一致向外扩展，比拼起了行业覆盖能力。

以腾讯为例，目前，腾讯云已经为传媒、文旅等10余个行业提供了超过50个大模型行业解决方案；华为的盘古大模型则主要与金融、制造、医药研发、煤矿、铁路等行业相结合落地......总体而言，智慧政务、智慧金融、智慧交通成为抢手垂类赛道。

腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示，“通用大模型可以在100个场景中，解决70%-80%的问题，但未必能100%满足企业某个场景的需求。”

为了提升行业大模型的竞争力，企业们需要深入垂类行业的具体场景，贴身肉搏真正考验技术的细节与效果。

作为持续进化的技术，大模型光能用起来还不够。正如每一个技术的发展，都需要两条腿走路，一条是实用性，一条是先进性，大模型的实用性，是借由产业侧落地逐步探索的，而先进性则体现在对跨模态难题的突破。

参考ChatGPT从3.5到4.0的路径，生成式大模型的技术前进之路，是单模态到多模态的，从一开始同质化严重的文生文，正在一路向文生图、文生声、文生视频演进。

在通义千问之后，阿里云此次宣布推出“通义大模型”新成员AI绘画“通义万相”，与文心一格、商汤秒画类似，文生图赛道已经拥挤起来。

而在文生图之后，文生声、文生视频是接下来的赛点。

以视频为例，作为文、声、图的结合体，文生视频也是生成式大模型的终极形态。目前，文生视频技术的难点在于连贯画面素材的生产。基于数字人的已有技术，文生视频最快在数字人场景实现。

例如，商汤的如影大模型，能将文本文案,一键生成知识分享、品牌宣传、短视频带货、培训宣讲、热点资讯等各类数字人视频，以及3D内容生成平台“琼宇”（场景生成）、“格物”（物体生成），基于3D内容生成技术对空间和物体复刻与交互。

以往，技术往往都是先发展，后应用。而在这一波大模型浪潮下，技术的先进性、实用性同步发展，两条腿走路的大模型正在加速前进。

产业拼图，逐个补齐

大模型狂奔了4个月，产业的拼图，也在一块一块逐渐补齐。

以大模型为核心的MaaS服务平台，是大模型飞机着陆的机场。大模型如何落地、落地速度，都与这个机场平台的建设成熟程度紧密相关。

目前，百度文心千帆、阿里灵骏PAI平台、腾讯模型商店、火山引擎的火山方舟，虽然有细分的差别，但都是MaaS服务平台，帮助企业更好的精调、部署行业大模型，将大模型应用在产业中。

WAIC中，MaaS平台的升级也是一大主要看点。会上，腾讯云公开了几大重点行业方向，包括金融风控、交互翻译、数智人等创新场景，下一步将布局AI for Science，持续通过AI 大模型应用在天文探索、文化考古等领域。

在不久前，火山引擎也发布了MaaS服务平台火山方舟，包括模型广场和模型工具两个重要模块，核心目的也是通过平台力量帮助企业更好的做应用落地。

而在发展的过程中，安全问题也逐渐暴露出来。

无论是AI诈骗还是三星的员工数据泄露，模型安全一度成为了社会焦点。现阶段，解决问题的前提是发现问题，亮起安全红灯，才能有的放矢的解决。

为此，蚂蚁推出了可信程度安全评测系统“蚁鉴2.0”，作为业内首个产业级支持文本、图像等全数据类型的AI安全检测平台，“蚁鉴2.0”新增AIGC安全性、AI可解释评测能力，可服务于金融、教育、文化、医疗、电商等领域10多个大规模复杂业务场景。

另外，蚂蚁还将发布以隐私计算技术为核心的隐语开源框架1.0版本、“隐私计算安全对战”科普互动游戏，数字版权保护平台“鹊凿”等。

蚂蚁的技术人员告诉光锥智能：“当面对多模型决策时，企业可以将大模型开放给蚁鉴平台进行评分，将有4个不同的评分标准，就像论文的查重系统，检测模型的安全指数并打分，为企业提供指导。”

不过，据光锥智能了解到，目前，蚁鉴仅能检测问题，并不提供针对性解决数据安全问题的方案。还需要其他厂商共同完善产业链条。

另一方面，数据技术的发展也在突破大模型本身的限制。

正如前文所讲，大模型正在经历从通用到行业的变迁，这个过程受到两个方面的限制：一是通用大模型只有“短期记忆”，无论是国内还是国外，OpenAI最新发布了GPT4的开源版本中也强调，有8k的Token限制；二是训练行业专有大模型，企业需要将私有数据与通用大模型进行结合，私有数据如何安全的接入大模型？如何更高效率、低成本的处理动态变化的数据？

这也就是为什么，大模型火了之后，向量数据库随之火爆的原因。

星环科技创始人孙元浩向光锥智能解释道：“向量数据库就像是大模型的外脑，能够帮助大模型拥有长期记忆，且私有数据可以通过向量化存储在向量数据库中，既能满足瞬时接入和输出，也保障企业私有数据不被泄露。”

为此，腾讯云发布了云原生向量数据库Tencent Cloud VectorDB，支持10亿级向量检索规模，并将延迟控制在毫秒级。相比传统单机插件式数据库检索规模提升10倍，同时具备百万级每秒查询（QPS）的峰值能力。

星环科技发布了分布式向量数据库Transwarp Hippo。支持存储、索引以及管理海量的向量式数据集，提供向量相似度检索、高密度向量聚类等能力，有效地解决了大模型在知识时效性低、输入能力有限、准确度低等问题。

向量数据库火爆的背后，是大模型带动着整个数据产业链向前发展。

在训练大模型之前的数据准备（清洗、过滤、提纯）、数据处理（选型、质量、标注）在经历了数道工序后才能“喂”给大模型，而中国目前数据产业相对分散，导致数据在流通的过程中容易遇到安全问题，且效率不高。

比如，需要先把复杂的非结构化数据通过向量化（embedding），处理统一成多维空间里的坐标值，才能够为大模型所用，但如Zilliz一类的向量数据库，并不帮企业完成向量化的过程。

这就需要一个一站式的数据处理平台。和数据打了十几年交道的孙元浩，将经验凝结在了星环的Sophon LLMOps中，通过该平台，用户可以完成数据采集、知识沉淀、大模型迭代提升的完整闭环。同时将向量数据库与图数据库进行结合，能够更好的帮助大模型跨领域知识学习和调优，让大语言模型能更好地理解不同领域的专业术语、缩写、常见词汇和语法，承担统一的语义理解功能，解决业务领域性问题。