推动AIGC商业落地，出门问问的「产模结合」实践

创业邦·2024-08-27

AIGC从技术创新走向商业落地

8月22日，2024AGI商业趋势大会在深圳成功举办。活动由创业邦主办，南山区科技创新局、西丽湖国际科教城融合创新中心、深圳市“模力营”AI生态社区为支持单位，揽胜运动为大会指定用车，搜狐为战略合作媒体。

本届大会以“AI塑造未来市场”为主题，邀请人工智能领域的行业专家、上市公司、独角兽企业、创新企业、投资机构代表，分享研讨最新的技术、创投、治理热点话题，并围绕产品商业化、人工智能+行业解决方案进行深度交流，共同探寻更广泛的产业合作与创新机遇。

会上，出门问问副总裁李维在主题为“盈利为王，AIGC从技术创新走向商业落地”的演讲中精彩观点如下：

1. 大模型的出现，就像翻越了语言的大山，统一了这些不同的赛道，建立起了一种类似圣经中巴别塔的通用语言能力。

2. 历史上，技术革新往往遵循一条被称为“technology adoption curve”的路径：一开始，人们对于重大创新和突破趋之若鹜，但当这些创新在商业化、盈利和实际应用方面遇到瓶颈时，就会出现一段回落期。

3. 在通用人工智能时代，一个模型可以处理各种任务，这使得许多细分领域的创新空间被压缩。以前，每个细分赛道都有机会诞生超级应用，但现在这种可能性大大降低了。

以下为演讲内容，由创业邦整理：

很高兴有机会跟大家分享我们在AIGC赛道上的一些工作。我叫李维，是出门问问的VP。我今天演讲的题目叫“盈利为王，AIGC从技术创新走向商业落地”。

实际上这个题目挺难的，原因在于AI和大模型非常热闹，但是真正走向商业落地的寥若晨星。所谓“AI一日人间一年”，大模型的发展虽然很快，但从总的趋势上来看，AI实则进入了一段下行期。历史上，技术革新往往遵循一条被称为“technology adoption curve”的路径：一开始，人们对于重大创新和突破趋之若鹜，但当这些创新在商业化、盈利和实际应用方面遇到瓶颈时，就会出现一段回落期。我们现在正处于这一回落期的尾声，但尚未触底。

这一趋势也映射到AI投资上，今年对于大模型公司来说，威廉希尔中文网站变得极具挑战性。主要原因是大模型非常烧钱，算力消耗甚至超过了人力成本。然而，只投入不产出的模式是不可持续的。尽管大模型拥有巨大的潜力，但要实现盈利并不像看起来那么简单。

大家都在谈，上一次技术革命是移动互联网，虽然它的技术含量可能不如大模型带给人的震撼，但它确实催生了一系列超级应用，很好地满足了人们吃穿住行、娱乐和通信等基本生活需求。这些超级应用已经在上一代技术革命中达到了很高的水平，留给后来人创新的空间已经不多。想要通过大模型在这些领域实现进一步的突破，变得非常难。

ChatGPT的出现标志着通用人工智能的一次大爆发。在通用人工智能时代，一个模型可以处理各种任务，这使得许多细分领域的创新空间被压缩。以前，每个细分赛道都有机会诞生超级应用，但现在这种可能性大大降低了。

我举个例子，机器翻译并不是大模型时代的新现象，早在12年前神经网络革命开始时，机器翻译就是首批受到影响的领域。结果，像百度、谷歌这样的大公司都把机器翻译服务做成了免费产品。一旦一个领域变成了免费或低价，创业的空间就大大减少，甚至可能扼杀整个产业。类似的情况也出现在大模型普及之后，比如Jasper。在ChatGPT出现之前，大模型刚刚兴起，那时业内人都知道GPT-3。Jasper利用大模型的能力，将其包装成可以帮助人们进行写作和生成各种文案的工具，吸引了一批客户。

随着ChatGPT等通用大模型的崛起，Jasper的优势逐渐消失，开始走向衰落。ChatGPT不仅仅是一个超级应用，它通过人机对话的方式，实际上已经成为一个超级的超级应用，它超越了传统的界限。通用大模型现在能够处理语言、知识，甚至多模态内容，如声音、语音、音乐、图像和视频。这种广泛的能力使得通用大模型在很多领域都占据了主导地位，甚至挤压了其他一些赛道的生存空间。

作为投资人或创业者，在寻找发展方向时，需要经常思考一个问题：我现在所在的领域或开发的App是否具有持久的竞争优势？虽然可能暂时吸引一些客户并满足部分需求，但如果我的项目挡在这个大模型自然扩散能力的路上，那么我可能就难以扩大规模，最终可能面临像Jasper那样的衰退命运。

这就是大模型的能力如此之强，被寄予很高的期望，结果在真正落地应用的时候，才发现原来有很多限制条件在，其落地不像我们想象的那么平滑。一方面，上一代技术已经相当成熟；另一方面，大模型本身还在不断发展，其通用能力可能已经覆盖了我目前专注的领域，限制了我的发展空间。因此，大家普遍发现将大模型落地应用是一件相当困难的事情。

我曾是大模型的热烈支持者，也是在中国最早推广大模型的人之一。我非常激动，因为在我的NLP职业生涯中，从未见过如此革命性的变化。大模型的出现，彻底改变了NLP行业的格局。但实际应用起来，我发现它比我一年多前想象的要困难得多。

在NLP领域，过去我们有机器翻译、对话系统、问答系统等多个专业方向，甚至还有分词这样的细分技术。但大模型的出现，就像翻越了语言的大山，统一了这些不同的赛道，建立起了一种类似圣经中巴别塔的通用语言能力。

现在，大家都在期待大模型原生的超级应用（LLM Native Super APP），虽然呼声很高，行业内竞争激烈，但真正能够规模化落地并盈利的，目前还只有像ChatGPT、豆包、文心一言这样的应用。

简而言之，这种超级大模型正逐步深入社会的各个层面。然而，除了它之外，我们还没有看到其他大模型实现规模化落地，更不用说产生广泛影响力了。

目前的情况是，无论是行业内外人士、投资者还是创业者，都对大模型的技术潜力广泛认可，但要找到它的market fit并实现规模化落地，可能需要至少两三年的时间，现在还处于技术落地的难产期，也是突破期。

大模型虽然功能强大，但也存在一些问题：第一，信息准确性问题：由于学习了大量信息，大模型可能在记忆不精确的细节时出现错误，导致其输出内容不准确。第二，可控性问题：与以往的符号逻辑AI不同，大模型包含数千亿参数，运作起来像一个黑箱，难以进行精确的调试和控制。第三，安全性问题：大模型可能存在安全隐患，需要进一步关注和解决。第四，算力成本问题：尽管随着技术进步，算力成本有望降低，但与上一代应用相比，使用大模型的应用在算力成本上仍然相当高。

尽管技术上已具备条件，但要普及到大众市场，我们发现推理成本过高，可能无法通过盈利来覆盖这些成本。这直接影响到盈利能力。

这听起来有些悲观，但从长远来看，特别是在接下来的三到五年内，尽管垂直领域尚未迎来大爆发，但许多人正在积极探索。今天上午座谈会的嘉宾们也在分享他们如何将大模型技术应用到自己的领域。这些努力最终将取得成效，预计在未来几年内，垂直领域将会迎来显著的发展和突破。

大模型的研发成本高昂，这对创业公司来说是个挑战，而且模型与产品之间的脱节也是一个主要问题。我们目前正在探讨如何将模型与产品有效结合，以克服这些困难。接下来，我将分享我们在这方面的探索和经验。

模型开发可以选择自主研发或使用第三方服务，这取决于产品的具体需求。目前市场上竞争激烈，第三方服务往往价格低廉，更具成本效益。但如果产品需要高并发处理能力或有特定的定制化需求，第三方服务可能无法满足，这时自主研发就显得更为重要。

这就需要探索如何将模型开发与产品需求紧密结合，以实现成本控制和产品定制的灵活性。这包括调整大模型以适应我们的产品需求，实现最优的产品模型结合。

然而，产模结合说起来容易做起来难。因为模型开发和产品开发是两个不同的领域，涉及的人员背景和思维方式各异。要让这两类人员有效协作，发挥出最大的协同效应，对许多公司来说都是一大挑战。

我们开发了自己的大模型，名为"序列猴子"，基于此，我们推出了多模态AIGC产品，涵盖数字人产品“奇妙元”、AI配音产品“魔音工坊”和AI短视频一键生成工具“元创岛”等。此外，我们还成功推出了“魔音工坊”海外版产品"DupDub"。"魔音工坊"是我们在市场中占据主导地位的产品，尤其在抖音平台上，约70%的声音内容都使用了我们的技术。

我们的目标客户群体包括内容创作者（ToPC）和小型至中型媒体企业（ToSMB）。内容创作者愿意为方便他们工作的工具付费，而我们正是为他们提供这样的服务。对于ToSMB客户，我们专注于为小企业提供标准化解决方案，因为大型客户的定制化需求较为复杂，不易操作。目前，我们拥有86.5万付费用户，这证明了我们的服务已经成功落地并得到市场的认可。