作者丨巴里
编辑丨信陵
题图丨昆仑万维CEO 方汉
8月30日,由创业邦主办的2023AIGC技术应用大会在深圳举行。本届大会以“元载万物·智启新界”为主题,旨在聚焦AIGC技术的创新应用,打造深入探索AIGC产业落地的交流平台。
在不久前的8月23日,昆仑万维发布了国内第一款融入大语言模型的搜索引擎——天工AI搜索。这也是继今年4月17日发布“天工”大模型以来,昆仑万维在该领域的又一重要探索。
大会期间,昆仑万维CEO方汉围绕公司在AI大模型商业化的探索以及AI搜索的更多细节进行了深入分享,精彩观点如下:
1.如果要把AI搜索作为一个可信的生产力工具,我们只要切中用户需求、给用户提供价值,用户就一定会使用;
2.未来各家大模型在B端的竞争在于,哪家能够率先在付费能力强的行业中抢到更多的落地合同;
3.最终AI一定会重塑全新的商业模式,一定会出现巨大的红利,并且凭借这个商业模式获得极大成功的企业会长期存在。
作为一家出海互联网企业,昆仑万维不断地在寻找第二曲线。
“从Grindr到StarMaker,从Opera到GX Browser,尽管昆仑万维已经在海外孵化了大量的千万DAU级别的产品,但仍然希望借助AIGC这一波浪潮,能够做出一款以亿为单位的DAU产品。”方汉说道。
因此,昆仑万维从2022年就提出了“All in AIGC”的战略规划。相比此前的VR和元宇宙,公司当时判断AIGC作为第二曲线是一个更加靠谱的方向。
融合8年技术积累定位于生产力工具
方汉表示,对于拿搜索引擎当生产工具的人,就是我们的目标用户。
首先,天工AI搜索能够帮助用户降低搜索成本,无需用户再记住搜索引擎大量的规则就能更好地获取到最真实的数据。
其次,在交互上,用户能够直接使用自然语言交互,天工AI搜索就能给出用户正确的答案,而且所有的答案是有信源的。
那么,为什么昆仑万维敢做AI搜索?
实际上,昆仑万维旗下拥有一款千万级DAU、面向全球十余种语言市场的新闻推荐产品——Opera News,已经成为了非洲用户规模最大的新闻客户端。
而要做新闻推荐,第一步就是要做搜索引擎,昆仑万维已经通过Opera News产品,在数据抓取、数据清理等搜索引擎技术上拥有了5年的技术积累。
在2020年,昆仑万维开始建立团队投身于GPT3大模型研发。
“前段时间有人怀疑我们大模型是套壳,我们觉得冤枉透了。3年前,市面上并没有任何开源模型,即便是想抄都没得抄。”方汉说道。
去年12月,昆仑万维在国内第一家开源了140亿参数的中文大模型,据介绍其大量数据都是通过自建引擎进行抓取和清理的。
因此实际上,这5年的搜索引擎与3年的大模型技术相结合,也就是通过这8年的技术积累,才让昆仑万维有了敢于做AI搜索的底气。
方汉也深刻地感觉到,如果要把搜索引擎作为一个可信的生产力工具,我们只要切中用户需求、给用户提供价值,用户就一定会使用。
例如,网易的一款给英文论文润色的工具就做到了800万用户,其原因就是因为定位极其精准,瞄准了写论文的用户,而又没有其他竞品。
因此,他希望,天工AI搜索能够成为一条鲶鱼,刺激整个市场格局已经很久不变的搜索引擎市场。也只有当该领域所有的公司都跟进AI搜索时,用户才能够享受到更好的搜索服务。
在盈利模式上,信息流广告是任何一家搜索引擎公司都无法回避的。由于AI搜索给用户返回出来的是精准的知识,对用户喜好的了解程度会达到前所未有的深刻。
方汉进一步说到,特别是我们打造AI搜索的目标是成为一款生产力工具,对于行业广告来说可能会更有价值。因此,除了传统的信息流广告,AI搜索也可能会诞生出一些比信息流更高效的广告形式,但具体形式在现阶段还很难预测,只能不断摸索。
加入产品经理个人习惯却意外爆火
实际上,AI搜索从产品立项到完成仅花费了半年时间。
方汉指出,之所以能够在半年时间研发出一款AI搜索产品,一方面得益于研发团队的高效执行力,另一方面得益于创始人周亚辉对于行业趋势的超前预见性。同时,从立项到现在的半年时间里,我们对于产品的思考逻辑一以贯之,坚持做C端,并且要做端到端的内容生成工具。
在这个过程中,最重要的在于昆仑万维在搜索引擎和大模型的技术积累。
据介绍,爬虫集群、Rank模型等搜索引擎技术都是现成的,在大模型底座上,训练语料也是公司自己所积累的,因此在调教大模型往AI搜索上转就会相对容易。
而产品化的难点就在于如何将其与大模型集成起来,让大模型能够赋能这些搜索结果,并将搜索结果再整理成用户愿意阅读的知识。
例如,信源功能就是天工AI搜索最为独特的功能之一,而这个功能则来自于一位产品经理的个人习惯。
研发团队中有一位产品经理经常会在网上与别人辩论,但却很难有人能辩得过他。其原因就在于,这位博士学位的产品经理,将他写论文的习惯也用到了辩论过程当中,会把所有引用的数据一一列出,并且都是引自官方权威的信源,这就让别人无法跟他争论。
因此,他就建议产品要加上信源功能。谁知在测试过程中,用户非常喜欢这个功能。无一字无出处,这对于很多把搜索引擎当生产力工具的重度用户(例如科研、投资、媒体行业等)来说是尤其重要的。
截图来自天工AI搜索官网
那么,对于AI搜索来说,加入信源功能的好处是什么?
系统可以将这些信源做排序,将一些优先级高的信源放在前面,保证了结果的权威性和准确性。因为光靠大模型并无法代表权威性,但如果内容引自新华社、人民日报等官媒就完全不同了。
可以说,这是一个将科学家的使用习惯放到大众产品里的典型例子。
此外,我们知道,大模型会编造不正确的答案,产生“幻觉”。
对于大模型最常见的幻觉问题,天工AI搜索在输出的过程中,会针对一个问题进行大量的网页搜索。通常,排在前5页的搜索内容肯定是相对权重较高,也相对可信,因此系统会将这些网页根据一定的规则,用多种方法反复问大模型2-3次,再输出最终结果。
并且,系统会将搜到的网页作为提示词还给大模型,让它根据这个来推断,这样就可以彻底杜绝幻觉的可能性。
方汉谈到,搜索引擎和大模型结合是非常重要的,否则谁都无法彻底解决大模型的幻觉问题。
AI未来将会重塑商业模式“落地为王”最为关键
据悉,昆仑万维的天工大模型在国内会同时推动在B端、C端的落地。
方汉表示,作为一家互联网公司,昆仑万维将大模型落地C端是最容易的。在B端,昆仑万维会优先布局金融、能源、新材料、医疗等付费意愿更强的行业。未来各家大模型在B端的竞争在于,哪家能够率先在付费能力强的行业中抢到更多的落地合同。
而昆仑万维的优势就在于,旗下拥有一家产业资本(CVC)公司——昆仑资本。据悉,昆仑资本其投资组合涵盖了创新药、新材料、新能源、企业服务等赛道,投出了映宇宙、达达、追觅、竹云、小马智行、科亚医疗等明星企业。
可以说,昆仑万维既对这些垂直行业有着深度理解,也可以将其大模型优先从被投企业中开始落地。
今年8月,昆仑万维就官宣与映宇宙(前身为映客)集团母公司北京蜜莱坞网络科技有限公司在AI大模型业务方面达成合作,向其输出AI文本生成能力、AI图像生成能力。
方汉介绍说,作为一家视频平台,映宇宙非常关注内容生成工具,它也非常担忧AIGC会将自己的商业模式颠覆掉,但是从时间成本和资金成本上来说,自己做大模型又不现实。因此,映宇宙和昆仑万维这样有大模型能力的公司合作,共同探索基于AIGC全新商业模式的落地就显得非常重要。
在B端,大模型还有着更加丰富的商业想象空间。
在方汉看来,所有强序列化文本数据需求的一定是会最快应用的行业。例如,在投资机构中日常看财报、写报告的工作完全可以由大模型来替代。
又如,需要大量人工筛选的行业。以昆仑资本投资的一家钙钛矿太阳能电池公司为例,其核心就是要使用新材料替代现有的硅基太阳能,因此就需要在几百万种化合物中挑选出有效的化合物。
尽管他们有一套理论可以将几百万种的范围缩小到几十万种,但仍然属于“撞大运”,这无疑会拉长整个研发周期,但如果能够让大模型把这个数据学懂,就能够将这几十万种再缩小至几千甚至几百种的范围,对于这家公司来说就是一种效率上的极大提升。
所以,只要这个行业有相应的规模化、序列化的好数据,那么其落地会非常快,特别是对于需要消耗大量生产时间和人力成本的行业,引入大模型之后会迅速改变。并且,一旦行业中引入AI,就会造成降维打击。方汉指出。
例如,在电商行业,原来制作一张商品图片成本大概为500元/张,而现在全部由AIGC生成也许连5分/张的成本都不到,未来所有的电商模特、摄影师几乎都会面临失业。未来可能只有奢侈品品牌才会请摄影师实拍,而普通商品无一例外会全部沦陷。在法律服务行业,借助AI可以快速生成法律文书,而律所里的实习生可能还没有AI写得好。
方汉认为,从互联网和移动互联网的逻辑来看,最终AI一定会重塑全新的商业模式,一定会出现巨大的红利,并且凭借这个商业模式获得极大成功的企业会长期存在。
他相信,这两年会成立最伟大的公司,对于所有公司来说机会是均等的,同时希望我们也能够成为这样的大公司,成为伟大公司的一员。
最后,对于所有创业者,方汉给出了4个字的建议:落地为王。“在当前的经济环境下,想拿到投资并不容易,因此创业者就需要认真思考自己的产品到底能不能帮助用户赚钱或者省钱。”
方汉在大会上作了题为《昆仑万维大模型商业化之AI搜索》的演讲,以下为演讲内容整理:
前瞻布局天工智能六大AI业务矩阵
我自1994年开始从事互联网工作,是上一波互联网和移动互联网大潮兴起的见证者,目测也将是未来这一波AI大潮兴起的见证者。
众所周知,第一波最伟大的互联网公司诞生于1997-2000年,第一波最伟大的移动互联网公司成立于十年前,我坚信这一波AI大模型浪潮中的伟大公司肯定是在这两年诞生。在座的创业者都有机会成就下一个十年最伟大的公司。
昆仑万维作为一家A股上市公司,目前旗下包括AGI与AIGC、海外信息分发与元宇宙、投资等三大业务板块。目前海外收入占比达83%,全球平均的月活用户近4亿,我们是一家典型的以C端为主的出海企业。
作为一家出海企业,昆仑万维为何会投身到大模型的赛道?
首先,我们一直在努力地寻找第二曲线,我们在海外孵化了大量的千万DAU级别的产品,从Grindr到StarMaker,从Opera到GX Browser,我们在海外拥有极其丰富的孵化UGC平台的经验。
其次,2020年GPT3发布时我们深刻地认识到GPT3在文本生成领域绝对是当时最领先的产品,所以就立刻组织团队投身于GPT3大模型研发。2021年我们已经训出了140亿参数的中文大模型。去年12月15日,我们正式发布“昆仑天工”AIGC全系列算法与模型;今年4月17号,我们就正式发布了国产大模型“天工”。8月23日,我们也正式发布了我们的第一个C端产品——天工AI搜索。目前我们天工智能有六大AI业务矩阵。
AI大模型是我们整个AI业务矩阵的基石,在 AI大模型基础上我们面向B端和C端,布局了五大业务板块。AI搜索,它将AI底座大模型与搜索引擎相结合,通过高频应用切入;AI音乐、AI动漫以及AI游戏,是我们给创作者提供端到端的内容生成工具,让用户在没有任何技术背景跟前序专业知识的情况下,都可以使用端到端的生成工具来生成普通用户最终可消费的内容。
AI游戏与AI社交,我们认为它们本质上需要一个智能的NPC作为技术底座。我们都知道游戏无外乎世界观、人物、剧情,人物这一块是重中之重,AI介入之后,我们可以创造出比以前所有策划的NPC更加智能的NPC。这一点我认为与3D引擎一样,必然重塑整个AI游戏领域。
AI社交则是另外一个逻辑。当前绝大多数免费用户是无法在社交产品里享受到应有的服务,因为1V1社交服务的成本相当高。一旦AI介入,我们可以极大地降低社交上的情绪供给成本。我们认为这也是一个极佳的发展方向。
我们“天工”大模型的技术底座非常坚实,目前支持万字以上的文本对话,也能实现20轮以上的问答交互。我们采用双千亿参数的大规模结构,具有智能涌现能力。
我们在大模型的三要素(算力、算法、数据)上有长期并且深厚的积累,以我们开展大模型的经验看,大模型落地最难的是什么?其实是数据。
我们需要把万物以及所有问题转化成大模型可以理解的数据,才能让其具备智能涌现能力。各行各业要落地大模型,本质上是把各行各业的非标数据转成大模型可理解的数据。如果某个行业已经具备了这种数据的话,那么大模型在这个行业的落地就会非常快;如果没有,我们必须花很大的精力去重新整理数据,所以数据的清洗能力以及转换能力非常重要。
用AI重塑传统搜索体验
国内搜索引擎市场份额可能已经有十几年没有发生任何变化,我们为何还要研发AI搜索产品?
就如同AI支持的新闻分发平台今日头条颠覆传统的新闻门户新浪新闻的逻辑一样,AI搜索实际上对于现有的搜索是另外一个维度的产品,我们认为搜索的下半场一定是AI。
首先,传统搜索提供的是海量信息,如果用户没有掌握大量的搜索技巧,比如使用搜索引擎的格式化语言,将无法使用搜索引擎达到个性化目的。
例如,我用传统搜索时会使用到一些独特的技巧,输入的关键词要比一般人多,会用file这个函数来指定文件类型,会用site这个关键词去指定单独的网站进行搜索;我会想方设法把一个关键词用英文翻译成七八个同义词去搜索。
用户如果不会使用这些特殊的搜索技巧,其结果如何?大多数用户用传统搜索得到的信息质量很差,并且广告多、信源复杂、真假难辨。但在ChatGPT出现之后,我们认为传统搜索的技术奇点时刻已经到来。程序员的最大的问答社区Stack Overflow,在ChatGPT出现之后整个流量急速下跌,背后的原因是用户都改去使用ChatGPT了。目前美国90%以上的大中学生使用ChatGPT做作业,而不去谷歌搜索上去搜作业的答案。这就是我们认为传统搜索在很大程度上一定会被 AI搜索所取代的原因。
微软在接入ChatGPT的时候做了一件很重要的事情,就是把AI嵌入它的搜索引擎,给用户提供服务。而我们天工AI搜索是国内第一款融入大语言模型的搜索引擎。
我相信在座的诸位懂得用file、site这样关键词搜索的人非常少,但是当你在使用ChatGPT时,完全可以用任何自然语言甚至语音直接去交互,它一定能够很轻松地告诉用户答案,不需要用户再想方设法的去搜关键词,或者是想方设法把它转换成英文的提问。
天工AI搜索实际上是一种深层次搜索,用户可以获得有效的组织和提炼后的答案,不再为冗余信息浪费个人时间,直接获得有效信息。比如,“笔记本要不要一直插电用?”之类的问题,天工AI搜索会直接给用户一个相对可靠和信服的答案;
针对“电车会比油车省钱吗?”的问题,天工AI搜索也会把所有的答案都搜索出来,并且在总结我们认为靠谱的答案之后会生成一个最终答案。
传统搜索提供的是海量的信息,AI搜索为用户提供的是精准的知识,而且天工AI搜索具有“追问”的功能,让用户可以就一个问题不断地追问20轮以上,例如,在提问“核污水会变核污雨吗?”之后,天工AI搜索除了给出答案,还会提供3个追问,其中包括“核污水的处理跟处置方法有哪些?”,让用户继续获得答案。
如此用户可能在一开始并不知道自己想要什么,但通过这种追问,能够更轻松地获得所需的知识。
此外,天工AI搜索能够为用户提供更个性化的答案。例如,用传统搜索引擎搜“9月份去西双版纳玩4天,规划路线”,一般如果是在网页上去搜索,如果此前没有相关信息沉淀的话,用户无法获得直接、有效的答案,但天工AI搜索可以总结出来个性化答案,假如把9月份换成8月份、7月份、6月份,AI搜索都能给出相应的个性化答案。
我们还实现了追溯、可考证、可信赖,所有答案的信源都有复杂的算法和相对可靠的验证,所有答案每一个重要条目之后都有相应的引用,信源的权重还不一样,这一点有助于用户去索引信源,保证答案可追溯、可考证、可信赖,对于用户而言这一点非常有价值。
天工AI搜索还实现了可查阅回溯以及可分享的功能。我们把用户的每轮次的搜索结果都保存在天工的应用内,便于随时查阅回溯,还可以一键分享给他人。
这是我们天工大模型在国内第一个面向C端的商业化产品,而我们的AI音乐和AI游戏、AI动漫的产品也在海外市场测试中,应该在今年和明年初都会逐步推出。
大潮将起,落地为王。对于所有创业者而言,我个人认为最难的不是构想出一个新的产品模式,或者研发出一个独一无二的技术,而是寻找到一个合适的市场切入点让公司更加健康的活下去,也就是所谓的“落地为王”。
最后,祝愿所有的创业者十年后都能做出一家伟大的公司。
更多活动大会一手信息,欢迎加入创业邦会员,现场聆听一线投资人、头部企业家精彩分享,掌握最新创投趋势!