本报记者 袁传玺
随着AI(人工智能)技术的飞速发展,大模型已成为全球科技领域竞争的新高地以及未来产业的新赛道。同时,凭借大规模参数量和强大的计算能力,大模型在自然语言处理、图像识别、推荐系统等多个领域展现出巨大的应用潜力。
据了解,在AI大模型的商业化道路上,“To B或To C”一直是两难的选择。而就目前市场格局来看,虽然C端(消费者市场)潜力巨大,但大模型在B端(企业服务市场)的商业化应用却率先取得显著进展,曙光初现。
百度集团执行副总裁、百度智能云事业群总裁沈抖表示,AI应用正率先在B端爆发,由企业级大模型工程平台、异构算力平台组成的新型AI基础设施,将替代传统云计算,为大模型应用在企业生产力场景中的规模落地提供关键支撑。
大模型厂商为什么会选择加码B端投入?B端发展有哪些困境与挑战?如何看待大模型产业的投融资环境?
B端市场商业逻辑初具雏形
虽然C端市场用户基数大,机会更多,但由于功能单一等因素,导致消费者对于大模型的付费意愿并不强。而B端市场在大模型应用方面展现出了更大的潜力和商业价值,多家初创企业的商业化模式也逐步得到验证。
例如,2024年前三季度,北京智谱华章科技有限公司在B端和G端(指为政府,包括事业单位开发的产品)的大模型中标数量和金额位列国内大模型行业前三;北京中科闻歌科技股份有限公司(以下简称“中科闻歌”)凭借在金融、政务、媒体等多个领域的深耕,已形成了完整清晰的商业模式。
北京零一万物科技有限公司创始人李开复向《证券日报》记者表示,公司专注于做有利润的、非仅卖模型或项目制的B端业务。李开复说:“公司从一开始就选择发力国内B端市场,探索将数字人应用于零售、餐饮等领域,目前公司已能够提供完整的解决方案。”
由此可见,B端市场目前的商业逻辑已初具雏形。B端企业更愿意为大模型产品付费,最主要的因素是其能够直接提升业务效率、降低成本,并增强竞争力。中科闻歌董事长王磊向《证券日报》记者表示,在面向企业决策应用场景时,依托多智能体协同技术,结合工作流、数据流、决策流,AI大模型能帮助企业在复杂商业环境中实现智能决策,为长远战略发展提供支持。
相较而言,B端商业模式开发难度也小于C端。在B端付费意愿更强的背景下,大模型初创企业更加注重B端的投入力度,以求拥有持续的盈利模式。
高质量数据稀缺带来挑战
业内普遍认为,算力、算法、数据是大模型发展的关键三要素。近年来,基于计算能力的提升、大规模数据集的可用性以及算法的改进,AI大模型在B端市场进入了爆发增长期。
同时,大模型领域也出现了亟须打破的瓶颈。目前,高质量数据资源越来越稀缺,大语言模型规模越来越大,参数甚至高达万亿级别,动用一次训练所需要的资金、人力和稳定性能源也愈发昂贵。
相比于算法和算力,在大模型商业闭环中,数据成为最直接影响其在垂直行业落地效果的关键。高质量数据是训练和优化大模型的基础,没有足够的高质量数据,大模型就无法学习准确、丰富的知识,进而无法生成逼真、有创意的结果。高质量数据的短缺不仅影响了大模型的训练效果和应用性能,还增加了企业的运营成本和时间成本。例如,在自动驾驶领域,为了获取高质量的路况和天气数据,企业需要投入大量的人力和物力进行数据采集、标注和清洗。
猎豹移动董事长兼CEO傅盛向《证券日报》记者表示,在“百模大战”中,算力和算法这两个点上很难做出差异化,产业链里决定大模型基础能力的核心是标注后的数据,当下行业的重点在于如何将高质量数据找出来,与应用实现高度结合。
据Epoch AI Research研究团队预测,到2026年,现存的用于AI模型训练的高质量语言数据将耗尽。信息技术研究和分析公司Gartner发布的研究报告也提到,到2030年,合成数据将成为AI模型的主要训练数据来源,而在此之前,高质量数据的短缺将是一个长期存在的问题。
为了应对高质量数据短缺的挑战,企业和科研机构正在积极探索解决方案。在数据集成方面,蚂蚁集团旗下蚂蚁数科推出的AI数据合成与生产平台AIGD,可以通过大规模合成互联网所覆盖的高质量、高价值垂直语料数据,帮助科技厂商进行AI模型训练。在数据的清洗和标注方面,北京猎户星空科技有限公司联合北京聚云科技有限公司研发的AI数据宝AirDS可为B端企业提供大模型数据收集、清洗、标注、提示词工程以及评估服务;中科闻歌数据工程则通过整合开源数据和企业内部数据,进行数据资产管理,并运用一站式清洗工具,将原始数据转化为高质量数据,实现AI训练数据供给。
“尽管面临着高质量数据短缺的挑战,但大模型B端的发展前景依然广阔。企业和科研机构需要持续加强合作和创新,共同推动高质量数据的发展和应用,为AI技术的进一步发展奠定坚实基础。”艾媒咨询CEO张毅向《证券日报》记者表示。
投资领域更加细化
在资本市场,AI大模型仍是目前的热点,国内的投融资活跃,但与早期的投资热潮相比,当前投资人的态度更为理性。
中商产业研究院公布的数据显示,2023年1月份至10月份,国内AIGC(人工智能生成内容)行业累计发生投融资事件122起,涉及金额178.62亿元。2024年同期,该行业发生投融资事件101起,同比下降17.21%;涉及金额309.8亿元,同比上升73.44%。
“经过两年的发展,投资行为逐渐从‘广撒网’转到‘在重要细分领域和重要标的上下重注’的阶段。”未可知人工智能研究院院长杜雨向《证券日报》记者表示,AIGC的技术和产品迭代速度确实超出了很多投资人的意料。对待诸多不同方向的项目,投资人需要更谨慎地思考和推演市场变化趋势。
在投资整体趋于理性的背景下,投资要求变得更高,投资领域更加细化。投资人更加看重能够持续推动技术进步、构建独特技术体系的企业;对于大模型企业的商业化路径和盈利能力也提出了更高要求:希望企业能够明确其产品或服务的市场定位,制定出可行的商业化策略,并展示出稳定的盈利能力。
但丁投研创始人陈达向《证券日报》记者表示:“到了把投资做细的时候,投资人就会越来越注意技术是否有创新性壁垒、适用场景是否切合市场需求,以及是否有清晰的商业化路径和行业垂直化应用前景。”
同时,随着大模型技术在金融、医疗、教育等细分领域的应用逐渐深化,投资人更关注能够将大模型技术与边缘计算相结合,提供高效、低延迟服务的企业,或者在多模态领域具有技术积累和创新能力的企业。
在具体投资赛道方面,招商银行研究院发布研报称,随着大模型对算力需求急剧增加,全球互联网巨头纷纷加大对AIGC基础设施的投资。GPU系统、HBM存储和高性能网络基础设施在AIGC计算中发挥着关键作用,成为硬件基础设施投资的主赛道。
杜雨表示,移动互联网革命曾经推动了智能硬件的蓬勃发展,当时的智能硬件主要实现了“联网”功能,尚未达到真正的“智能化”,而当前的AI技术能够赋予硬件实现真正的智能。穿戴式AI设备、具身智能机器人等方向,近期都获得了不少投资人的关注。
有话要说...