成本优势将造就AI产品中的“王者”

2025年初,DeepSeek的横空出世引发了AI世界的巨大震动,原因不仅是DeepSeek的高性能,更具颠覆性的是它极低的成本,打破了“烧钱堆芯片”的行业规则,让英伟达的市值一夜之间蒸发了4.3万亿元人民币,基于或接入DeepSeek的各类应用如雨后春笋般纷纷出现。此般情形已火热了近半年,不禁让人揣测在此次DeepSeek大潮之中,哪家的应用产品将被市场推崇成为“王者”?要想在此次大潮中成为“应用之王”,又需要在哪些方面具备独特的优势?

回顾互联网时代的“电商平台之争”与“百团大战”,真正在市场中站稳脚跟的都是兼顾了技术优势与成本优势的产品。最终投入市场商用的AI产品,归根到底是一种商业行为,获取利润是核心,因此模型的训练优化和部署成本将成为决定市场竞争成败的关键因素。由此可见,专注AI产品研发的企业目前不能仅关注AI的落地场景,也要开始关注AI产品的实施成本了。降低AI产品的实施成本,可以从以下四个方面考虑:

第一,根据应用场景需要合理调整模型参数,即:通过剪枝、蒸馏、量化等模型优化技术对模型做减法,减少模型参数量,从而降低成本。为什么要对模型做减法呢?这是因为模型的参数量越大,解决复杂问题的能力就越强,然而成本也越高。正如不是所有问题都需要DeepSeek满血版来回答一样,并不是所有应用场景都需要解决复杂问题,因此,如同“杀鸡不需用牛刀”,大部分简单的应用场景是需要对模型做减法的。然而,模型参数的减少必然会带来模型性能的下降,这就需要研发人员充分理解应用场景和需求,好好权衡成本与性能,选择最优的平衡点,简而言之——不用复杂的模型解决简单的问题,需要找到不多不少刚好能解决业务场景问题的模型参数量,按照这个参数量来调整模型,从而达到最优的性价比。

谷歌开发的MobileNet系列模型就是专为移动设备设计的轻量化模型。该系列模型正是通过模型优化技术,减少计算量,在智能手表、智能眼镜等计算资源有限的移动设备上实现了高效的图像分类任务。我们可以认为——通过优化技术减少参数量的模型是专注于解决一类应用问题的轻量化模型,虽然牺牲了一部分性能,但对于某类问题依旧能够胜任解决,而解决的这类问题正是产品的核心卖点。

第二,通过硬件的选择与优化组合策略,降低成本。AI在完成一个计算任务时,不仅需要使用GPU,还需要CPU和存储硬盘等硬件设备。GPU是目前单位性能成本最高的硬件,因此可以尽量多利用GPU之外的其他硬件来分担GPU的工作量,从而降低整体成本。譬如:加大存储设备的使用,存储大模型对历史问题的计算结果。当大模型面对全新的问题时,将问题进行拆分,从历史相关信息中提取一部分可复用内容,再与现场信息进行在线融合计算,进而降低计算量。举个例子,存储硬件保留了对“冰箱面板出现了E6字样是怎么回事”和“冰箱摸着很烫是出现了什么故障”两个问题的答案,当面对新问题“我家冰箱摸着很烫出现了E6,该怎么办”这个问题的时候,就无需100%的现场计算,而是通过存储记忆与现场融合计算的方式生成结果。这就是通过加大存储,从而降低GPU负担的组合策略。此外,还可以将来自存储、CPU、GPU的算力高效融合,多方组合进一步提升大模型推理性能,降低成本。

第三,通过对训练数据进行预处理与小样本学习等方式,降低对训练数据量和算力的需求。很多人都认为AI很智能,只要“喂”它足够多的数据,它就会自己学习和学会。这种方式不是不能达到训练目的,但因为计算了大量低质量的数据而浪费了宝贵的算力。针对这个问题,一方面可以先对训练数据进行预处理,清晰去重,优化数据质量,避免因为数据冗余或噪声导致的计算资源浪费。另一方面,采用迁移学习、小样本学习等方法,减少训练所需的数据量,从而降低对算力的需求,从而降低成本。换而言之,相比直接用大量未经处理的数据训练模型,用少量优质的数据来训练AI模型可以更低成本达成同样的训练目标。

这种降成本的做法,在医疗图像大模型的训练上比较常见。医疗图像数据的标注成本较高,且在此场景中仅需少量标注数据即可达到高精度,因此采用小样本学习方法(如Few-Shot Learning),利用少量标注数据训练模型,显著地降低了成本。

第四,在模型训练、部署与运维等环节,使用自动化工具,减少人工成本与试错成本。在模型训练开始前,需要人工设置影响模型训练过程的超参数(即学习过程的规则和条件),但人工的效率很低,使用自动化超参数优化工具(如Optuna、Hyperopt)可自动搜索最优超参数。在训练过程中,通过优化推理引擎(如TensorRT、ONNX Runtime)可以提高推理速度,降低计算资源消耗。在模型部署阶段,通过自动化工具(如Kubernetes、MLflow)可以实现模型的自动监控、更新和部署,缩短部署时间,减少人工成本。采用模型版本管理系统(如Weights&Biases、ModelDB),还可以避免因版本混乱导致的重复开发和测试成本。

综上所述,AI产品成本的控制可以从最优性价比参数选择、硬件组合、数据预处理和小样本学习、自动化工具的使用四个方面发力。随着AI产品的逐步商业化,成本的重要性将逐渐显露出来。正如低成本的优势使得DeepSeek可以采取开源的策略迅速扩大影响力和聚拢生态资源一样,性价比高的产品也必定更容易被市场广泛接受,找到适合自身AI产品的成本控制方法,就拥有了成本优势,有望在未来AI产品的市场竞争中一争高下。

(作者系清华大学硕士、美国杜克大学访问学者、浙江省可持续发展研究会ESG专委会专家组专家)

帮企客致力于为您提供最新最全的财经资讯,想了解更多行业动态,欢迎关注本站。
上一篇: “翻倍牛股”停牌核查!*ST亚振提示风险:收盘价严重高于要约收购价
下一篇:

为您推荐