如何把商业交给大模型?京东科技何晓冬:需要更严肃地把大模型“幻觉率”降下来  第1张

  从谈参数、谈技术,再到谈协同、谈应用,百模大战初始的狂热开始变得冷静,今年,大模型公司们明显变得更加务实、实际,市场也逐渐回归理性。

  7月30日,京东云对外发布了一系列产品,包括企业大模型服务、言犀智能体平台、智能编程助手JoyCoder、言犀数字人3.0等。《每日经济新闻》记者从京东云方面了解到,目前在京东内部,有100多个AI场景,以及35万自有配送员、23万商家和2万采销都被大模型的应用覆盖。

  无论是否拥有产业一侧的基因,大模型都开始在不同场景更实际地落地,大模型公司们也从参数和技术的比拼,来到了商业生态之上,端到端产品的较量。比如,今年以来一些云厂商开始聚焦AI PC的落地,谈起具身智能的前景等。

  不过,在产业应用之前,大模型依然有很多待解的难题。京东探索研究院院长、京东科技人工智能业务负责人何晓冬认为,想在更多产业侧应用落地,其一就是需要更严肃地把大模型的“幻觉率”降下来。

  也就是说,在答错“13.8和13.11哪个数字大”,生成视频画面变形扭曲严重之时,你都还无法将自己的商业交给大模型。

  谈数字人直播:

  正在超越80%真人主播

  清华系大模型公司生数科技,今日(7月30日)在全球范围上线视频生成模型Vidu,全面开放文生、图生视频能力。Sora之后,从快手可灵到如今的Vidu,国内视频生成大模型惊喜不断。

  不过,何晓冬指出,目前视频生成大模型产品的幻觉率普遍还是很高。他举例Sora的“漫步在东京街头的女子”这则视频,虽然整体视频效果栩栩如生,但仔细观察会发现,视频中人物在行动时,左右脚交替时有扭曲的痕迹。

  “这当然是瑕不掩瑜,也不能说这个技术不惊艳,但想把这种技术应用到商用场景下会出现很多问题。”何晓冬如此解释。

  这一点体悟来自于4月数字人刘强东直播带货的时候。当时刘强东数字人连续直播了4场,场观都在千万级以上,但同时引发的关注和争议都很多。比如,采销东哥数字人是否“一眼假”?形态、动作和口音的拟真程度有多高?当然,也有数字人马云何时出现的有趣讨论。

  在当下直播电商爆火的时代,主播其实是“稀缺品”,特别是跑出来的大主播,其实对其气质形象、直播内容和产品服务的介绍专业度等都有着很高很复杂的要求。

  “在过往的产业实践中,通过一些有效的效果转化指标,我们能看到数字人直播已经可以达到真人主播的均值。”何晓冬认为,数字人直播除了需要具备零幻觉之外,还要有零样本、大姿态和超写实等几个特性,做到真实、高效和可控。

  不过他也指出,数字人直播要做的不是替代20%的优质主播,而是希望通过更个性化的角色和丰富的玩法,覆盖80%需求还没有被满足的品牌。

  今年“618”,数字人刘强东爆火后,董明珠等也在京东云定制了数字人形象并上播。除直播外,数字人还活跃在文旅导览、智能导购、金融客服、个人助理、政务咨询等业态中。

  谈具身智能:重点聚焦服务型机器人

  前几天,香港投资管理有限公司正式宣布投资具身机器人公司“银河通用”,投资金额未披露。其实不久前,银河通用才刚宣布完成天使轮融资,总规模7亿元人民币,投方包括蓝驰创投、北汽产投、美团战投、商汤国香基金、启明创投、经纬创投、源码资本等一众明星机构。

  具身智能是一个涉及人工智能、机器人学和认知科学的跨学科概念。它主要研究如何使机器或系统能够通过身体(物理形态)与环境进行交互,从而实现智能行为。简单来说,其中的一种应用就是,系统通过执行器(如机械臂、轮子等)对环境进行物理操作,实现移动、抓取物体等行为。

  这自然也成了大模型及其相关技术产品一次更前沿的外延性应用和尝试。银河通用联合创始人姚腾洲透露,银河通用首款具身多模态大模型机器人Galbot率先应用在零售业完成上货、取货及盘点等工作任务,后续会探索社区养老、家庭服务等场景。

  何晓冬在谈及具身智能时认为,具身智能是数字人走向物理世界的载体。而智能体、数字人、具身智能又是未来大模型与终端用户的核心交互介质。记者注意到,京东探索研究院不久前发布了国内首个双臂移动机器人操作数据集JD ManiData。

  在谈及最新研究时,何晓冬透露,在基础模型上,团队正研发多模态具身智能的基础模型,让机器人的执行效率更高,动作更流畅。重点则是聚焦在服务型机器人产品上。

  “在端侧上我们也基于模仿学习,迭代端侧多技能操作能力,在指令驱动下可以完成不同操作任务,为的是可以做到更高价值的应用。”

  伴随大模型而来的AI、机器人浪潮不断席卷资本市场。

  这也不难让人联想到,继去年12月数千万元A轮投资后,前几日,京东2亿元再度战略投资AI炒菜机器人公司橡鹿科技,目的是探索“机器人+”产业,在端侧做更多AI、大模型技术的尝试。

  谈Scaling Law和价格战:

  只提升模型规模,天花板并不远

  今年5月,OpenAI推出了GPT-4o,并宣布了免费试用政策,API调用的价格也比GPT-4-Turbo少了一半。大模型市场价格战正式打响。7月18日,OpenAI推出最具成本效益的小模型GPT-4o mini。据OpenAI介绍,小模型产品是想通过显著降低AI使用成本,扩大AI使用范围。包括Meta、谷歌等科技巨头也纷纷推出最新产品,并在价格上无一例外地开卷。

  国内大模型价格战也被点燃。5月6日,大模型公司DeepSeek深度求索宣布将输入价格降至1元/百万tokens。随后,字节跳动的豆包大模型、阿里巴巴的通义系列模型以及百度的文心一言模型等纷纷跟进,均采取了降价策略。

  何晓冬认为,价格战在短期内的确可以带来繁荣,但长期来看并不见得是件好事。“很可能连电费都付不起。”他坦言。

  最直接的影响在于,短期内,价格战有助于大模型在B端、C端等市场层面的普及。但牺牲短期利益,是否可以实现长期的用户价值,实现规模化的应用,最终推动技术成为基础设施,这还需要打个问号。

  何晓冬说:“我们看到一方面大模型技术在飞速发展,但目前也面临一些问题,首先就是Scaling Law(规模定律)。由于数据和算力的持续限制,如果简单只是提升模型规模,看起来这个天花板其实并不远。某种意义上,我们的大模型从百亿到千亿再到万亿(参数)的增长,问题还是出现在其所带来的经济效益在何处。”

  因此,他判断,如果大模型带来经济效益不足以支撑大模型本身的成本的话,那么这个模式是难以持续的。他还坦言,大模型的商业化落地,现在目前看起来还是稍微有些落后,从中长期看起来,会成为一个问题。他觉得,产业和技术应该是互为驱动的。

  记者|王郁彪

  编辑|陈俊杰陈俊杰 杜恒峰