优何软件 首页 软件资讯 其他 查看内容

百度,又行了?

2025-3-17 13:11| 来自: 优何整理| 发布者: 数码小编

百度在周末放了个大招,一次性发布了最新的文心 4.5 大模型和推理模型 X1。

我快速体验了一下,同时也跟一些做产品的朋友做了些探讨。

先说结论,我觉得这次百度没让人失望,不管是文心 4.5 还是 X1,都达到了现在能体验到的业界一流水平。

从官方放出的性能对比测试来看,文心 4.5 在很多方面都持平甚至超过了现在的主流模型,其中包括 DeepSeek V3 和 GPT-4o。


有朋友开玩笑说,百度又行了?

说实话,我觉得百度在技术能力方面其实一直都挺行,但是做产品和做营销差点意思。

可能你们不知道,百度在过去十几年时间里为如今的很多互联网大厂输送了高级技术人才。

虽然听起来有点唏嘘,但事实却是如此。

在 AI 技术储备方面,百度绝对是起了个大早,但是在产品输出上,百度也确实没赶上好机会。

在我看来,并不是技术能力不到位,而是把技术储备产品化的过程出了问题。

我横向对比了文心 4.5 和 X1 与豆包、DeepSeek、腾讯元宝、通义千问在各种任务处理和问答能力,虽然各有差异,但整体区别不大。

这也说明了另一个问题,现在大多数普通人在使用大模型产品时就跟我们使用 Word 去编辑文档一样,只用到了其中的一小部分能力。

说白了,模型能力对大多数人来说都是过剩的。

在对比测试上面说的那几个大模型产品时,我倒是发现了文心 4.5 胜出的一个场景。

我的需求,是让模型把我的一张照片所穿的蓝色衬衫换成棕色皮衣,原照片其实就是我头像的彩色版。

首先登场的是字节的豆包,它的结果至少初步达到了预期,但是在人物面部和皮衣细节上有点失真。


AI 生成的这张照片,有点像过度美颜后的感觉,而且皮衣袖子部分搞得像紧身衣一样。

接下来上场的是腾讯元宝,我选择的是腾讯自家的 Hunyuan 模型,出来的结果直接拉垮了,不仅把我变成了外国人,整个原图也都做了修改。


切换到 DeepSeek 模型后,因为不支持直接处理图片,它只告诉我如何用 PS 这类工具去修改。

然后是阿里的通义千问,和 DeepSeek 一样,都只返回了如何用工具去操作的步骤和过程,但并没有直接生成结果。


最后就是百度的文心 4.5 模型了,注意,我用的不是推理模型 X1。

在结果输出上,文心 4.5 直接给出了我想要的效果,不仅保持了我还是我,而且还给我穿上了棕色皮衣,甚至还提供了不同角度的照片效果。


还有一点让我比较意外,它竟然对我的发型做了优化。

有一说一,我觉得文心给我设计的发型比我的原发型要好看,这让我不得不考虑可以参考这个发型去理发店操作一下。

不吹不黑,经过 AI 的打造后,气质是不是一下就上来了?


我把这张 AI 生成的照片发给朋友看,大多数人都说帅,甚至有一种雷布斯风格。

在这个场景的需求满足上,只有文心 4.5 提供了我想要的结果。

你可能会说,其他产品其实也能做到,包括 Gemini 最新的模型甚至还能提供换装效果。

的确,这个需求并不是大模型能力的上限,能做好的产品有很多。

但是,还是我前面说的,对于大多数普通用户来说, 模型能力是过剩的。

在过剩的模型能力基础上,一些碎片化需求的满足程度直接决定了用户对这款产品的认知。

我们之所以觉得 DeepSeek 很强,其实大多数源自于它首先展示了推理思考过程,并且在回答中去除了「AI感」。

所谓 「AI感」,就是模式化、格式化、套路化回答,没有真人的那种松弛感和灵动性。

如果你还记得 2023 年 12 月份我第一次在文章里介绍 ChatGPT 时的测试 demo,包括去年上半年之前我们使用 AI 回答问题时的效果,那就是 「AI感」。

自从 DeepSeek 出现后, 「AI感」也随即消失,AI 在文字表达和创意上已经达到甚至超过了人类水平。

因此,对用户来说,决定哪一款产品好的原因并不是那款产品技术多么强,而是刚好能满足它的需求。

最后说下百度的推理模型文心 X1,它的特别之处在于能在推理分析过程中调用工具。

并且,X1 的多模态处理并不是把其他单模型做缝合,而是原生的多模态大模型。

在分析和完成任务的过程中,X1 会根据需求去调用各种工具达成目标。


虽然具备了推理模型的基本能力,但作为用户体验来说,其实跟其他主流推理模型的差别不是很大。

说个不成熟的建议,我觉得百度的优势应该聚焦在基于大模型的中文处理和需求满足效率上,就像当年他们宣传百度搜索引擎的广告语一样,「最好用的中文搜索引擎」。

百度不是不行,但它需要加速。

················· 唐韧出品 ·················

安可时刻

其实我那张蓝色衬衫的照片是 2016 年拍的,到明年就 10 年了。

很久没出镜了,如果你想看看现在的我和照片里的我有多大区别,明晚我会开一场直播。

邀请了三位嘉宾准备了十几个问题,一起聊聊 AI 时代产品经理的机会,包括大模型技术原理、产品落地场景、AI 产品转型建议等。

不想错过的可以先预约这场直播,点击下方「预约」按钮即可。


路过

雷人

握手

鲜花

鸡蛋

最新评论