书吧

字:
关灯 护眼
书吧 > 重生之AI教父 > 438. 思维链路

438. 思维链路(2/2)

deepSeek的成本低到令人发指。

    孟繁岐一直以为,deepSeek对外开放的API调用价格这么低,只是因为母公司不差钱,没准备用这个服务赚钱。

    由于他们没有互联网大厂天然的用户基础,低价API和免费网页试用,都只是积累用户的前期投入。

    而今细读deepSeek在参数低bit训练,高倍率权重稀疏,以及批量数据合成等方面的成就。孟繁岐这才明白,原来他们真的已经将成本降低了一个数量级。

    “deepSeek-R1虽然已经来到了一流级别,但距离现在满血的o1还有一定的差距。我们正在研发的新版本在性能上也更具有领先优势。”

    dS的热度在持续攀升,孟繁岐很快接到了团队的报告。对于这种“我还没输”的分析,他并不认可。

    “性能指标只是纸面上的,如今阶段,两三个点的差距用户在使用的时候已经难以察觉。并且,抛开成本谈性能,实在是耍流氓了。”

    孟繁岐进行过实验性质的超大模型训练,性能确实屡创新高,但推理一个问题的成本就能到几十块乃至上百元。

    试问这样的使用价格,只是几个点的提升又有什么实际的意义呢?

    “deepSeek的低成本训练大大降低了加入AI领域的门槛,我想很多还在观望的公司都会有所动作。我们应该将策略从技术垄断调转方向,开始侧重为大企业进行实际应用的适配。”

    孟繁岐在历史的转折点做出了重大的决定。
『加入书签,方便阅读』
内容有问题?点击>>>邮件反馈