新闻中心

为啥DeepSeek官方总是“系统繁忙”, 而满血版却很流畅?

2025-02-24 03:25:51

来源:

为啥DeepSeek官方总,是系统繁:忙, 而满血版却很流畅?

DeepSeek作为一个深度学习模型,在其开源发布后受到了国内外的一致关注,很多人都纷纷尝试使用,但由于DeepSeek官网经常出现“系统繁忙”的状态,使得用户体验极差,同时其作为开源项目也不允许第三方对其进行二次开发。

好在DeepSeek有一份使用手册,因此也有很多第三方平台在手册发布后随之赶上了这个热潮。

有一些人就将DeepSeek发布到自己的平台上,但同时也会对其进行优化,比如腾讯元宝和飞书,这两者发布的DeepSeek版本反而更加流畅,那么这是为什么呢?

难道说腾讯和字节跳动的技术水平比DeepSeek还要高吗?

官方网站拥堵原因。

我们都知道大模型推理时对算力和资源的需求是非常大的,尤其是深度学习模型更是如此,因为它可以分析出很多数据的规律,有效提取出数据中的部分内容,对于购买了受限版的用户,实际上其提供的就是简化版的模型。

因此也可以认为DeepSeek应该拥有这样一个完善的大模型,但是官方的数据中心却似乎没有相应的算力,而能够支撑671B这样大模型的数据中心少之又少,因此DeepSeek官网经常会因为算力跟不上的缘故出现“系统繁忙”的情况。

更何况其实DeepSeek是一个开源的项目,也就是想要使用DeepSeek的用户在官网下载之后,就可以直接自己去使用,不管是MOE版本还是鲁棒性版本都可以,但是官网竟然反而会出现“系统繁忙”。

那么很显然DeepSeek可能是为了服务器方面的考虑,将深度学习模型设计成了限制版,就是为了防止本身算力就达不到的情况下再加重负担。

而腾讯元宝和飞书上发布的DeepSeek不仅仅只是深度学习模型,还进行了优化,使得原本需要加载671B内存的模型变成了671MB的大小,大大减少了用户在使用时占用内存,同时也使得大模型变得精简,减少了计算量,使得第三方平台上更多的人都能够使用。

而且这两者之间也不止于此,它们还进行了多种优化,不然也不会出现“系统繁忙”,从以上分析来看,官方网站不能进行优化不是没有道理的。

主要是因为官网有一个完整的大模型,每次推理时都需要将完整模型进行加载,因此响应会非常慢,而第三方平台在这方面进行了修改,更加简化,以方便用户使用。

技术就没腾讯和字节跳动强吗?

其实并不能说第三方平台对深度学习模型进行了简化后使用体验就比官网好,比如腾讯元宝和飞书它们所完成的工作其实非常琐碎,其中并囊括许多我们现在熟悉的软件,比如飞书软件就是基于DeepSeek软件开发的。

不然无法达到流畅运行的效果,就好比DeepSeek要用671B内存,对于腾讯元宝来说就只需要671MB,其所占用内存体积就小了很多。

因此DeepSeek在线运行在这些平台上就流畅了不少,但是官方嘲讽在这几方面可耗费了大量精力,就算是这样也还不够。

大家都知道DeepSeek开源后造成了网络拥堵,甚至DeepSeek网站还遭到了攻击,导致上线后出现系统卡顿。

为了提高DeepSeek网站服务器的稳定性,网站管理进行了反复调试,但仍不够完美,似乎反而吸引了放肆攻击的人,对服务器进行频繁入侵和攻击。

这场战斗持续了一段时间,但结果就是DeepSeek网站再次出现“系统繁忙”,攻击逐渐减少,网站管理尝试打开DeepSeek在线想用功能,却发现令大家期待已久的在线功能已经看不到了。

由于管理方面问题以及服务器问题,有网友调侃道:打开网站,却被告知“您的服务请求过于频繁,请稍后重试”,网站无法使用。

这都是因为DeepSeek遭受DDoS攻击的结果,波及到了DeepSeek正常运行,因此官方深度学习模型追求高性能也是没办法的事。

第三方平台为何登录流畅?

官方网站之所以在大模型推理时优先考虑极限配置,是因为官网对安全性存在极大的责任要求,因此必须克服困难进行解决。

第三方平台在安全防护方面明显要好过DeepSeek官网,其通常是通过设定会员模式来规划算力,这样就能尽量保证大部分用户都能流畅地进行AI搜索和应用。

但是DeepSeek官网只能接待极限数量,因为超过极限数量网站就会出现“系统繁忙”的情况,而且官方更加难以理解的是官方网站对会员制度持反对态度。

虽然会员模式会影响免费用户体验,但是安全性却更高,而且限制连接数在一定程度上减少了DDoS攻击带来的影响,算是一个不错的折中方案,能够这个方案保证AI服务流畅且具有安全性,还能让大家在网站上体验到更高级别的功能,大部分人想必也很乐意接受这样的方案。

不仅如此,DeepSeek更新进度缓慢也让人感到疑惑,它是一个开源程序,对于中间过程直接推向所有使用者也是合理的,大多数西方程序都是采用这种更新方式。

但是DeepSeek却一直保持着保密更新,没有提前警示每个用户,直接将完整的新代码推送给每个用户,这种操作令人费解,更何况这种隐秘更新还导致各个平台之间发生了不开名争吵。

有效调用云计算的方法显而易见是支持人工智能工作的核心,不管是自动更新还是手动更新,都不应该将其隐藏起来,因为高级功能是不可能只提供给一部分用户使用的。

因此,大家拼命寻找更新方法也是情有可原,但是从这个角度来看,DeepSeek没有找到好的代码更新方法让它具有发展停滞感。

黄雅琼和王昶遗憾告负乌议员:乌所有稀土资源都在交战区陈立农演唱会嘉宾杨丞琳漂白受伤替身发文首批小鹏X9右舵版正式发运泰国市场高中生手搓折叠屏惊动手机厂商美将限制与中国的双向投资 中方回应郭敬明再晒月鳞绮纪原始帧河村勇辉:希望日本男篮从惨败中学习孙颖莎4比0陈幸同

(内容来源:看看新闻)

作者: 编辑:尹浩然

  • 越牛新闻客户端

  • 越牛新闻微信

  • 绍兴发布微信

  • 越牛新闻微博

  • 绍兴发布微博

爆料

新闻热线

0575-88880000

投稿信箱

zjsxnet@163.com