Skip to main content

关于DeepSeek的一些想法

· 6 min read
  1. DeepSeek-R1(简称DS)核心贡献是证明了「小模型也能具备比肩ChatGPT的性能」,并指明了技术路径。DeepSeek发布最小的模型(1.5b)只需要不到1G内存,没有高端显卡也能部署运行
  2. 类似OpenAI/Claude的中心化AI需求会明显降低,大家会选择自建AI。给数据中心的高端显卡的需求明显降低,转移到中低端、消费级显卡。靠赚数据中心利润的Nvidia股价大跌,相反苹果因为性价比极高的自研M系列AI芯片股价上涨。苹果生态外的AI芯片比如AMD的Ryzen AI Max系列也潜力挺大,个人觉得股价低估了。
  3. 这场竞争本质上是以Meta为首的开源模型与OpenAI为首的闭源模型的竞争。这场竞争最终挤压了AI基础设施的利润空间。英伟达、微软、谷歌等押注AI基础设施的公司基本都跌了。AWS反而因为没在AI浪费钱,未受波及
  4. 按这个趋势,AI最终可能变成类似 Linux、MySQL、Kafka、Redis 这类开源软件,成为系统架构中的一个模块,虽然也有商业版提供更好的服务,但不会成为任何公司的门槛或者护城河。
  5. 不具备推理能力的模型,基本是基于大量的记忆和本能反应来与人对话,这与o1和DeepSeek模型的推理能力之间的差异,在2011出版的《思考,快与慢》中就有提及:基于本能、记忆和印象的认知过程非常容易出现逻辑谬误和偏见,这在人脑中全靠逻辑推理来纠正。因此DeepSeek的成功也是在情理之中。