关于DeepSeek的一些想法

DeepSeek-R1(简称DS)核心贡献是证明了「小模型也能具备比肩ChatGPT的性能」，并指明了技术路径。DeepSeek发布最小的模型(1.5b)只需要不到1G内存，没有高端显卡也能部署运行
类似OpenAI/Claude的中心化AI需求会明显降低，大家会选择自建AI。给数据中心的高端显卡的需求明显降低，转移到中低端、消费级显卡。靠赚数据中心利润的Nvidia股价大跌，相反苹果因为性价比极高的自研M系列AI芯片股价上涨。苹果生态外的AI芯片比如AMD的Ryzen AI Max系列也潜力挺大，个人觉得股价低估了。
这场竞争本质上是以Meta为首的开源模型与OpenAI为首的闭源模型的竞争。这场竞争最终挤压了AI基础设施的利润空间。英伟达、微软、谷歌等押注AI基础设施的公司基本都跌了。AWS反而因为没在AI浪费钱，未受波及
按这个趋势，AI最终可能变成类似 Linux、MySQL、Kafka、Redis 这类开源软件，成为系统架构中的一个模块，虽然也有商业版提供更好的服务，但不会成为任何公司的门槛或者护城河。
不具备推理能力的模型，基本是基于大量的记忆和本能反应来与人对话，这与o1和DeepSeek模型的推理能力之间的差异，在2011出版的《思考，快与慢》中就有提及：基于本能、记忆和印象的认知过程非常容易出现逻辑谬误和偏见，这在人脑中全靠逻辑推理来纠正。因此DeepSeek的成功也是在情理之中。