papersDeepSeek 微调本文介绍了如何使用合成推理数据集微调DeepSeek-R1模型.papersDeepSeek 微调本文介绍了如何使用合成推理数据集微调DeepSeek-R1模型.📅 2025-02-14 ⏱️ 1 分钟 📝 345 字#AI #DeepSeek #论文
papersSimple Test-Time Scaling 论文解读本文介绍了来自李飞飞团队的Simple Test-Time Scaling论文,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。papersSimple Test-Time Scaling 论文解读本文介绍了来自李飞飞团队的Simple Test-Time Scaling论文,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。📅 2025-02-10 ⏱️ 6 分钟 📝 2248 字#opensource #reasoning #SFT
papersDeepSeek R1 论文解读本文介绍了深度求索(DeepSeek)公司推出的新一代推理模型DeepSeek-R1,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。papersDeepSeek R1 论文解读本文介绍了深度求索(DeepSeek)公司推出的新一代推理模型DeepSeek-R1,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。📅 2025-02-10 ⏱️ 20 分钟 📝 7683 字#AI #深度思考 #DeepSeek-R1