
LLM

large_models
小米大模型全景调研 2025
基于最新的公开信息与技术披露,小米在大模型领域的端侧轻量化与云端推理优化双轮驱动的完整分析
papers
DeepSeekMath-V2 技术白皮书:迈向自验证数学推理
本文介绍了DeepSeekMath-V2,旨在克服传统上依赖最终答案的数学推理奖励机制的局限性。其核心创新在于通过训练一个专门的证明验证器来评估推导的逻辑严谨性,从而实现自我可验证的数学推理能力。该系统引入了元验证过程,以确保验证器识别的错 …
papers
DeepSeekMath-V2 技术白皮书:迈向自验证数学推理
本文介绍了DeepSeekMath-V2,旨在克服传统上依赖最终答案的数学推理奖励机制的局限性。其核心创新在于通过训练一个专门的证明验证器来评估推导的逻辑严谨性,从而实现自我可验证的数学推理能力。该系统引入了元验证过程,以确保验证器识别的错误是准确的,并利用此验证器作为奖励模型来训练生成器进行自我评估和迭代优化。这种生成与验证的协同作用创建了一个循环,通过扩展计算规模来自动标注难以验证的新证明,从而提高了系统的能力。

papers
AI的“知识僵化症”有救了?揭秘MIT自适应大模型SEAL
麻省理工学院(MIT)的一项开创性研究,为我们揭示了这场进化的具体路径。他们推出了一个名为 **SEAL (Self-Adapting Large Language Models,自适应大语言模型)** 的框架。这套框架首次赋予了AI模型一种前所未有的能力:它们可以“自己教自己”,通过生成和应用自己的学习材料,来持续进化其内部的知识体系。




large_models
Gemini 2.5 Pro 在 IMO 2025 中的高级数学推理能力评估
Gemini 2.5 Pro 在 IMO 2025 数学奥林匹克竞赛中取得优异成绩,关键在于结合了强大的数学推理能力与自我验证迭代流程,有效避免逻辑错误和表面化思维,实现了接近人类专家的严谨解题表现。
code_assistant
Claude-Code-Router:AI 时代的智能路由中枢
code_assistant
Claude-Code-Router:AI 时代的智能路由中枢
目录
- 1. 引言:AI 服务智能路由的新范式
- 2. Claude-Code-Router 核心机制总览
- 3. 智能路由决策机制详解
- 4. 请求转换与转发机制
- 5. 错误处理与降级策略
- 6. 插件系统与扩展性
- 7. 性能优化与监控
- 8. 未来展望与技术挑战
Claude-Code-Router (CCR) 是一款创新的AI模型智能路由工具,它通过拦截Claude Code 应用对Anthropic Claude模型的请求,进行多维度分析(如Token数量、用户指令、任务类型),然后依据动态路由规则和配置,将请求智能地导向最合适的AI模型(来自如Gemini、DeepSeek、本地Ollama模型等不同的模型服务提供商)。CCR的核心机制包括API格式的自动转换与适配、基于Express.js的中间件架构、异步请求处理,以及完善的错误检测、自动降级到兜底模型和潜在的重试策略,旨在提升AI服务调用的效率、灵活性和成本效益。
context_engineering
Context Engineering
Context Engineering 是大型语言模型(LLM)应用中的系统性技术,旨在通过动态构建、管理和优化输入模型的信息负载(包括指令、记忆、工具输出、外部知识等),提升模型在复杂任务中的性能、稳定性和可靠性。
context_engineering
Context Engineering
Context Engineering 是大型语言模型(LLM)应用中的系统性技术,旨在通过动态构建、管理和优化输入模型的信息负载(包括指令、记忆、工具输出、外部知识等),提升模型在复杂任务中的性能、稳定性和可靠性。
