large_models小米大模型全景调研 2025基于最新的公开信息与技术披露,小米在大模型领域的端侧轻量化与云端推理优化双轮驱动的完整分析large_models小米大模型全景调研 2025基于最新的公开信息与技术披露,小米在大模型领域的端侧轻量化与云端推理优化双轮驱动的完整分析📅 2025-12-19 ⏱️ 4 分钟 📝 1311 字#xiaomi #llm #端侧AI
papersDeepSeekMath-V2 技术白皮书:迈向自验证数学推理本文介绍了DeepSeekMath-V2,旨在克服传统上依赖最终答案的数学推理奖励机制的局限性。其核心创新在于通过训练一个专门的证明验证器来评估推导的逻辑严谨性,从而实现自我可验证的数学推理能力。该系统引入了元验证过程,以确保验证器识别的错 …papersDeepSeekMath-V2 技术白皮书:迈向自验证数学推理本文介绍了DeepSeekMath-V2,旨在克服传统上依赖最终答案的数学推理奖励机制的局限性。其核心创新在于通过训练一个专门的证明验证器来评估推导的逻辑严谨性,从而实现自我可验证的数学推理能力。该系统引入了元验证过程,以确保验证器识别的错误是准确的,并利用此验证器作为奖励模型来训练生成器进行自我评估和迭代优化。这种生成与验证的协同作用创建了一个循环,通过扩展计算规模来自动标注难以验证的新证明,从而提高了系统的能力。📅 2025-11-29 ⏱️ 17 分钟 📝 6424 字#AI #DeepSeek #Math
large_modelsGemini Nano Banana Pro:技术奇点、生态重构与行业影响全景解析Google Gemini Nano Banana Pro(Gemini 3 Pro Image)把图像生成从“凭感觉出图”提升为“有推理、有规划的工业级生产工具”:它基于 Gemini 3 的多模态推理和实时搜索能力,在生成前先理解语义与布局、保证细节一致性,同时支持 4K 画质、强文本渲染和多图参考控制,重点服务品牌物料、信息图表、教育与游戏等专业生产场景,并通过云端算力、Workspace/Vertex AI/Adobe 等生态整合与合规水印,把 AI 出图真正变成企业级内容生产基础设施。📅 2025-11-22 ⏱️ 13 分钟 📝 5181 字#image #Gemini #Nano Banana Pro
papersDeepSeek-OCR:重塑AI长文本处理本文介绍了DeepSeek-OCR,一种革命性的AI模型,能够将长文本处理效率提升数十倍,从而实现对超长文档的快速处理。📅 2025-10-21 ⏱️ 11 分钟 📝 4014 字#AI #DeepSeek #OCR
large_modelsVeo 3 零样本学习和推理 - Google Gemini这篇来自 Google DeepMind 的论文 **《视频模型是零样本学习者和推理者》(Video models are zero-shot learners and reasoners)** 探讨了视频生成技术是否正在像大语言模 …large_modelsVeo 3 零样本学习和推理 - Google Gemini这篇来自 Google DeepMind 的论文 **《视频模型是零样本学习者和推理者》(Video models are zero-shot learners and reasoners)** 探讨了视频生成技术是否正在像大语言模型(LLM)改变自然语言处理那样,成为通用的视觉基础模型-这意味着视觉领域迎来 **GPT 时刻**。📅 2025-10-21 ⏱️ 4 分钟 📝 1545 字#Veo 3 #zero-shot learn #video model
large_modelsGemini 2.5 Computer Use ModelGemini 2.5 Computer Use Model 是基于视觉理解的AI代理,通过持续的感知-行动循环实现自动化任务处理。large_modelsGemini 2.5 Computer Use ModelGemini 2.5 Computer Use Model 是基于视觉理解的AI代理,通过持续的感知-行动循环实现自动化任务处理。📅 2025-10-07 ⏱️ 6 分钟 📝 2231 字#gemini #Computer Use #浏览器
large_modelsMeta颠覆代码AI:新模型CWM不只“读”代码,更能“执行”它Meta发布的一项名为“代码世界模型”(Code World Model, CWM)的全新研究,正试图从根本上解决当前代码AI面临的一大痛点。📅 2025-09-28 ⏱️ 6 分钟 📝 2221 字#AI #代码 #世界模型
large_modelsGoogle Gemini Nano Banana 图像的创意应用案例本文介绍Google Gemini Nano Banana模型的创意应用案例。large_modelsGoogle Gemini Nano Banana 图像的创意应用案例本文介绍Google Gemini Nano Banana模型的创意应用案例。📅 2025-09-06 ⏱️ 14 分钟 📝 5276 字#image #Gemini #Nano
large_modelsFastVLM-WebGPU 技术报告解读本文介绍了苹果公司开源的FastVLM-WebGPU模型,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。📅 2025-09-02 ⏱️ 7 分钟 📝 2488 字#Opensource #FastVLM-WebGPU #apple