最新视频 月之暗面发布面向大模型的MoBA(混合块注意力)架构 结合MoE和稀疏注意力 算法原理详解 | Transformer | Attention | LLM月之暗面发布面向大模型的MoBA(混合块注意力)架构 结合MoE和稀疏注意力 算法原理详解 | Transformer | Attention | LLM
最新视频 Tora:微软、清华联合发布最强开源数学大模型,在竞赛数学MATH上准确率首次突破50%,采用工具集成+大模型微调出数学推理语言模型Tora:微软、清华联合发布最强开源数学大模型,在竞赛数学MATH上准确率首次突破50%,采用工具集成+大模型微调出数学推理语言模型
最新视频 【人工智能】国内大模型创业公司近况如何 | 6+2格局 | 智谱 | MiniMax | 百川智能 | 月之暗面 | 阶跃星辰 | 零一万物 | DeepSee【人工智能】国内大模型创业公司近况如何 | 6+2格局 | 智谱 | MiniMax | 百川智能 | 月之暗面 | 阶跃星辰 | 零一万物 | DeepSee
最新视频 Kimi:月之暗面moonshot发布最好用的国产大模型kimi,支持200万字的最长上下文输入,可以做论文总结、电影总结、录音整理等Kimi:月之暗面moonshot发布最好用的国产大模型kimi,支持200万字的最长上下文输入,可以做论文总结、电影总结、录音整理等