最新视频 耗时两天半,完全从零开始实现大模型知识蒸馏(Qwen2.5系列模型),从原理讲解、代码实现到效果测试,绝对让你搞懂模型蒸馏耗时两天半,完全从零开始实现大模型知识蒸馏(Qwen2.5系列模型),从原理讲解、代码实现到效果测试,绝对让你搞懂模型蒸馏
最新视频 论文精讲 | 面向大语言模型的越狱攻击综述(《计算机研究与发展》2024年5期发表,作者李南、丁益东、江浩宇、牛佳飞、易平,DOI:10.7544/issn10论文精讲 | 面向大语言模型的越狱攻击综述(《计算机研究与发展》2024年5期发表,作者李南、丁益东、江浩宇、牛佳飞、易平,DOI:10.7544/issn10
最新视频 【人工智能】大语言模型内部是如何运行的 | Anthropic两篇论文揭示部分原理 | 破解黑箱 | 电路追踪 | 跨层转码器 | 多语言能力 | 诗歌创作 |【人工智能】大语言模型内部是如何运行的 | Anthropic两篇论文揭示部分原理 | 破解黑箱 | 电路追踪 | 跨层转码器 | 多语言能力 | 诗歌创作 |
最新视频 【人工智能】万字通俗讲解大语言模型内部运行原理, LLM /词向量/Transformer/注意力机制/前馈网络【人工智能】万字通俗讲解大语言模型内部运行原理, LLM /词向量/Transformer/注意力机制/前馈网络
最新视频 [LLMs 实践] 02 LoRA(Low Rank Adaption)基本原理与基本概念,fine-tune 大语言模型[LLMs 实践] 02 LoRA(Low Rank Adaption)基本原理与基本概念,fine-tune 大语言模型
最新视频 【喂饭级教程 | 量化&蒸馏】1个小时学会如何从零开始实现大模型量化和蒸馏,从原理讲解、代码实现到微调实战,超详细教程,过程可视化,让你完全搞懂模型蒸馏&量化【喂饭级教程 | 量化&蒸馏】1个小时学会如何从零开始实现大模型量化和蒸馏,从原理讲解、代码实现到微调实战,超详细教程,过程可视化,让你完全搞懂模型蒸馏&量化
最新视频 LLM学习论文分享-基于大语言模型的AI Agent 研究代综述《The Rise and Potential of Large Language Mode》LLM学习论文分享-基于大语言模型的AI Agent 研究代综述《The Rise and Potential of Large Language Mode》