技术专栏

精选专栏

大模型技术解析

李明远技术总监

深入浅出地剖析大型语言模型的技术原理、架构演进与优化方向，探讨Transformer架构的进化与未来发展趋势

12篇文章更新至第8篇

阅读专栏

AI系统工程实践

张健首席架构师

从工程角度解析大规模AI系统的设计、部署与优化，分享实战经验与性能调优技巧

16篇文章更新至第15篇

阅读专栏

多模态AI实战

王晓华研究科学家

探索视觉、语言、音频等多模态融合的技术路径与应用实践，结合实际案例分析多模态AI的落地挑战

10篇文章更新至第7篇

阅读专栏

图神经网络在推荐系统中的应用与优化

详解GNN在处理用户-物品交互图时的关键技术突破点，以及如何解决大规模稀疏图的高效计算问题

作者：陈明远阅读时间：15分钟

模型训练 2024-04-09

大规模预训练模型的高效微调策略

探讨参数高效微调技术（PEFT）在资源受限场景下的应用，对比LoRA、Prefix Tuning等方法的优缺点

作者：王调优阅读时间：12分钟

推理优化 2024-04-07

大语言模型量化技术最新进展

剖析4比特、2比特甚至1比特量化技术在模型推理中的应用，以及如何在精度损失与性能提升间寻找平衡点

作者：刘量化阅读时间：18分钟

架构设计 2024-04-05

Transformer架构的进化：从注意力机制到稀疏化设计

回顾Transformer架构的发展历程，探讨稀疏注意力、局部感受野等结构创新如何突破序列长度限制

作者：张架构阅读时间：20分钟

性能调优 2024-04-03

CUDA性能分析：大模型训练的性能瓶颈与解决方案

基于实际案例分析大模型训练中的性能瓶颈，从内存优化、通信效率等角度提供优化策略

作者：林性能阅读时间：16分钟

代码实战 2024-04-01

从零实现一个高效的Attention机制

手把手教你用PyTorch实现高效的注意力机制，包括Flash Attention、Memory-efficient Attention等最新优化

作者：吴代码阅读时间：25分钟

精选专栏

大模型技术解析

AI系统工程实践

多模态AI实战

最新技术文章

图神经网络在推荐系统中的应用与优化

大规模预训练模型的高效微调策略

大语言模型量化技术最新进展

Transformer架构的进化：从注意力机制到稀疏化设计

CUDA性能分析：大模型训练的性能瓶颈与解决方案

从零实现一个高效的Attention机制

专栏作者

李明远

张健

王晓华

热门标签

推荐书籍

深度学习系统实战

大模型工程实践指南

AI系统性能调优艺术

技术专栏

精选专栏

大模型技术解析

AI系统工程实践

多模态AI实战

最新技术文章

图神经网络在推荐系统中的应用与优化

大规模预训练模型的高效微调策略

大语言模型量化技术最新进展

Transformer架构的进化：从注意力机制到稀疏化设计

CUDA性能分析：大模型训练的性能瓶颈与解决方案

从零实现一个高效的Attention机制

专栏作者

李明远

张健

王晓华

热门标签

推荐书籍

深度学习系统实战

大模型工程实践指南

AI系统性能调优艺术

技术干货不错过