阿森知识库

Home

❯

计算机理论

❯

GQA

GQA

2026年3月25日1分钟阅读

Grouped-Query Attention

ref

  • A Visual Guide to Attention Variants in Modern LLMs

这是一种注意力的优化形式,以 q-k 多对一的形式优化 k v 的数量,最终减少存储空间。


关系图谱

反向链接

  • 注意力

最近的笔记

  • Transformer

    2026年3月26日

  • GQA

    2026年3月25日

  • MHA

    2026年3月25日

Created with Quartz v4.5.2 © 2026

  • GitHub