HyperAI

运行此教程在 Discord 上讨论

日期

17 天前

大小

657.01 MB

标签

AI 编译器

简介

Triton 是一种用于并行编程的语言和编译器，旨在提供一个基于 Python 的编程环境，以高效编写自定义 DNN 计算内核，并能够在 GPU 硬件上以最大吞吐量运行。

本项目是一套完整的 Triton 学习教程，涵盖了从基础到高级的各个方面，包括向量操作、矩阵运算、层标准化、注意力机制、以及 FP8 矩阵乘法等内容。

参考资源

该教程由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 support@hyper.ai 以便及时审查和下架。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

运行此教程在 Discord 上讨论

日期

17 天前

大小

657.01 MB

标签

AI 编译器

简介

本项目是一套完整的 Triton 学习教程，涵盖了从基础到高级的各个方面，包括向量操作、矩阵运算、层标准化、注意力机制、以及 FP8 矩阵乘法等内容。

参考资源

该教程由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 support@hyper.ai 以便及时审查和下架。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

Triton 编译器教程

简介

目录

1. 基础操作教程

1.1 向量相加

2. 核心算子教程

2.1 融合 Softmax (Fused Softmax)

2.2 矩阵乘法

2.3 层标准化 (Layer Normalization)

3. 高级特性教程

3.1 低内存 Dropout

3.2 融合注意力 (Fused Attention)

3.3 Libdevice 外部函数

3.4 分组 GEMM (Grouped GEMM)

3.5 持续 FP8 矩阵乘法

3.6 块缩放矩阵乘法

参考资源

用 AI 构建 AI

HyperAI Newsletters

Command Palette

Triton 编译器教程

简介

目录

1. 基础操作教程

1.1 向量相加

2. 核心算子教程

2.1 融合 Softmax (Fused Softmax)

2.2 矩阵乘法

2.3 层标准化 (Layer Normalization)

3. 高级特性教程

3.1 低内存 Dropout

3.2 融合注意力 (Fused Attention)

3.3 Libdevice 外部函数

3.4 分组 GEMM (Grouped GEMM)

3.5 持续 FP8 矩阵乘法

3.6 块缩放矩阵乘法

参考资源

相关教程

TVM 教程 0.22.0

Open-AutoGLM：手机端智能助理

一键部署 SmolLM3-3B-Model

MarkItDown 微软开源的文档转换工具

用 AI 构建 AI

HyperAI Newsletters

Command Palette

Triton 编译器教程

简介

目录

1. 基础操作教程

1.1 向量相加

2. 核心算子教程

2.1 融合 Softmax (Fused Softmax)

2.2 矩阵乘法

2.3 层标准化 (Layer Normalization)

3. 高级特性教程

3.1 低内存 Dropout

3.2 融合注意力 (Fused Attention)

3.3 Libdevice 外部函数

3.4 分组 GEMM (Grouped GEMM)

3.5 持续 FP8 矩阵乘法

3.6 块缩放矩阵乘法

参考资源

相关教程

TVM 教程 0.22.0

Open-AutoGLM：手机端智能助理

一键部署 SmolLM3-3B-Model

MarkItDown 微软开源的文档转换工具

用 AI 构建 AI

HyperAI Newsletters

相关教程

TVM 教程 0.22.0

Open-AutoGLM：手机端智能助理

一键部署 SmolLM3-3B-Model

MarkItDown 微软开源的文档转换工具

相关教程

TVM 教程 0.22.0

Open-AutoGLM：手机端智能助理

一键部署 SmolLM3-3B-Model

MarkItDown 微软开源的文档转换工具