Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN计算内核,并能够在现代 GPU硬件上以最大吞吐量运行。
更多 Triton 中文文档可访问 →triton.hyper.ai/
triton.language.make_block_ptr(base: tensor, shape, strides, offsets, block_shape, order)返回指向父张量中 1 个块的指针。
参数:
- base - 父张量的基础指针。
- shape - 父张量的形状。
- strides - 父张量的步幅。
- offsets - 块的偏移量。
- block_shape - 块的形状。
- order - 原始数据格式的顺序。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用@来通知其他用户。