weishengying

weishengying weishengying

Achievements

cutlass_flash_atten_fp8 cutlass_flash_atten_fp8 Public

使用 cutlass 仓库在 ada 架构上实现 fp8 的 flash attention

Cuda 46 3
tiny-flash-attention tiny-flash-attention Public

使用 cutlass 实现 flash-attention 精简版，具有教学意义

Cuda 29 1
cute_gemm cute_gemm Public

Cuda 4 1
flash-attention flash-attention Public

Forked from vllm-project/flash-attention

Fast and memory-efficient exact attention

Python