Improve Fused8BitRowwiseQuantizedSBFloatToFloatOrHalfNeon by 5%-15% · pytorch/FBGEMM@254396f

Triggered via pull request March 21, 2025 15:07

Nicoshev

opened #3860

Status Success

Total duration 1h 2m 8s

Artifacts 1

fbgemm_gpu_benchmark_cuda.yml

on: pull_request

Matrix: build_artifact

Matrix: benchmark_artifact

Produced during runtime

Name	Size	Digest
fbgemm_gpu_nightly_cuda_x86_gcc_py3.13_cu12.8.0.whl	962 MB	`sha256:8d6e4ca22bd186ff6919266685275dbe48d1aa2cc00753d65dc319a4e76ca1f3`