Enable FP4 CUTLASS GEMM and CUDA quantization kernels (#4004) #5949
Job | Run time |
---|---|
14m 14s | |
14m 24s | |
53s | |
11m 45s | |
22m 35s | |
12m 9s | |
11m 32s | |
21m 2s | |
14m 21s | |
12m 35s | |
19m 39s | |
11m 27s | |
21m 13s | |
14m 16s | |
14m 24s | |
11m 59s | |
14m 25s | |
12m 6s | |
14m 32s | |
21m 22s | |
21m 4s | |
12m 17s | |
20m 1s | |
20m 19s | |
12m 7s | |
14m 22s | |
11m 53s | |
14m 25s | |
20m 1s | |
14m 13s | |
3m 47s | |
3m 47s | |
52s | |
3m 49s | |
3m 48s | |
3m 48s | |
3m 45s | |
3m 48s | |
3m 47s | |
51s | |
3m 49s | |
3m 48s | |
52s | |
3m 48s | |
3m 48s | |
42s | |
3m 49s | |
3m 49s | |
3m 48s | |
3m 48s | |
3m 49s | |
50s | |
3m 48s | |
3m 44s | |
3m 48s | |
3m 26s | |
52s | |
3m 48s | |
3m 41s | |
3m 25s | |
9h 6m 49s |