llama.cpp

mirror of https://github.com/ggml-org/llama.cpp.git synced 2026-05-08 10:04:10 +00:00

Files

Jiacheng (Jason) Chen 3e18dba9fd HIP: Patch failed testcase in WMMA-MMQ kernels for RDNA 4 (#17502 )

* patch failed test case MUL_MAT(type_a=q4_0,type_b=f32,m=576,n=512,k=576,bs=[1,1],nr=[1,1],per=[0,1,2,3],k_v=0,o=1) for enabling WMMA on RDNA4

* Quick clean up on mma.cuh to add ggml_cuda_memcpy_1 back in for half2 and bfloat162

2025-11-26 11:18:48 +01:00

cmake

ggml: Skip backend library linking code when GGML_BACKEND_DL=ON (#15094 )

2025-08-07 13:45:41 +02:00

include

ggml : add ggml_top_k (#17365 )

2025-11-25 15:31:43 +02:00

src

HIP: Patch failed testcase in WMMA-MMQ kernels for RDNA 4 (#17502 )

2025-11-26 11:18:48 +01:00

.gitignore

vulkan : cmake integration (#8119 )

2024-07-13 18:12:39 +02:00

CMakeLists.txt

ggml : remove dirty flag from version string (ggml/1391)

2025-11-24 15:26:31 +02:00