llama.cpp/common/sampling.cpp at 8cef8201a1e0213662abbfcbcd3ff2eb773174df

mirror of https://github.com/ggml-org/llama.cpp.git synced 2026-05-12 03:54:06 +00:00

Files

Tim Neumann 2e97c5f96f backend sampling: support returning post-sampling probs (#22622 )

* server: Never return 0.0 post-sampling probabilities

* backend sampling: support returning post-sampling probs

2026-05-10 19:12:02 +02:00

View Raw