llama.cpp/examples/main/main.cpp at 7704db252108d3ec69be4fdcaee4d834ea5e8fa8

mirror of https://github.com/ggml-org/llama.cpp.git synced 2026-05-12 03:54:06 +00:00

Files

Georgi Gerganov 47068e5170 speculative : PoC for speeding-up inference via speculative sampling (#2926 )

* speculative : initial example

* speculative : print encoding speed

* speculative : add --draft CLI arg

2023-09-03 15:12:08 +03:00

View Raw