common : better names

2026-05-14 21:14:10 +00:00 · 2026-01-26 13:59:08 +02:00
parent f895bca71a
commit a3300937e5
4 changed files with 34 additions and 33 deletions
--- a/tools/server/server-task.cpp
+++ b/tools/server/server-task.cpp
@@ -78,10 +78,10 @@ json task_params::to_json(bool only_metrics) const {
            {"speculative.n_min",         speculative.n_min},
            {"speculative.p_min",         speculative.p_min},
            {"speculative.draftless_t",   common_speculative_type_to_str(speculative.draftless_type)},
-            {"speculative.ngram_size_n",  speculative.spec_ngram_size_n},
-            {"speculative.ngram_size_m",  speculative.spec_ngram_size_m},
-            {"speculative.ngram_c_rate",  speculative.spec_ngram_check_rate},
-            {"speculative.ngram_m_hits",  speculative.spec_ngram_min_hits},
+            {"speculative.ngram_size_n",  speculative.ngram_size_n},
+            {"speculative.ngram_size_m",  speculative.ngram_size_m},
+            {"speculative.ngram_c_rate",  speculative.ngram_check_rate},
+            {"speculative.ngram_m_hits",  speculative.ngram_min_hits},
            {"timings_per_token",         timings_per_token},
            {"post_sampling_probs",       post_sampling_probs},
            {"backend_sampling",          sampling.backend_sampling},
@@ -142,10 +142,10 @@ json task_params::to_json(bool only_metrics) const {
        {"speculative.n_min",         speculative.n_min},
        {"speculative.p_min",         speculative.p_min},
        {"speculative.draftless_t",   common_speculative_type_to_str(speculative.draftless_type)},
-        {"speculative.ngram_size_n",  speculative.spec_ngram_size_n},
-        {"speculative.ngram_size_m",  speculative.spec_ngram_size_m},
-        {"speculative.ngram_c_rate",  speculative.spec_ngram_check_rate},
-        {"speculative.ngram_m_hits",  speculative.spec_ngram_min_hits},
+        {"speculative.ngram_size_n",  speculative.ngram_size_n},
+        {"speculative.ngram_size_m",  speculative.ngram_size_m},
+        {"speculative.ngram_c_rate",  speculative.ngram_check_rate},
+        {"speculative.ngram_m_hits",  speculative.ngram_min_hits},
        {"timings_per_token",         timings_per_token},
        {"post_sampling_probs",       post_sampling_probs},
        {"backend_sampling",          sampling.backend_sampling},
@@ -254,15 +254,15 @@ task_params server_task::params_from_json_cmpl(
    params.speculative.n_max = std::max(params.speculative.n_max, 0);

    params.speculative.draftless_type         = common_speculative_type_from_name(json_value(data, "speculative.draftless_t", common_speculative_type_to_str(defaults.speculative.draftless_type)));
-    params.speculative.spec_ngram_size_n      = json_value(data, "speculative.ngram_size_n", defaults.speculative.spec_ngram_size_n);
-    params.speculative.spec_ngram_size_m      = json_value(data, "speculative.ngram_size_m", defaults.speculative.spec_ngram_size_m);
-    params.speculative.spec_ngram_check_rate  = json_value(data, "speculative.ngram_c_rate", defaults.speculative.spec_ngram_check_rate);
-    params.speculative.spec_ngram_min_hits    = json_value(data, "speculative.ngram_m_hits", defaults.speculative.spec_ngram_min_hits);
+    params.speculative.ngram_size_n      = json_value(data, "speculative.ngram_size_n", defaults.speculative.ngram_size_n);
+    params.speculative.ngram_size_m      = json_value(data, "speculative.ngram_size_m", defaults.speculative.ngram_size_m);
+    params.speculative.ngram_check_rate  = json_value(data, "speculative.ngram_c_rate", defaults.speculative.ngram_check_rate);
+    params.speculative.ngram_min_hits    = json_value(data, "speculative.ngram_m_hits", defaults.speculative.ngram_min_hits);

-    params.speculative.spec_ngram_size_n      = std::max(std::min(1, (int) params.speculative.spec_ngram_size_n),     1024);
-    params.speculative.spec_ngram_size_m      = std::max(std::min(1, (int) params.speculative.spec_ngram_size_m),     1024);
-    params.speculative.spec_ngram_check_rate  = std::max(std::min(1, (int) params.speculative.spec_ngram_check_rate), 1024);
-    params.speculative.spec_ngram_min_hits    = std::max(std::min(1, (int) params.speculative.spec_ngram_min_hits),   1024);
+    params.speculative.ngram_size_n      = std::max(std::min(1, (int) params.speculative.ngram_size_n),     1024);
+    params.speculative.ngram_size_m      = std::max(std::min(1, (int) params.speculative.ngram_size_m),     1024);
+    params.speculative.ngram_check_rate  = std::max(std::min(1, (int) params.speculative.ngram_check_rate), 1024);
+    params.speculative.ngram_min_hits    = std::max(std::min(1, (int) params.speculative.ngram_min_hits),   1024);

    // Use OpenAI API logprobs only if n_probs wasn't provided
    if (data.contains("logprobs") && params.sampling.n_probs == defaults.sampling.n_probs){