[FEATURE]MaxKB消耗的tokens数量和实际LLM消耗的tokens数量出入比较大 #488

xiaobug0929 · 2024-05-21T01:50:44Z

1.1.3

MaxKB消耗的tokens数量和实际LLM消耗的tokens数量出入比较大，应该是MaxKB内部相关的向量计算也参与了计算。建议额外提供一个返回值，专门提供实际LLM消耗的tokens数量

No response

No response

baixin513 · 2024-05-21T02:44:40Z

感谢反馈，我们统一使用了 GPT-2的模型计算的输入和输出的 tokens，并没有计算 embedding ，与在线模型的API计算方式可能不一样。

marxy · 2024-05-23T01:42:53Z

为什么我用的v1.1.3版本没有显示token消耗量的？

baixin513 · 2024-05-31T09:49:08Z

v1.1.3

你用的什么模型？

marxy · 2024-06-04T01:37:45Z

v1.1.3

你用的什么模型？

我用ollama v0.1.38部署的qwen

xiaobug0929 assigned baixin513 May 21, 2024

baixin513 changed the title ~~[FEATURE]~~ [FEATURE]MaxKB消耗的tokens数量和实际LLM消耗的tokens数量出入比较大 May 21, 2024

baixin513 added the 类型:bug label May 21, 2024

Provide feedback