因为MiniMax M2.1 在上下文中丢失</think>标签,而vllm(0.14.1)部署minimax_m2_append_think模式下,流式输出只解析思维链外的工具调用,导致思维链异常时无法解析工具