Kimi K2.7-Code cuts thinking tokens 30% — but practitioners say the benchmarks don't check out
Moonshot AI가 K2 코딩 모델군의 오픈소스 업데이트인 Kimi K2.7-Code를 공개하며 K2.6 대비 thinking-token 사용량을 30% 줄였다고 밝혔습니다. 이 모델은 기존과 같은 1조 파라미터급 mixture-of-experts 구조를 쓰며 OpenAI-compatible API, vLLM, SGL...







