11月3日|據阿里巴巴Qwen,Qwen3-Max推理模型仍在持續訓練中,即便是當前的Checkpoint,當藉助工具調用和規模化的測試時計算時,模型可在AIME 25和HMMT25等具有挑戰性的數學推理基準測試中達到100%的準確率。