DeepSeek V3.2正式版发布:强化Agent能力,融入思考推理
本站消息,今天,我们同时发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。DeepSeek-V3.2是我们推出的首个将思考融入工具使用的模型,并且同时支持思考模式与非思考模式的工具调用。我们提出了一种大规模Agent训练数据合成方法,构造了大量“难解答,易验证”的强化学习任务(1800+环境,85,000+复杂指令),大幅提高了模型的泛化能力。(DeepSeek)
声明:本站所有内容,如无特殊说明或标注,均为采集网络资源,任何内容均不构成投资建议。
