字节跳动发布豆包1.5深度思考模型,可进行「看图思考」

4月17日,字节跳动旗下火山引擎发布了最新的豆包1.5・深度思考模型,并同步升级文生图模型3.0。

官方数据显示,截至2025年3月底,豆包大模型日均tokens调用量已超过12.7万亿,是2024年12月的3倍,是一年前刚刚发布时的106倍。

据介绍,豆包1.5·深度思考模型,在数学、代码、科学等专业领域推理任务中表现突出,数学推理AIME 2024测试得分追平OpenAI o3-mini-high;在创意写作等非推理任务中,该模型也能够胜任广泛和复杂的使用场景。同时,豆包1.5·深度思考模型还具备视觉理解能力,可以像人类一样,不光基于文字思考,还能基于所见画面思考

官方称,豆包1.5·深度思考模型采用 MoE 架构,总参数为200B,激活参数仅20B,具备显著的训练和推理成本优势。基于高效算法,豆包1.5·深度思考模型延迟可低至20毫秒。

此外,豆包文生图模型Seedream3.0也正式向企业开放,该模型已在即梦AI、豆包产品上线。该模型能够实现更好的文字排版表现、实拍级的图像生成效果,以及2K的高清图片生成方式,可以广泛应用于影视、海报、绘画、玩偶设计等营销、电商、设计场景

分享