一句话生图要退场了?开源图像生成 Agent 进化出「工具编排」

3天前更新 15083662215
4 0 0

近期,来自香港科技大学(广州)、美团、香港科技大学、新加坡国立大学等机构的研究团队提出了 GenEvolve,一套面向开放图像生成的自我进化智能体框架。

该框架将一次图像生成过程重新定义为一条“工具编排轨迹”:智能体先解析用户请求,再按需调用搜索、图像检索和生成知识等工具,随后把外部证据、视觉参考以及硬性约束整合为 prompt-reference program,交由不同底层生成器完成渲染。

数据与评测方面,为了支撑这类智能体的训练与验证,研究团队进一步构建了 GenEvolve-Data 和 GenEvolve-Bench。

一句话生图要退场了?开源图像生成 Agent 进化出「工具编排」的封面图

相关快讯

GitHub Copilot接入开源模型Kimi K2.7,开发体验再升级

月之暗面宣布,GitHub Copilot 已接入首个开源模型 Kimi K2.7,意味着该模型开始进入主流开发工具生态,进一步提升其在代码辅助场景中的应用范围与可见度。

开源平台如何编织起 Agent 的“互联网”

文章指出,当前以龙虾为代表的 Agent 虽然单体能力已很强,但仍像早期大型机一样处于分散状态,难以形成协同系统。为此,明略科技推出面向企业组织场景的开源平台 Octo,核心是把分散在各工作流中的 Bot 聚合到同一协作空间,推动 AI 从“单一 Agent”走向“组织网络”。

OceanBase湖库一体:重新定义AI数据库

AI时代正在重塑数据库:AI Agent不再只是查询数据,而是会调用工具、生成代码、执行任务并参与业务流程。数据库也因此要同时支持多模态数据、在线与离线融合,以及Agent所需的实时、可信、连续上下文,在读写、试错、回滚和治理中保持一致性。各条技术路线都在走向能统一处理交易、分析、搜索、向量与AI计算的数据底座。

阿里整合 QoderWork、悟空、MuleRun,推出全新生产力 AI 产品

阿里巴巴正在整合旗下Agent产品线,以QoderWork为基础,融合悟空和MuleRun能力,升级为一款面向企业生产力场景的更强AI产品,由陈宇森负责。公司表示,现有QoderWork、悟空、MuleRun服务将无缝升级,用户权益不受影响。

华为官宣:全球首个商用多模态文旅大模型实现规模化应用

华为中国宣布,“博观文旅大模型”已在西安规模应用,成为全球首个商用多模态文旅大模型,也是中国首个以文化保护与传承为核心目标的行业大模型。该模型依托1.2PB高质量数据集和昇腾算力,支撑AI伴游已覆盖超400万用户,非遗数字IP衍生销售超200万。

对话Clipto.AI创始人康洪文:没有记忆的AI,只是一个“失忆”的聪明人

随着端侧算力快速普及,AI 正从云端走向个人设备:英伟达、英特尔、高通等推动 PC 与笔记本 NPU 性能提升,llama.cpp、MLX 等框架让大模型可稳定运行在普通设备上。Apple Intelligence、Copilot+ PC 和英伟达工具链则进一步把模型嵌入操作系统。

暂无评论

暂无评论...