新闻资讯
你的位置:开云体育最新网站 开云最新官方网站 - 登录入口 > 新闻资讯 > 开云体育基本让大模子摈斥了幻觉;但在图像等多模态方面-开云体育最新网站 开云最新官方网站 - 登录入口
开云体育基本让大模子摈斥了幻觉;但在图像等多模态方面-开云体育最新网站 开云最新官方网站 - 登录入口
2025-04-13 14:00    点击次数:72

开云体育基本让大模子摈斥了幻觉;但在图像等多模态方面-开云体育最新网站 开云最新官方网站 - 登录入口

  海报新闻首席记者 吴军林 记者 刘敬怡 上海报谈

  11月12日,百度创举东谈主李彦宏在百度宇宙2024大会上,发表了主题为《诓骗来了》的演讲,发布两大赋能诓骗的AI期间:检索增强的文生图期间(iRAG)和无代码器用“秒哒”。文心iRAG用于贬责大模子在图片生成上的幻觉问题,极大提高实用性;无代码期间“秒哒”让每个东谈主齐领有顺序员的智商,将打造数百万“超等灵验”的诓骗。

  收尾11月初,百度文心大模子的日均调用量超15亿,相较5月表现的2亿,增长7.5倍,相较一年前初次表现的5000万次,更是增长约30倍。李彦宏示意“这个增速超出预期”,证实AI是真需求。他感叹,这条陡峻的增长弧线,代表着往日两年中国大模子诓骗的爆发。

  贬责图片生成幻觉 文心iRAG发布

  幻觉问题是大模子宽泛诓骗的最大适度之一,而贬责文本生成幻觉问题背后的期间即是RAG,即检索增强。转头往日两年,李彦宏以为,检索增强生成(RAG)从百度特色,渐渐发展成为了行业共鸣。现时,笔墨层面的RAG如故作念得很好,基本让大模子摈斥了幻觉;但在图像等多模态方面,和RAG的集中还不够,这亦然百度但愿要点打破的成见。

  现时,基于大语言模子的文生图还有相比严重的幻觉,尤其是针对长城、东方明珠、金字塔、爱因斯坦、贝多芬等特定地方、物品和东谈主物,连接会出现张冠李戴的幻觉问题,让生成的图片“一眼假”,极地面影响了AI的实用性。

  针对上述问题,百度树立了检索增强的文生图期间iRAG(image based RAG),将百度搜索的亿级图片资源跟重大的基础模子智商相集中,不错生成各式超竟然的图片,举座恶果远远进步文生图原生系统,去除了机器味。

  李彦宏现场展示的“爱因斯坦环游宇宙”图片中,爱因斯坦和各个布景景点的集中与竟然宇宙相似,质感接近相片。

  iRAG期间极地面提高了AI生成图片的可用性。比如在品牌宣传上,以前拍一组海报动辄几十万,但当今的创作资本接近于0。简便而言,文心iRAG的买卖价值体当今:无幻觉、超竟然、没资本、立等可取。此外,在影视作品、漫画作品、贯穿画本、海报制作等诓骗场景中,iRAG齐不错大幅裁汰创作资本。

  摈斥大模子的幻觉,亦然AI诓骗爆发的基础。在李彦宏看来,今天,基础大模子智商就绪,行将迎来AI诓骗的群星精明时刻。

  无代码“秒哒” 会语言就能作念出诓骗

  这次,百度带来了无代码器用“秒哒”,一款不需要写代码就能终了纵脱象法的软件,涵盖无代码编程、多智能体互助以及多器用调用等特质,只需说语言,就能构建出各式诓骗。它不错匡助更多东谈主、更多企业打造出数百万“超等灵验”的诓骗。

  李彦宏先容,无代码编程,由大模子径直生成代码,不需要东谈主写一转代码。它门槛很低,东谈主东谈主可上手;多智能体互助,是基于文心大模子的想考和经营智商,终了对不同智能体的转机和编排;多器用调用,是通过文心大模子的器用调用智商,可调用网页检索、iRAG、舆图API等千般型器用。

  李彦宏以萝卜快跑新期间发布会为例,展示了活动报名系统的搭建进程:惟有在“秒哒”上用汉文态状需求,并补充一份带有大会期间地方主题的文档,就不错引导多个智能体互助,完成报名系统的树立。

  就像责任场景中的团队合作相同,在现场演示的“秒哒”树立进程中,小组长、策动、小编、顺序员和质检员五个智能体彼此互助,协同完成策动、实质和树立等各式责任,还能自动识别bug、调用各式器用。

  “一个东谈主通过当然语言交互,就不错完成一套系统的搭建,除了上头展示的邀请系统,还不错作念纵脱场景下的各式诓骗,诓骗的复杂度也会跟着咱们期间的提高不休提高。”李彦宏总结说,这意味着每个东谈主我方就能引导多个智能体来协同完成任务,“惟有有想法,你就不错心想事成,咱们将迎来一个只靠想法就能赢利的期间。”

  在他看来,无代码的秒哒让每个东谈主齐具备顺序员的智商,会语言就能作念出诓骗,极大提高了东谈主类的责任遵守。“AI之是以被称为产业创新级的契机,即是因为它对社会经济开云体育,带来了坐褥力的无尽彭胀。”