马修军谈视觉语言通用模型与具身智能
2023世界人工智能大会“科技与人文——共筑无障碍智能社会”论坛8日在上海世博中心召开。
北京大学智能学院、跨媒体通用人工智能全国重点实验室研究员,超级自动化联合实验室主任马修军博士在论坛上作题为《跨越AIGC大模型的鸿沟:视觉语言大模型推动泛在的具身智能》的主旨演讲,从多模态通用模型角度,洞观AIGC(生成式人工智能)的下一热点——具身智能的发展以及大模型创新链与产业链深度融合。
(资料图片仅供参考)
人工智能已经迈入AIGC时代,全球产业界都在竞争具有泛化能力的语言大模型,大模型产业链与生态链日益完善,国际巨头不断推高大语音模型能力,国内百度、华为,腾讯、阿里等也在加速布局语言大模型。
马修军介绍道,当前,基于语言大模型的工具链和生态不断涌现,大模型应用重点转向行动导向,调用和操作外部系统和工具,即大模型从知识、推理转向行动驱动。“但语言大模型的普及仍存在三大鸿沟:一是幻觉问题,二是记忆和个性化问题,三是多模态与物理世界交互问题。”他认为,AIGC大模型下一个热点是多模态和具身智能。
所谓“具身智能”,是指能够理解、推理并与物理世界交互的通用智能体,具有多模态感知认知能力和自主多任务机制。视觉语言大模型是多模态通用模型的核心。
视觉也是一种语言,语言的载体是文字。“中国象形文字天然具有多模态表征和明文通信的编码能力,看一个字就知道什么意思。借助象形文字的编码思想,我们可以为人工智能表征世界设计一种多模态特征编码,进而发展多模态通用语言大模型。”马修军说。
据介绍,视觉语言大模型基于对现实世界表征预测的类象形文字的特征编码,使得人工智能拥有了自己的文字,可以理解像素、听懂语音序列并感知世界,真正拥有具身智能的核心能力,并且这种多模态文字编码可用于具身智能之间的通讯交互,构建一个泛在的机器智能社会。
马修军认为,多模态通用模型与具身智能是未来产业发展的基石,需要贯通学研产用全链条,推动大模型创新链与产业链深度融合。通信运营商算网融合,需要为多模态具身智能的通信重塑再造一种新型基础设施,包括面向机器通信的编码、消息格式及网元算力等。例如,面向机器的视觉编码VCM与5G消息以及大模型的融合创新。
“在AIGC时代,全球产业界都在竞争通用人工智能的基础模型,这是人工智能产业的皇冠,是未来智能社会的底座,并且它的演进速度非常快。”马修军表示,以大模型为基座的人工智能通用能力不会昙花一现,多模态通用模型与具身智能将重塑未来社会的产业链和产业生态,产生像互联网一样的影响力。
据悉,本次论坛由世界人工智能大会组委会办公室指导,中国新闻社上海分社、上海市杨浦区人民政府联合主办,上海中新传媒文化咨询有限公司、上海市杨浦区科委承办,上海市现代服务业联合会、上海市海外经济技术促进会、上海市长宁区北新泾街道办事处、上海新之海数据信息有限公司协办,中新社国际传播集团上海分公司、上海市人工智能行业协会支持。(完)
(文章来源:中国新闻网)
标签:
为您推荐
广告
- 马修军谈视觉语言通用模型与具身智能
- 储能周报 | 晶科储能84.3亿砸向储能!日本车企为全固态电池装车制定“时间表”!
- ram和cache的读写速度(ram cache register flash disk 哪个存取速度最快)
- 澳门神算子精准免费大全(神算子澳门正版资料)
- 证监会有关部门负责人就公募基金费率改革答记者问
- 白荆回廊阵容搭配技巧,如何搭配最强阵容
- 曾经爆款无数的Chloé已“无人问津”多时,明星设计师任职仅3年就要离职
- 市邮政管理局安排部署高校录取通知书寄递服务工作
- 上半年全国铁路完成固定资产投资3049亿元,同比增长6.9%
- 海南经营主体增速连续39个月全国第一
- 抗战之星际基地下载_抗战之星际基地
- 热浪中的电力股:谁有最强预期差?
- AMD R5 5600X3D 6 核大缓存处理器开卖,仅限美国线下店
- 深交所本周共对62起证券异常交易行为采取了自律监管措施
- 人民币汇率回落“多米诺效应”:跨境电商卖家收获额外汇兑收益,汇损挑战待解
- “心友会”吐“心”生
- 英媒:富勒姆提高了报价,威廉将与他们签下一份新合同
- 新时代下的慈善事业发展路径探析与实践
- 北京版“数据二十条”发布,对数据安全提出明确要求(附意见全文)
- 去哪儿CEO陈刚:员工旅行基金追加至3000万 应届生享受千元递增激励金
广告
- 联播连连看丨浙江平台经济的“勇”和“永”
- 受超出预期的ADP数据影响,美债收益率跳升
- 壹点发布|临邑县:六大重点全面发力,推动工业经济高质量发展
- 世界编码器大赛结果公布 快 手 SL200 获 16 项第 一
- 5年翻3倍!上海人工智能产业规模已超3800亿元【附上海市人工智能产业链】
- A股收评:创业板指收跌0.91%,北上资金净卖出13.26亿元
- 游戏手柄万能驱动(游戏手柄 驱动)
- 德国5月工厂订单增长6.4%远超预期 制造业低迷缓解中?
- 全球热资讯!甘肃政法楷模发布 陇南市2名民警入选
- 【全球聚看点】司法部规范33类81项公证事项 进一步精简证明材料
- 结合现代加密技术与量子光特性,科学家首次演示“量子数字支付”
- 2倍牛股拓维信息再获涨停!AI行情或进下半场 关注业绩兑现方向
- 18岁女子患早衰症容貌似50岁,14岁参加选美后突然长皱纹|天天速读
- 毕业季 好好说再见
- 三星bada系统怎么刷机(三星bada系统刷机方法教程)_即时焦点
- 2023年7月6日鸡蛋价格小幅上涨-当前要闻
- 6月全球制造业采购经理指数继续下行 全球经济复苏面临较大挑战
- 《2022年全国教育事业发展统计公报》发布 我国专任教师超1880万人-天天速递
- 牛津大学为掠走东非马赛人文物送196头牛赔罪,马赛人:不够!-全球速读
- 【天天快播报】价格低、保障高 “物美价廉”的惠民保如何持续“惠民”