时间:01-18人气:15作者:糯米尐团子
单模只处理一种类型的信息,比如纯文字或纯图片;多模能同时处理多种信息,比如文字加图片加声音。
区别
单模:专注单一信息类型,效率高。比如文字识别软件只读文字,图片识别软件只看图像。任务明确,技术简单,适合单一场景。比如手机扫码支付只用摄像头识别二维码。
多模:整合多种信息,理解更全面。比如智能音箱同时听语音、看图像、理解文字。复杂但灵活,适合多场景互动。比如导航软件结合地图、语音指令和实时路况。
注意:本站部分文字内容、图片由网友投稿,如侵权请联系删除,联系邮箱:happy56812@qq.com