F'ambjenti kumplessi, il-bnedmin jistgħu jifhmu t-tifsira tad-diskors aħjar mill-AI, għax nużaw mhux biss widnejna iżda wkoll għajnejna.
Pereżempju, naraw ħalq xi ħadd jiċċaqlaq u b’mod intuwittiv nistgħu nkunu nafu li l-ħoss li nisimgħu jrid ikun ġej minn dik il-persuna.
Meta AI qed taħdem fuq sistema ġdida ta' djalogu AI, li hija li tgħallem lill-AI titgħallem ukoll tagħraf korrelazzjonijiet sottili bejn dak li tara u tisma' f'konversazzjoni.
VisualVoice jitgħallem b'mod simili għal kif il-bnedmin jitgħallmu jegħlbu ħiliet ġodda, li jippermetti separazzjoni tad-diskors awdjo-viżiv billi jitgħallmu indikazzjonijiet viżwali u smigħ minn vidjows mingħajr tikketta.
Għall-magni, dan joħloq perċezzjoni aħjar, filwaqt li l-perċezzjoni tal-bniedem titjieb.
Immaġina li tkun tista 'tipparteċipa f'laqgħat tal-grupp fil-metaverse ma' kollegi minn madwar id-dinja, tgħaqqad laqgħat ta 'gruppi iżgħar hekk kif jimxu fl-ispazju virtwali, li matulu r-reverbs tal-ħoss u t-timbri fix-xena jagħmlu skond l-ambjent Aġġusta kif xieraq.
Jiġifieri, jista 'jikseb informazzjoni awdjo, vidjo u test fl-istess ħin, u għandu mudell ta' fehim ambjentali aktar sinjuri, li jippermetti lill-utenti jkollhom esperjenza ta 'ħoss "wow ħafna".
Ħin tal-post: Lulju-20-2022