
F'ambjenti kumplessi, il-bnedmin jistgħu jifhmu t-tifsira tad-diskors aħjar mill-AI, għax ma nużawx biss widnejna iżda wkoll għajnejna.
Pereżempju, naraw fomm xi ħadd jiċċaqlaq u nistgħu nkunu nafu b'mod intuwittiv li l-ħoss li nisimgħu żgur ġej minn dik il-persuna.
Meta AI qed taħdem fuq sistema ġdida ta' djalogu tal-AI, li għandha tgħallem lill-AI titgħallem ukoll tagħraf korrelazzjonijiet sottili bejn dak li tara u dak li tisma' f'konverżazzjoni.
VisualVoice jitgħallem b'mod simili għal kif il-bnedmin jitgħallmu jimmasterjaw ħiliet ġodda, u jippermetti separazzjoni tad-diskors awdjoviżiv billi jitgħallem indikazzjonijiet viżwali u awditorji minn vidjows mhux ittikkettati.
Għall-magni, dan joħloq perċezzjoni aħjar, filwaqt li l-perċezzjoni umana titjieb.
Immaġina li tista' tipparteċipa f'laqgħat ta' grupp fil-metaverse ma' kollegi minn madwar id-dinja kollha, tingħaqad ma' laqgħat ta' gruppi iżgħar hekk kif jiċċaqalqu fl-ispazju virtwali, li matulhom ir-reverbi tal-ħoss u t-timbri fix-xena jaġġustaw skont l-ambjent.
Jiġifieri, jista' jikseb informazzjoni awdjo, vidjo u test fl-istess ħin, u għandu mudell ta' fehim ambjentali aktar għani, li jippermetti lill-utenti jkollhom esperjenza tal-ħoss "wow ħafna".
Ħin tal-pubblikazzjoni: 20 ta' Lulju 2022