目前,哪怕是 DeepSeek 或者 ChatGPT,都是人类说一句 AI 答一句。这种方式很「被动」,AI 只能等你来召唤它。本期节目邀请到声网大语言模型实验室的李忻玮,和实时 AI 创业者史业民。围绕「更主动交互的 AI」的话题,分享包括语音、视频等多模态的主动交互,以及背后更具体的技术细节和路径。如何让 AI 像自然对话那样,适时地主动说话、打断或是沉默?如何实现在你出门时候,AI 主动提醒你带伞?黄仁勋和李飞飞都在做的「世界模型」是什么?它将如何帮助 AI 理解和预测更真实的世界?期待本期节目对你有所启发。
We also recommend:
Das TobCast Computer ABC
Tobias Kalder
Ask Different Podcast
Kyle Cronin, Jason Salaz, Nathan Greenstein
joystick5011
Media and Arts Technology Documentaries - Sound and Music Computing
Queen Mary, University of London
aLIVE
CTOcast
Sasha Astapenka & Pavel Paulau & Nick Frolov
Tech Square ATL
Tech Square ATL
Chit Chat Across the Pond
Allison Sheridan
JustinYanhzlzh
Nir And Far: Business, Behaviour and the Brain
Nir Eyal
Vestron Video Horror Podcast Horrorphilia
SysAdmin Show
Dustin Reybrouck: IT System Administrator