金年会|14年专注表情包定制开发-微信打赏500万+官方平台

金年会官方网站,专业表情包/动态贴纸定制服务商,欢迎咨询:010-51627888

金年会,金年会官方网站,金年会官网首页,金年会官网入口

金年会
互联网表情包定制专家
您现在的位置: 首页 > 行业动态 > 行业资讯

大神李沐回归B站「做了个实时数字人」直言「水平吊打我自己」

2026
05-21
被阅读:

  时隔近一年,那个在 B 站教大家阅读 AI 论文的大神李沐 @跟李沐学 AI,终于回归了!   在最新一期视频中,李沐「做了个实时数字

  时隔近一年,那个在 B 站教大家阅读 AI 论文的大神李沐 @跟李沐学 AI,终于回归了!

  在最新一期视频中,李沐「做了个实时数字人」,并与 TA 进行视频对话,从视频来看,数字人形象确实挺逼真的,用他自己的话说,「水平吊打我自己」!

  而这背后的技术正是李沐的创业公司——BosonAI 发布的一款名为 Higgs Avatar v1 的模型:面向语音智能体的实时数字人。

  官方介绍,作为一个实时基础模型,Higgs Avatar v1能够为客服对话、虚拟助手、培训以及互动体验带来更接近真人的数字化形象与临场感。

  而且操作起来非常简单,只需要一张静态图片,就能生成生动、富有表现力的面部表情,并支持说话、倾听和回应。所有操作都以逐帧方式完成,并与音频保持同步。

  BosonAI 团队介绍,上述李沐的展示的视频内容完全由 AI 生成,不仅没有预设脚本,也没有动画制作流程、预渲染循环,每一帧都是实时渲染完成的 —— 包括声音、对话、口型同步、头部动作和表情。

  无脚本的即兴表演:模型会跟着语音流,金年会股份有限公司逐帧实时渲染出唇形同步、头部动作和面部表情。你听到什么,就看到什么,完全是即兴发挥。

  开局一张图,剩下全靠 AI:不需要好莱坞级别的 3D 动捕,也不用预先录制僵硬的循环视频。只要给它一张静态照片,Higgs Avatar v1 就能瞬间生成一个会听、会说、会给反应的动态面孔。

  快到没有「时差」:业界公认保持实时对话不卡顿的延迟底线 毫秒,而 Higgs Avatar v1 生成一帧画面只需要16 毫秒!这意味着数字人的表情永远紧紧贴合声音,绝不拖泥带水。

  极致的算力性价比:对于企业级应用而言,成本是落地的关键。单张 H100 GPU 即可同时支持 8 路实时对话并发,将单次对话的成本压缩到了完全能够满足大规模生产部署的水平。

  在实际业务场景(如保险销售、企业教练、虚拟面试及互动娱乐等)中,Boson AI 现已形成了双擎驱动的格局:Higgs Audio 负责语音的理解与生成,Higgs Avatar 负责赋予 AI 真实的「面容」。

  「我们之所以坚持自研基础模型,是因为生产环境中的对话式 AI 无法由外部组件拼凑而成。」 Boson AI 团队在发布声明中强调。

  如果只是把现成的外部 API 缝合在一起,金年会股份有限公司延迟卡顿、抢话冲突、声音跟表情脱节等问题根本没法解决。只有从头开始全栈自研,把声学与面部表情的情感对齐、端到端的工作流编排死死咬合在一起,才能彻底打破交互的隔阂。

  迫不及待想看看沐神新作品的同学们,可以去官网排个 Waitlist 占坑了。对于有企业集成、定制模型或 API 访问需求的客户,也可直接通过官方邮箱联系。


本文由:金年会,金年会官方网站,金年会官网首页,金年会官网入口提供
上一篇:Jeff主页-盖世汽车
下一篇:果粉大喜!苹果深夜官宣降价:iPhone17Pro进入600
金年会互联网科技有限公司
虚线
虚线
虚线
金年会互联网科技有限公司
王先生:010-51627888(总经理)

网址:https://www.xakujiu.com

地址:陕西省西咸新区空港新城空港国际商务中心BDEF栋F区3层10301号D-16
公示信息

Copyright © 2025 金年会互联网科技有限公司 版权所有  陕ICP备18015085号-1 SiteMap