安爸-超级家庭

阿里开源完全本地运行端侧数字人,手机无需联网即可使用。

安爸 发布于

几年前很多人就在讲端侧没用,现在还会这么认为吗?

不管是苹果三星,还是国产各厂手机,都在搞端侧模型。

还为此特意去了各品牌的线下门店试用了,很多场景根本就没必要联网在云上做,而且端侧才会最大限度保护用户隐私。

现在各手机厂已经做了的端侧模型有不少了,音频转录,TTS,OCR文字识别,大语言模型,图片处理等等。

今天给大家推荐的是MNN TaoAvatar App,阿里做的端侧数字人,目前仅支持Android,IOS估计也很快了。

完全本地,端侧是真的猛。

  • LLM(大型语言模型)
  • ASR(自动语音识别)
  • TTS(文本转语音)
  • A2BS(音频到行为合成)
  • NNR(神经渲染)

扫码加入AI交流群

获得更多技术支持和交流

(请注明自己的职业)

项目简介

MNN TaoAvatar Android 是一个开源本地智能 3D 虚拟形象应用,基于《TaoAvatar》论文实现,能在安卓设备本地运行 LLM、ASR、TTS 等多种模型。其具备对话 AI、语音识别、语音合成等功能,可让用户离线与 3D 虚拟形象畅快聊天。对手机硬件性能要求,需骁龙 8 Gen 3 等旗舰芯片、8GB 以上内存、5GB 以上存储空间。

DEMO

技术特点

模型压缩优化:基于 MNN 引擎,采用量化、剪枝等技术压缩模型体积,提升运行效率。

多模型协同:整合 LLM、ASR、TTS、A2BS、NNR 等多模型,实现端到端流程。

硬件加速:支持 GPU/NNAPI 等异构计算,充分发挥旗舰芯片性能。

轻量化设计:核心模型仅 1.5B 参数,适配移动端资源限制。

离线运行:全流程本地化,无需网络依赖,保障隐私安全。

高效渲染:NNR 神经渲染技术实现表情细节实时生成。

跨平台潜力:基于 MNN 框架,具备向 iOS 等平台扩展的基础。

项目链接

https://github.com/alibaba/MNN/blob/master/apps/Android/Mnn3dAvatar/README.md

关注「开源AI项目落地」公众号

(文:开源AI项目落地)

阿里开源完全本地运行端侧数字人,手机无需联网即可使用。最先出现在每时AI


扫描二维码,在手机上阅读