微软实验室助力虚沅数,打造搭载 ChatGPT 能力的 3D AI 数字人





随着大语言模型和 AIGC 技术席卷各个行业,也引发了新一轮的人机交互创新革命。


AI 数字人是采用人工智能技术驱动生成的数字化的虚拟人物,它具备人的外观、感知互动能力以及表达能力。


据IDC预测,至2026年,中国 AI 数字人市场规模将达到102.4亿元人民币。AI 数字人将被越来越多的行业应用在实际业务场景当中。例如,以银行为代表的金融行业,超过80%的银行都将部署数字人,并将承担90%的客服和理财咨询服务等。


关于虚沅数








虚沅数成立于2022年,是集元宇宙 AI 数字人,元宇宙线上、线下空间和 XR 开发于一体的涵盖全栈元宇宙技术能力的创新型企业。


虚沅数的核心业务是帮助企事业单位通过大语言模型私域化实现数字化转型,帮助企事业单位梳理自身业务流程和整理业务数据等。针对企事业单位的实际业务需求,选择大语言模型进行训练、调优和接入,最终采用领先的 3D 超写实 AI 数字人技术进行应用开发、部署和交付。


公司创始团队在 XR 领域、自然语言交互和内容行业具有近10年的从业经验。自成立以来,虚沅数已经为企业客户提供了覆盖多业务场景的成熟解决方案,助力商业、文旅等产业升级,为线下商业综合体,展馆、文旅景区、会务和政务等行业提供一整套的元宇宙解决方案。


用科技和艺术造福社会!

—— 虚沅数 CEO 高海宁




微软实验室助力虚沅数,打造通用型 3D AI 数字人








在微软实验室工程师团队助力下, Azure OpenAI 加速计划赋能企业虚沅数,基于微软的 Azure AI 全栈式技术服务,将 Azure OpenAI 和 Azure AI Speech (Text to SpeechSpeech toText) 等前沿技术嵌入到虚沅数的 3D AI 数字人中,加速具备 ChatGPT 能力的数字人项目落地。同时,在此次项目的打造过程中,还融入了微软的视素 ID (Viseme ID) 技术。


视素是口语中音素的视觉描述,它定义了一个人说话时面部和嘴巴的位置。微软提供22个不同视素,每个视素描述一组特定音素的嘴部位置和姿态。借助 Azure AI Speech 技术,一段话的口型变化得以生成,虚沅数则根据微软的视素 ID 与自身超写实 3D AI 数字人的 160 组表情以帧为单位进行融合驱动,以实现更加生动的面部表情和口型效果。


用户可以通过语音或者文字的方式向 3D AI 数字人提出问题,数字人则基于 ChatGPT 大语言模型,以语音回应的形式将答案表述出来。目前,3D AI 数字人以被广泛用于智能客服、信息咨询、健康管理和游戏娱乐等多种生活场景当中。


未来,随着大语言模型的应用普及、元宇宙 3D 技术的逐渐完善和数字人技术的进一步成熟,基于多维度,多视角,多模态和具身智能的 3D 超写实 AI 数字人将会逐渐渗透到各行各业,与用户进行更加深入的交互。


由虚沅数打造、微软实验室技术赋能的 3D AI 数字人 Demo 已部署在上海实验室展厅。欢迎在数字人应用领域的企业和技术专家们前来交流。






本视频拍摄于上海实验室



AI



扫码了解  Microsoft AI & IoT Insider Lab 

微软人工智能和物联网实验室(上海)是微软中国和张江集团共同建设、联合运营的前沿技术商业化应用与联合创新机构。目前,微软分别在美国雷德蒙德、旧金山、德国慕尼黑、中国上海、日本神户和乌拉圭蒙得维的亚设有联合创新实验室,帮助各行业的企业客户探索人工智能及更多前沿科技热点,加速产品落地与商业化。

自2019年5月运营以来,上海实验室已赋能了包括 ABB、索尼半导体、汉朔科技、DataMesh 等各个行业近200家大中小校友企业。借助微软领先的前沿科技和开放的生态资源,微软实验室为企业在技术创新与商业应用方面提供创新孵化、技术研讨、原型验证等多项定制化服务。


首页标题    成功案例    微软实验室助力虚沅数,打造搭载 ChatGPT 能力的 3D AI 数字人
浏览量:0