作者 | 徐珊
(资料图)
编辑 | 云鹏
从“吉祥物”走向“实力派”,是过去两年数智人行业明显一大趋势。数智人的落地,逐渐脱下了“高价”、“噱头”、“流量”等标签,开始走向更务实的生产场景。
这带来了巨大的蓝海市场,IDC报告显示,中国AI数字人市场规模呈现高速增长趋势,预计到2026年将达102.4亿元人民币。
作为多项AI技术应用的载体,数智人是如何摆脱高价标签,从大企业走向小商户,成为小微企业经营的“可选项”,甚至成为个人创作者的创作工具?
在今年的世界人工智能大会中,一项数字人定制现场体验成为本届大会最具亮点的环节之一,吸引了不少人参与。
从现场体验来看,这项复刻专属的数智人分身过程非常简单,只需在一个小型影棚内,阅读一段3分钟左右的文本,并对画面和音频进行收录,生成视频素材并在后台提交,即可在24小时内快速生成与真人无异的数字分身。
据展台工作人员介绍,这项体验基于今年腾讯云推出的小样本数智人工厂实现,仅需3分钟视频、24小时内即可复刻2D数字分身,让数智人应用的服务成本大大降低。
而生成好的数智人,使用起来也非常方便,只要提供所需文字内容,数字分身即可自动生成语气自然、表情生动的真人形象出镜视频,助力使用者在营销数字分身、数字主播、口播知识生产等场景中提升创作效率。
▲大会现场观众体验3分钟素材生成小样本数智人
一、小样本数智人降低数字人应用成本
“现在办个产品发布会、晚会,没有几个数智人都好像都落伍了。”不少市场营销人员感叹道。前不久各大电视台的跨年晚会上,浙江卫视的“谷小雨”、东方卫视“东方嫒”、四川卫视的“三星堆摇滚天团”等数智人纷纷登台表演,十分吸睛。不少科技产品发布会上,数智人还会成为主持人,介绍最新产品信息,甚至还能讲几个冷笑话串场。
▲中国国家博物馆虚拟数智人艾雯雯
随着越来越多的企业关注到数智人的落地进展,腾讯、百度、阿里、网易等巨头纷纷推出自家的数智人产品方案,同时,世优科技、次世文化等创企涌入该赛道。大量新玩家的涌入,为数智人赛道带来了一定的“虚热”,但想让数智人走向产业深处,仍有不少待解决的难题。
比如说,大部分数智人都是以视频、海报等品牌宣传形式出街为主,与业务场景结合并不够清晰。再比如说,过往复杂的训练样本数据采集,导致数字人定制过程长、成本高,一定程度上限制了数字人的快速应用落地。
对此,腾讯云智能数智人产品总经理陈磊分析道:“在今年,数智人的实现路径和实现效率认知已经有了大幅提升,现阶段数智人不仅能在营销传播上带来一定关注度,在企业中也能成为真正有用、能为企业带来价值的“数智员工”。
在2023世界人工智能大会上,腾讯云公布了一系列数智人领域的进展。在数智人领域,今年腾讯云推出了小样本数智人工厂,仅需少量数据、24小时内即可复刻2D数字分身,让企业应用数智人服务成本大大降低。依托AI生成算法,数智人3D形象的复刻速度也将得到大幅提升,通过生成式动作驱动,结合行业大模型能力,可让企业获得更“个性化、专业、自然逼真”的数智员工,让“面对面”专业服务成为可能。
数字经济学者刘兴亮在过去半年,已经在日常规模化使用专属“数智人”制作其真人出镜的短视频“亮三点”。刘兴亮分享称:“这个形象近似真人,表情、唇型匹配自然,包括我的特色口音也模拟得惟妙惟俏的数智人,正是腾讯云智能小样本数智人。未来,不需要搭建拍摄场地,也不用提前化妆彩排,不受空间、时间限制,数智人可以随时随地帮我生成口播视频,解放我的生产力。”
▲数字经济学者刘兴亮用小样本数智人生产视频
而在今年的展台现场,央视总台记者也进行了现场体验,与自己的数字分身进行“对话”。就像《西游记》中“真假美猴王”的故事,随着数字人技术的发展,记者也在现实世界中遇到了另外一个自己。
▲央视总台记者在体验现场与数字分身“对话”
二、落地金融、汽车等领域,数字人加速步入产业
尽管寻找合适的落地场景是数智人玩家打通产业中不可或缺的一步,但是如何打造客户满意的数智人,如何进一步降低使用门槛,如何让数智人和更多生产环节打通,则是玩家们脱颖而出的关键。
例如,数字人虽然越来越受企业和广告主的欢迎,但高昂的制作和运营成本问题一直有待解决。复杂的训练样本数据采集,导致数字人定制过程长、成本高,一定程度上也限制了数字人的快速应用落地。
今年4月,腾讯云首次对外公布小样本数智人生产平台,该平台具有训练样本小、生产效率高、自动化生产等特性,可以实现低成本“自助式”数智人生产制作。依托腾讯自研AI能力和技术经验,只需要3分钟真人口播视频、100句语音素材,平台便可通过音频、文本多模态数据输入,实时建模并生成高清人像,在24小时内制作出与真人近似的“数智人”。
又例如,如何让数字人和更多经营、运营环节打通,实现降本增效,发挥生产力效用。
比如说,早期的虚拟代言人、虚拟偶像多数为拥有虚拟形象的主播和动捕演员甚至是CG动画,场景也多局限于文娱领域,呈单向传播、且后期运营无力。不少虚拟代言人都“昙花一现”,生存周期较短。但随着AI大模型在数智人的语言、理解等方向不断升级、加入玩家增多,技术成本降低,都在促使数智人厂商更深入地走向产业,打开更多数智人应用场景,进入金融、传媒、出行、文旅等行业。
像网上开户业务本是券商的高频业务场景,是机构获得客户的关键渠道,也与人工服务息息相关。传统的真人提供的人工客服服务存在一定的局限性,比如说,真人客服只能在同一时间接待1个客户,这就对客服团队的人员数量有较高要求。并且,真人客服也很难24小时提供服务,容易造成客源流失。
但有了“数智员工”,这些问题都能迎刃而解。中信建投证券联合腾讯云智能打造了业内首个可交互“数智员工”,通过真人形象信息采集,动作捕捉、二维建模等技术高度还原员工形象,以实现更沉浸式的服务效果。这类数智人包含AI驱动的技术内核和行业理解力,能在特定场景中自主完成工作,不依赖人工的运营支持,真正将员工从重复、枯燥的工作中解放出来,实现降本增效。
▲中信建投证劵“数智员工”
“数智人不但能支持开户环节的相关工作,还可以指导客户了解操作流程、注意事项等,甚至能更加有针对性的解决客户在业务办理过程中遇到的问题。” 中信建投项目负责人分享称,目前中信建投证券95%以上的新客开户都会使用到该系统。中信建投表示,腾讯云智能数智人在开户场景上线以来,在提高见证效率、优化客户体验等方面起到了良好的示范作用。他们希望数智人可以在智能客服等场景中得到更好的应用。
这一场景不仅出现在金融行业,同样也在汽车等多个行业上演。例如,一汽大众的数智人Ida,是首个全旅程陪伴式“数智导购”,从看车到选车、聊车、购车,Ida都将全程陪伴在用户身边。
据陈磊介绍,基于首个汽车行业语料驱动,她可以通过丰富的讲解介绍,将用户在线浏览时长提升至10分钟以上,远超业内一般水平。并且,用户还极大的缩短了用户在认识新车-理解-好感-购买的购车链路,其云展厅的用户留资率远高于其他线上板块,超过13%。
从中信建投证券和一汽大众的“数智员工”的案例中,我们可以看到,越来越多的数字人开始进入产业。并且,随着案例的不断积累,走出“试用期”的数字人将会为用户提供更自然的交互体验。
三、距离数智人步入千行百业,还有多远?
事实上,除了金融、汽车行业,数智人的应用前景,远比人们认知的还要更为广阔,与不同类型企业的结合方式也更加多样。摆脱华美外观后的数智人,将会更强调功能性。这需要对数智人的本质有更深的了解,才能更好的挖掘相关功能。
数智人本质上是语音语义、自然语言处理、计算机视觉、机器学习等多模态AI技术的集合体。腾讯云智能数智人产品总经理陈磊认为,数智人赛道未来继续发展,既需要通过技术推动形象生产效能的提升,也需要更多行业知识接入,让数智人能做到理解“千行百业”。
首先,认知层面,产业客户对数智人的业务价值了解不够全面,存在一定刻板印象。事实上现在大部分行业业务的前期、中期、后期阶段都能接入数智人的相关业务。“在前期,我们可以通过数智人来建立品牌形象,通过营销互动,提高用户的转换率。”陈磊说。不仅如此,数智人还可以承担部分业务办理服务,甚至是售后服务。在有了颇具行业特色的形象后,数智人还能和用户维持一定的情感连接,维系用户客情。基于对各行业理解的不断加深,腾讯云智能梳理了14个行业大类、130+个数智员工可上岗的场景,作为落地应用的指引,为产业客户和数智人之间搭建合作的桥梁。
▲腾讯云智能数智人百大应用场景
腾讯认为文旅、传媒、政务、教育、金融将成为数智人主要落地场景,消费电子、出行、医疗、能源、地产等也将会逐渐链入数智人相关业务。“我们在选择场景时,场景落地可执行性和可复制性将是我们主要考量的要素之一。同时我们也会探索一些有社会价值的领域。”陈磊说:“我们会有几个主要场景,但一些大的场景方面会和产业伙伴联合。”
其次,不同落地场景对数智人的要求也不尽相同,比如说金融领域,数智人的专业性要求更高,功能性更强,需要迅速响应各类服务,而像数智主播、数智导游、数智管家等,腾讯云智能则需要打造行业语料库训练相关语言模型,从而支持不同语境及需求下的表达交互。
最后,数智人的形象供给效率也不断提高。过去打造一款专属的数智人形象可能要3个月左右时间,涉及拍摄视频的话,成品等待时间或长至半年。为了降低数智人制作门槛,加速数智人向千行百业的普及,腾讯云智能提出了自动化的“AI+数智人工厂”的方向,依靠“产、销、服”的一站式平台,实现“自助式”购买、生产和应用数智人,大幅提升数智人生产效率。借助该平台,数字人制作已能实现数千元的成本和小时级的制作时长,大幅降低数字人使用门槛。
针对数智人的运营,腾讯还提供了播报数智人平台和交互数智人平台服务,满足企业高效打造数智员工的诉求。播报数智人平台支持通过文字、语音输入快速生成数智人视频;交互数智人平台可打造数智员工,定制专属问答库,提供7*24小时人机双向交互服务,还能实现数智人直播服务,自由切换真人语音接管,与用户问答互动。
“小样本数智人支持半身、全身形象展示,手势动作会根据内容灵活调整,也支持录制背景任意更换,适用于直播带货等更广泛的商用场景。”
目前,不少用户已经开始真正从效能角度,考虑数字人的实用价值。而伴随大模型技术进入行业落地攻坚战,数字人应用也有了更大的想象空间。
例如,作为医疗行业数字技术的供应商,上海医微讯就计划通过数智人打通就医过程中各环节存在的障碍,比如,在就医者进入门诊大厅以后,帮助其快速挂号、诊室指引等。同时,帮助医生开展医患教育和知识分享。比如,用数智人代替医生为患者进行相关知识的科普和培训。
《人机共生——大模型时代的AI十大趋势报告》指出,生成式人工智能所展现出来的高灵活度以及强交互性让人们对AI技术有了全新的认知。这种全新的AI技术让数字人更像真实的人,能够更充分地挖掘和梳理信息、知识,并更贴近人类日常交流和表达习惯地处理语句。未来构建数字内容的过程中,数字人将广泛应用于各种场合,提高工作效率并实现成本降低。
关键词: