来源:36Kr。

小说,一个在现实世界和番茄世界之间游走的鬼马少女,带给用户不一样的聆听价值。

在年轻人的社交潮流中,现在有了一个新的方向:找对象。
“搭档”一词源于吴语,在2007年出版的《上海话词典》中有所提及,解释为:一起打牌的人引申为搭档。到了2023年,“合伙人”被赋予了新的含义。是一种新型的垂直社交关系,比朋友浅,但比同事深,专注于垂直细分的精准陪伴。
依靠着万物皆可造的信念,寻找“美食伙伴”、“旅行伙伴”、“健身伙伴”、“学习伙伴”的声音不绝于耳。在“友情衰退”的时刻,伴侣承担了年轻人一定的情感需求,并不一定要像维持亲密关系一样受到年轻人的欢迎。但是,你有自己的小说搭档吗?
近日,番茄小说正式公布了虚拟数字人IP——范娟娟,并推出了番茄世界的陪伴仙女范诺诺。

范娟娟是番茄小说的代言人,也是团队小品里大家的团宠。她好动、好奇、活泼、聪明,喜欢看书、推书,是个问题解决者,能把番茄世界和现实世界连接起来,是网友不可或缺的小说“伙伴”。范诺诺是一个卷毛小精灵,可爱又有意义,问题的发现者,对番茄世界正在发生的一切了如指掌。
经过近几年的发展,虚拟数字人终于完成了从技术出路到产品落地的转型,而卷的出现,为热爱阅读和听小说的用户带来了全新的“伴侣”体验。
数字人A,你专属小说的新伙伴。
如今,AI合成语音、魔幻配乐的电影、综艺解说已经成为短视频圈的一大现象,大众也已经接受了这种视频解说。
但是这种罐装的AI语音包放到小说阅读中就会失效。这是因为视频媒体和图形媒体有着天然的区别:视频直观易懂,能清晰地传达信息,而文字需要动用人的大脑皮层进行思考和互动。用户在阅读和聆听作家的文字时,需要先在脑海中构思作者描绘的另一个世界,然后再去匹配人物。另外,小说人物众多,情节跌宕起伏。如果他们一直使用同一个没有情绪波动的声音,也会让用户感到无趣和无味。
合伙人文化的流行源于年轻人对共同兴趣的追求。作为番茄小说的虚拟IP形象,也是一个可以跨越现实世界和书本世界的数字人。就像现实世界中的伙伴,在阅读一本书的时候,会跟着故事产生相应的阅读情绪。和书友打招呼的时候会有很酷的“出道”,偶尔玩宝会出礼盒,看到甜腻的情节会想“踢翻狗粮”,表示怀疑的时候也会和凡诺打问号。
其实范娟娟是个老书虫,直到有一天打开一本书后,他“穿越”进了番茄世界,认识了范诺诺,范诺诺对番茄世界了如指掌。这里解释一下什么是番茄世界。番茄世界是另一个独立于现实世界的世界,其中有无数个子世界,每个子世界指的是一本书。范娟娟和范诺诺都属于番茄界。当番茄世界的读者认识了他们,范娟娟就会和范诺诺一起来到现实世界,和读者成为形影不离的小说伙伴。
今天在番茄小说评论区上线了12个以范娟娟和范诺诺形象制作的表情包。此外,当番茄小说被催促更新时,它还会代替用户下跪,乞求作者加快更新速度。
官方公布的成交量正好符合数字人从颜值开始,以价值结束的大趋势。表情包、提醒等衍生场景可以拉近用户与虚拟人的距离,在用户层面强化番茄小说品牌。介意。另一方面,也让用户体验到虚拟数字人作为小说伙伴不可或缺的陪伴感,拥有多层次、多情感、定义明确的替代小说阅读体验。

数字人的b端,技术淘汰的最后一公里
2D图像是如何在3D世界中传播的?这不仅是数字人行业需要考虑的问题,也是番茄小说团队在做卷时面临的现状。
与2D卡通形象不同,三维拟人形象对人脸捕捉和人体建模提出了更高的要求。换句话说,随着信息维度的增加,所需的计算量也越大。
作为真实世界在番茄世界的映射,番卷不仅是番茄世界的根基,也是用户进入缤纷番茄世界的“通行证”。
正因如此,番茄小说团队和字节火山语音数字人团队,在设计卷体之初,首先确定卷体的形象定位和人员设计,然后进行人物的原画创意设计,再经过3D模型人物将会经历的建模-绑定-渲染环节,进而获得可由AI驱动的UE渲染管道资产。
然而,这并不是结束。从形似到神似,最后到对番茄小说读者的精神满足,需要对现阶段的数字人进行深入的口语训练,呈现人形动作。通过整合在线语音数字人应用平台,在平台的帮助下可以简单快捷的制作推送书籍的视频。输出视频内容质量稳定高效,大大节省了制作时间和成本。
此外,相比业界最好的面部驱动技术广泛推广的GPU方案,卷背后的火山语音AI数字人技术可以同时兼容非GPU版本。搭载最新的英特尔至强可扩展系列处理器,优化AVX512指令集,不仅实现了准确自然的假唱效果,还大大降低了部署难度和计算能力依赖。值得一提的是,第一卷应用了火山语音数字人研发的运动融合技术,可以实现身体动作的自然过渡和中断,该技术也是数字人AI驱动领域的重要突破。
在渲染纹理方面,基于UE5引擎渲染,渲染效果也更好。支持Windows和Linux双平台部署和多场景实时驱动。根据不同部署场景的需求,分别测试了英特尔数据中心的Flex 170 GPU和消费级ARC A770 GPU。依靠最新的GPU驱动和Intel OneVPL实时编码工具,都取得了不错的性能。

独行快,众行者远。番茄小说和火山之声团队为数字人构建了一套深度的技术壁垒体系。在渲染方案上,采用了边缘云和视频中心PaaS支持的云渲染方案。在内容生成方面,火山语音数字人类团队也与字节光年江南团队深度共建,持续探索AI动作生成、AI场景生成等前沿技术。
总之,卷帙浩繁的出现不仅丰富了番茄小说的品牌形象,也证明了番茄小说的技术实力。

有声读物的想象空间谁来承载?
在生活快节奏的当下,用耳朵看书已经成为人们生活的常态。这是因为听书对各种阅读场景的适应性很高,是用户度过通勤、等待、吃饭、上厕所等各种碎片化时间的一种方式。有声书不仅能提供减压和娱乐,还能提供陪伴和治愈的感觉。
中国新闻出版研究院发布的《国民阅读调查报告》显示,2022年,我国成年公民阅读率从当时的17%提高到35.5%。有声书的现有消费者中,收听粘性似乎已经形成,很多人愿意为此付费。艾瑞的调查数据显示,每月消费90元以上的用户中,超过一半的人每天至少听一次有声书或广播剧。每月消费11-20元的用户中,有近一半每周听5-6次,占比44.9%。
随着用户规模的逐渐扩大,丰富多样的有声书内容是用户习惯听书的基础,高质量的听书体验是内容提供商区别于其他玩家的重要途径。
为此,番茄小说与火山语音团队就AI阅读功能达成长期合作。在TTS(文本转语音)技术的基础上,在新颖的音色中引入多风格音色和丰富的情感表达,使其更适合听书。同时结合用户听书需求,提供单音彩播、多角色对话、沉浸式配乐等有声图书制作方案,为用户提供多种形式的高品质听书体验。
番茄小说一直非常重视对自身知识产权的保护,已经申请了30多项TTS技术相关的专利。通过这些专利的技术解决方案,不仅提高了有声书的制作效率和质量,也提升了用户在听和看场景中的消费体验。
经过两年的潜心打磨,番茄小说团队现已形成一套角色清晰、情感丰富的AI多角色播出方案,并作为AI有声小说领域首个高质量综合解决方案推出。
具体来说,番茄小说可以围绕不同网文的角色内容和文本理解能力,产生适应不同年龄、不同风格的AI音色矩阵,可以通过NLP(自然语言处理)技术智能理解文本内容,实现角色自动配音,可以像专业配音演员一样“哭”和“笑”来表达文本内容的深情,从而形成拟人化的多角色、多情感的表达效果。
此外,上述能力还与音频创作流程落地创作平台相结合,既能实现规模化生产,又能满足差异化、高质量的内容定制需求。目前AI配音家族有60+的优秀音色。
随着越来越多的技术赋能,AI时代的多角色广播逐渐进入大众视野,番茄小说也将加速释放有声读物的陪伴属性,打造更加差异化、精细化的定制化内容。可想而知,一个拥有千万种声音的声音宇宙正向我们走来。

微信扫码
QQ扫码
您的IP:10.1.228.218,2025-12-18 16:02:52,Processed in 0.42088 second(s).