新浪新闻客户端

中电信人工智能申请一种语音合成专利,提升语音合成的表现力

中电信人工智能申请一种语音合成专利,提升语音合成的表现力
2025年03月22日 11:30 新浪网 作者 金融界火线

  金融界2025年3月22日消息,国家知识产权局信息显示,中电信人工智能科技(北京)有限公司申请一项名为“一种语音合成方法、装置、设备及存储介质”的专利,公开号 CN 119649797 A,申请日期为2024年12月。

  专利摘要显示,本申请实施例涉及数据处理技术领域,具体而言,涉及一种语音合成方法、装置、设备及存储介质,旨在提升语音合成的表现力。所述方法包括:接收目标文本;从所述目标文本中获取对应的文本特征,所述文本特征中包含有音素信息、词边界信息以及句子信息;将所述文本特征输入预训练的语义模型中,得到所述文本特征对应的音素级别的语义特征;对所述语义特征进行多层级表征融合,得到多层级语义特征;对所述多层级语义特征进行单词与持续时间的对齐,以及,通过多头注意力机制对所述多层级语义特征进行音素与持续时间的对齐,得到对齐处理后的所述多层级语义特征;根据对齐处理后的所述多层级语义特征,得到所述目标文本对应的语音。

  天眼查资料显示,中电信人工智能科技(北京)有限公司,成立于2023年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本300000万人民币,实缴资本50000万人民币。通过天眼查大数据分析,中电信人工智能科技(北京)有限公司参与招投标项目265次,专利信息167条,此外企业还拥有行政许可1个。

特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。

来自于:北京
权利保护声明页/Notice to Right Holders
0条评论|0人参与网友评论
最热评论

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2025 SINA Corporation

All Rights Reserved 新浪公司 版权所有

广告

广告