ACMMM2024奖项揭晓:中国学者荣获最佳论文奖

ACM MM 2024 奖项揭晓:中国学者荣获最佳论文奖

会议之眼 会议之眼

重磅干货,第一时间送达

会议之眼 快讯

ACM Multimedia 2024是由美国计算机协会主办的国际多媒体领域学术和产业界交流的顶级盛会,也是中国计算机学会(CCF)推荐的A类会议。专注于多媒体技术领域的最新研究成果、技术创新和行业趋势。会议涵盖了多媒体内容的创建、处理、传输和交互等多个方面,旨在促进学术界和工业界在多媒体技术应用和产品开发方面的交流与合作。

近日,第32届ACM国际多媒体会议(ACM Multimedia)于2024年11月1日在澳大利亚墨尔本圆满落幕。让我们一起回顾现场的精彩瞬间。


大会实况

会议议程紧凑而丰富,涵盖了多媒体技术领域的多个关键议题。会议举办了多场主题演讲、研讨会、技术教程等活动,深入探讨了机器学习与人工智能多语言处理云计算与虚拟化等前沿话题




最佳论文奖

本次会议共有4385篇投稿进入审稿阶段,最终1149篇论文被接受录用率是26.20%。在这些录用论文中,有26篇论文被提名为ACM MM 2024最佳论文。

其中,由杭州电子科技大学、中国科学院计算所、杭州电子科技大学丽水研究院、澳大利亚阿德莱德大学和麦考瑞大学合作的论文《从说话者到配音演员:基于韵律和时长一致性学习的电影配音》荣获ACM Multimedia 2024最佳论文奖。



最佳论文摘要

电影配音的目标是将剧本转换为在时间和情感上与给定电影剪辑相匹配的语音,同时保留简短参考音频的人声特色。配音语音必须表现出情感、节奏和环境的巨大变化,以实现真正的一致性,这使得配音成为一项复杂的任务。考虑到电影配音数据集规模有限(由于版权问题)和背景噪声的干扰,直接从电影配音数据集中学习限制了学习模型的发音质量。

为了解决这个问题,我们提出了一种两阶段的配音方法,让模型先学习发音知识,然后再进行电影配音练习。在第一阶段,我们引入了一种多任务方法,在大规模文本语音语料库上预训练音素编码器,以学习清晰自然的音素发音。在第二阶段,我们设计了一个韵律一致性学习模块,将情感表达与音素级别的配音韵律属性(音高和能量)联系起来。最后,我们设计了一个时长一致性推理模块,使配音时长与嘴唇运动保持一致。广泛的实验表明,我们的方法在两个主要基准上优于几种最先进的方法。



结语

随着ACM Multimedia 2024的圆满结束,我们见证了多媒体技术领域的又一次飞跃。中国学者的卓越表现不仅展示了国内科研实力的快速提升,也为全球多媒体技术的发展贡献了宝贵的智慧。让我们期待未来,随着技术的不断进步,多媒体世界将变得更加丰富多彩。同时,我们也期待中国学者在下一次的国际学术舞台上再创辉煌!




查计算机会议信息的一站式工具。会议截稿日期、召开信息、会议等级、会议现场、AI工具等您想要的信息这里都有!还等什么,快来体验吧~

精彩文章回顾

计算机领域为何只认顶级会议论文,而其他领域几乎都是只认可顶级期刊?


CVPR 2024圆满落幕:海报创意不断,学者穿cos服装讨论学术问题?!这届CVPR真是太有趣了


数字人演讲合成功能震撼上线!让思想插上人工智能的翅膀,跨越时空与界限!


最新全球计算机科学排名揭晓:清华大学登顶CSRankings亚洲榜首!


会议之眼网页端免费使用:https://www.conferenceeye.cn



NOW马上关注!
万水千山总是情,点个行不行


关于会议之眼
致力于为广大用户提供面向计算机领域的最新会议动态和学术热点。 会议之眼倡导社会奉献与公益性,力求建立公平、公正、科学的国际/国内会议评价体系,为大家提供更全面的、更富有学术价值的参考。
联系我们
邮箱
公众号
小程序
微信