2024-08-17发表2025-03-21更新 ByteAILab 8 分钟读完 (大约1136个字)

1篇Outstanding、5篇Oral！字节跳动今年ACL这么猛？来直播间聊聊！

本周学术界瞩目的焦点，无疑是在泰国曼谷举行的 ACL 2024 顶会。这场盛会吸引了全球众多杰出的研究者，大家汇聚一堂，共同探讨和分享最新学术成果。

官方公布的数据显示，本届 ACL 共收到近 5000 篇论文投稿，其中 940 篇被主会录用，168 篇工作入选大会口头报告（Oral），录取率低于 3.4%，这当中，字节跳动共有 5 篇成果中选 Oral。

在 8 月 14 日下午的 Paper Awards 环节，字节跳动旗下成果《G-DIG: Towards Gradient-based DIverse and high-quality Instruction Data Selection for Machine Translation》被主办方官宣入选 Outstanding Paper（1/35）。

ACL 2024 现场照片

回溯 ACL 2021，字节跳动曾摘下唯一一篇最佳论文桂冠，是 ACL 成立 59 年以来，中国科学家团队第 2 次摘得最高奖项！

为深入探讨今年的前沿研究成果，我们特意邀请字节跳动论文的核心工作者解读分享。8 月 20 日下周二 19:00-21:00，「字节跳动 ACL 2024 前沿论文分享会」线上开播！

豆包大语言模型研究团队负责人王明轩，将携手字节跳动多位研究员黄志超、郑在翔、李朝伟、张欣勃、及 Outstanding Paper 神秘嘉宾，分享 ACL 部分精彩中选成果，研究方向涉及自然语言处理、语音处理、多模态学习、大模型推理等领域，欢迎预约！

活动议程

ACL 2024 活动议程

精选论文解读

论文地址：RepCodec：一种用于语音离散化的语音表示编解码器

随着大型语言模型（LLMs）近期的快速发展，离散语音标记化在将语音注入 LLMs 中发挥重要作用。然而，这种离散化导致信息的丢失，从而损害整体性能。为提高这些离散语音标记的性能，我们提出了 RepCodec，这是一种用于语义语音离散化的新型语音表示编解码器。

与重建原始音频的音频编解码器不同，RepCodec 通过从诸如 HuBERT 或 data2vec 等语音编码器重建语音表示来学习 VQ 码本。语音编码器、编解码器编码器和VQ码本共同形成了一个将语音波形转换为语义标记的流程。大量实验表明，RepCodec 凭借其增强的信息保留能力，在语音理解和生成方面显著优于广泛使用的 k-means 聚类方法。此外，这种优势在各种语音编码器和语言中都存在，肯定了 RepCodec 的鲁棒性。该方法可以促进语音处理方面的大型语言模型研究。

论文地址：DINOISER：通过噪声操纵增强的扩散条件序列生成模型

…

期待你的互动提问

直播时间：2024 年 8 月 20 日（周二） 19:00-21:00
直播平台：微信视频号【豆包大模型团队】、小红书号【豆包研究员】

欢迎你填写问卷告诉我们，关于 ACL 2024 论文你感兴趣的问题，在线和多位研究员畅聊！

豆包大模型团队持续热招中，欢迎点击此链接，了解团队招聘相关信息。

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

1篇Outstanding、5篇Oral！字节跳动今年ACL这么猛？来直播间聊聊！

https://www.gptnb.com/2024/08/17/2024-08-16-auto5-A3dxEG/

作者

ByteAILab

发布于

2024-08-17

更新于

2025-03-21

1篇Outstanding、5篇Oral！字节跳动今年ACL这么猛？来直播间聊聊！

活动议程

精选论文解读

豆包大模型团队持续热招中，欢迎点击此链接，了解团队招聘相关信息。

作者

发布于

更新于

许可协议

喜欢这篇文章？打赏一下作者吧

链接

分类

最新文章

归档

标签

订阅更新

1篇Outstanding、5篇Oral！字节跳动今年ACL这么猛？ 来直播间聊聊！

活动议程

精选论文解读

豆包大模型团队持续热招中，欢迎点击此链接，了解团队招聘相关信息。

作者

发布于

更新于

许可协议

喜欢这篇文章？打赏一下作者吧

链接

分类

最新文章

归档

标签

订阅更新

1篇Outstanding、5篇Oral！字节跳动今年ACL这么猛？来直播间聊聊！