「肢解」谷歌帝国!Chrome安卓或遭剥离,AI训练数据被迫共享

文章来源:新智元

【导读】反垄断案败诉,谷歌或将面临「分家」,一旦与Chrome和安卓操作系统解绑,谷歌该何去何从?

谷歌刚热热闹闹地开完「谷歌制造」发布会,一个晴天霹雳就打到谷歌头上——违反反垄断法,全球搜索引擎霸主可能面临强制分拆!一个商业帝国的兴起,往往伴随着不断的吞并和收购,谷歌亦是如此。没有巨大的财富饥渴,就不会有今天的「谷歌帝国」。


现任CEO劈柴手握谷歌的第2个接力棒,史无前例地处于风暴中心,这次他还能否力挽狂澜?

上周,谷歌搜索被判垄断,让整个科技行业都受到了震动。牵一发而动全身,更何况是谷歌这样的巨头。不仅搜索引擎的市场格局会发生显著变化,也会对苹果等公司的财务健康造成影响。谷歌败诉,对于反垄断司法是一次史诗般的胜利,对谷歌而言,却是一次巨大的生存危机。据悉,在法官做出裁决之后,司法部正在计划下一步行动,其中可能包括拆分谷歌——将谷歌剥离安卓或Chrome浏览器。如果谷歌难逃此劫,这将是自80年代美国电信巨擘AT&T分拆以来最重大的企业分拆。谷歌反垄断案的影响不止于它自身,也是对其他大型科技巨头,如亚马逊、苹果和Meta的一次警告。

搜索霸主

尽管谷歌不是唯一一家拥有搜索引擎的公司,但它已经成为网络搜索的代名词。网络流量分析公司Statcounter的数据显示,截至7月份,谷歌的搜索引擎市场份额约为91%。事实上,从2009年以来,它就一直保持着约90%的市场份额。谷歌的第二大竞争对手是微软的Bing,Bing的市场份额是多少呢?只有不到4%。下面这张图更加直观地诠释了为什么谷歌会迎来拆分危机,其他搜索引擎的生存空间被极限压缩到不足10%。

凭借具有主导地位的搜索引擎,再结合广告业务,带动了其年收入超过3000亿美元,使得谷歌及其母公司Alphabet成为世界上最有价值的公司之一。谷歌占有这么庞大的市场份额,手段也很赤裸,那就是向苹果和三星等公司支付数百亿美元,将谷歌搜索作为设备和浏览器中预装的默认选项。这让谷歌获得了如日中天的发展,也为今天的败诉埋下了祸根。

谷歌败诉

在谷歌与司法部和州总检察长进行了长达一年的司法斗争后,美国司法部胜诉,联邦法官正式裁定谷歌违反反垄断法。也就是说,谷歌输掉了二十多年来第一起重大科技反垄断诉讼。最确凿的证据包括,谷歌向苹果公司支付了180亿美元,阻止苹果扩张搜索业务,确保谷歌在2021年继续成为默认搜索引擎。

此外,谷歌还拥有自己的网络浏览器Google Chrome和Android系统,这两者都使谷歌成为数百万设备上的默认搜索引擎。华盛顿法官Amit Mehta在一份长达286页的裁决中表示,「谷歌的分销协议侵占了大部分普通搜索服务市场的份额,并蚕食了竞争对手公平竞争的空间。」裁决书地址:https://assets.bwbx.io/documents/users/iqjWHBFdfxIU/rZ1UlL.0yQbo/v0,并且,通过独家分销协议垄断手机端和浏览器的服务,谷歌能够肆无忌惮地让在线广告不断涨价,而不会产生任何后果。

谷歌表示将对此裁决提出上诉,Mehta已下令双方开始进入诉讼的第二阶段,这将涉及政府将采取何种恢复竞争的措施,包括对谷歌进行分拆。除了分拆,司法部还在考虑其他较为温和的反垄断措施。其中包括要求谷歌与微软必应、DuckDuckGo等竞争对手分享更多数据。这样做将有助于竞争对手改善搜索结果,从而更有效地与谷歌竞争。这是华盛顿自二十年前解散微软公司未果以来,首次以非法垄断为由解散一家公司。据「纽约时报」报道,法官安排于9月6日举行听证会,与谷歌和司法部讨论下一步行动。司法部的谷歌审判小组

「肢解」谷歌

如果司法部推进分拆计划,那么安卓操作系统和Chrome浏览器将是最有可能被剥离的业务部门。这两种产品的用户数量极其庞大,全球约25亿台设备都安装了安卓系统。Mehta在裁决中指出,谷歌要求设备制造商签署协议,要求预装Gmail、Google Play商店等应用程序,还无法卸载。除了安卓和Chrome,官员们还在考虑强制出售谷歌用于销售搜索广告的平台AdWords。判决书也提到,谷歌垄断了出现在搜索结果页面顶部的广告,而这些广告正通过AdWords出售。这一举措将对谷歌的广告业务产生重大影响,因为搜索广告占据了谷歌总收入的约三分之二。如果司法部不要求谷歌出售AdWords,它可能会提出让谷歌提供互通操作的要求,使AdWords能在其他搜索引擎上无缝运行。

参考资料:
- https://fortune.com/2024/08/14/google-ai-future-needs-android-doj-breakup-threat-existential/
- https://fortune.com/2024/08/14/google-monopoly-search-engine-dominance-chart-break-up/
- https://www.bloomberg.com/news/articles/2024-08-13/doj-considers-seeking-google-goog-breakup-after-major-antitrust-win

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

苹果NFC芯片终于开放,但要收费

文章来源:半导体行业观察

图片来源:由GPTNB生成

来源:内容来自半导体行业观察(ID:icbank)综合,谢谢。

苹果公司将开始允许第三方使用iPhone的支付芯片来处理交易,此举使银行和其他服务能够与Apple Pay平台竞争。


周三宣布的这一举措是在监管机构(包括欧盟监管机构)多年施加压力之后宣布的。苹果表示,它将允许开发人员从 iOS 18.1 开始使用该组件,这是 iPhone 即将推出的软件更新。支付芯片依赖于一种称为NFC或近场通信的技术,当手机靠近另一台设备时,可以共享信息。

这一变化将允许外部供应商使用NFC芯片进行店内支付、交通系统票价、工作徽章、家庭和酒店钥匙以及奖励卡。该公司表示,对政府身份证的支持将在稍后推出。用户还可以将第三方支付应用程序设置为默认系统,以取代 Apple Pay。

苹果一直不愿向开发人员开放该芯片,理由是安全问题。这一变化还威胁到其从Apple Pay交易中产生的收入。该公司从通过iPhone支付的所有付款中抽取一部分。

不过,根据周三的声明,根据新方法,苹果仍将要求开发人员支付“相关费用”以使用NFC芯片并签订“商业协议”。

苹果表示,这确保了只有“满足某些行业和监管要求并致力于苹果持续的安全和隐私标准的授权开发人员”才能访问该系统。

这家总部位于加利福尼亚州库比蒂诺的公司计划在澳大利亚、巴西、加拿大、日本、新西兰、美国和英国推出该计划。它没有提到欧盟,这是近几个月来推动这一功能最多的地区。

按照苹果在官方新闻中所说,从 iOS 18.1 开始,开发者将能够在 iPhone 上自己的 app 中使用 Secure Element 提供 NFC 非接触式交易,这与 Apple Pay 和 Apple Wallet 无关。使用新的 NFC 和 SE(安全元件)API,开发人员将能够为店内支付、汽车钥匙、闭环交通、公司徽章、学生证、家庭钥匙、酒店钥匙、商家忠诚度和奖励卡以及活动门票提供应用内非接触式交易,未来将支持政府 ID。

苹果表示,由于用户的安全和隐私对 Apple 来说至关重要,因此这款新解决方案旨在为开发者提供一种安全的方式,让他们可以在自己的 iOS app 内提供 NFC 非接触式交易。

NFC 和 SE API 利用安全元件,这是一种行业标准的认证芯片,旨在将敏感信息安全地存储在设备上。Apple 投入了大量资源来设计保护用户安全和隐私的解决方案,在进行非接触式交易时利用了 Apple 专有的硬件和软件技术,包括安全隔区、生物识别认证和 Apple 服务器。要在使用这些 API 的 App 中进行非接触式交易,用户可以直接打开该 App,或者在 iOS 设置中将 App 设置为默认的非接触式 App,然后双击 iPhone 上的侧边按钮以发起交易。

为了将这种新的解决方案整合到他们的 iPhone 应用程序中,开发人员需要与 Apple 签订商业协议,申请 NFC 和 SE 权利,并支付相关费用。这样可以确保只有满足特定行业和法规要求,并承诺遵守 Apple 持续的安全和隐私标准的授权开发者才能访问相关的 API。NFC 和 SE API 将在即将到来的 iOS 18.1 开发者种子计划中提供给澳大利亚、巴西、加拿大、日本、新西兰、英国和美国的开发者,随后将在更多地点推出。开发者和用户将继续享受 Apple Pay 和 Wallet 的简单、安全和私密的体验。

参考链接: https://www.apple.com/newsroom/2024/08/developers-can-soon-offer-in-app-nfc-transactions-using-the-secure-element/

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

确定,台积电170亿收购

文章来源:半导体行业观察
来源:内容来自经济日报。

图片来源:由GPTNB生成
群创(南科四厂)厂房确定卖给台积电。


台积电昨(15)日公告,以171.4亿元购买群创南科四厂,主要供营运与生产使用。群创同步公告相关资产处分案,估计卖厂收益约147亿元。外界预期,双方最快8月底完成交易相关作业。
本报12日独家披露,台积电将买下群创南科四厂,原传出会在台积电13日董事会拍板后宣布,惟消息曝光后,「好事多磨两天」,昨天晚间两家公司先后公告交易拍板。
市场传出群创南科厂底价180亿元,台积电以200亿元成交,昨天公布实际交易金额比市场预期低。根据群创公告,先前委由两家估价公司估价后,估值各开出177.7亿元与183.3亿元,此次实际交易金额比两家估价公司分别低3.5%、6.4%。
根据群创公告,与台积电签订出售厂房及附属设施合约,座落于台南市新市区新科段416-424、498、504等共11笔建号(台南市新市区环西路一段3号),建物面积31万7,444.93平方公尺(约96,027.09坪),交易总金额171.4亿元,处分利益约147亿元,将用于挹注公司营运及未来发展动能,充实营运资金。
群创现正处于办理减资换发新股作业的股票停止交易期,以减资后实收资本额798.91亿元股本计算,此次卖厂获利147亿元,约可贡献每股纯益1.84元。群创上半年每股净损0.33元,这笔交易获利可望助攻群创2024年全年转亏为盈。
台积电并未对买下群创南科四厂用途多做说明,仅透过公告指出供营运与生产使用。业界认为,南科空置厂办已不多,台积电主要看准群创厂房离台积厂区车程仅五分钟,可能作为先进封装后续扩产备案、研发新型态封装后续导入量产的备案用地,甚至后续3纳米以下先进制程在南科扩充时的弹性用地等。
台积电CoWoS先进封装需求持续强劲,先前在法说会表示持续扩产,期盼2025年供给吃紧缓解,2026年供需平衡,业界认为可能优先用于先进封装扩产规划,或更先进制程的备用后援基地。
至于交易完成时间,群创表示,需待南部科学园区管理局核准转让,厂房相关抵押权涂销后始得转让。南科管理局昨晚表示,乐见此项厂房转售活化案,估计相关程序可在一周内走完。外界预期,群创最快8月底即可完成出售交易作业。
群创南科四厂原本主要生产笔电及监视器用面板,因群创内部策略考量,于2023年关闭,并陆续传出美国记忆体芯片大厂美光、台积电有意买下,昨天拍板花落台积电。

台积电获准继续建设 CoWoS 设施
台积电在嘉义科学园区兴建2座CoWoS先进封装厂,5月底挖到疑似遗迹依文资法暂停施工,经县府文资委员会审议开挖保存,台积电委托考古厂商挖掘,并持续建厂施工,上月厂商公告应征考古挖掘人员,引发热烈回响,因被外界误为台积电雇工紧急喊停,朴子就业服务中心证实考古厂商恢复雇工挖掘作业。

因应台积电进驻工程土石方大量增加,环境部昨天环评大会审查「南部科学园区嘉义园区开发计划环境影响差异分析报告」,在环委同意开发单位承诺的区外土方暂置和再利用规画下修正通过,县长翁章梁出席,展现对台积厂进度嘉义的重视。

台积电建厂进度受关注,遗址开挖及环评解决后,目前考古挖掘与建厂加快同步进行,第1座厂开挖的太保农场遗址,是距今3500年至4500年之间绳纹陶文化遗址,开挖发现绳纹陶片、陶环等碎片,还有灰坑、贝冢等。

南科管理局说,当初南科园区开发,包括台积电18厂动工都挖到遗址,南科开挖发现13处遗址、800多万件文物,台湾史前文化博物馆为此设南科考古馆,收藏研究文物展示,建厂与文资保存不冲突。

考古厂商应征考古挖掘人员60名,无经验可,农民佳、耐热,工作内容为挖土,工作时间为早上8点到下午5点,周休二日需配合加班,其中1天算加班费出勤,日薪1700元,含劳保,健保可视需求加保。朴子就服中心说,台积电避免外界误为台积电雇工,厂商低调悄悄雇工。

县府文观局说,台积电厂区发掘计划所有出土与采集标本将全数留置嘉义地区为原则,发掘期间出土遗物存放台积电提供工务所空间,整理期间将遗物置放台大人类学系所管理考古空间,或南科管理局管理处所。计划完成后,所有标本将点交文观局。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

苹果NFC芯片终于开放,但要收费

苹果公司将开始允许第三方使用iPhone的支付芯片来处理交易,此举使银行和其他服务能够与Apple Pay平台竞争。周三宣布的这一举措是在监管机构(包括欧盟监管机构)多年施加压力之后宣布的。


苹果表示,它将允许开发人员从 iOS 18.1 开始使用该组件,这是 iPhone 即将推出的软件更新。支付芯片依赖于一种称为NFC或近场通信的技术,当手机靠近另一台设备时,可以共享信息。这一变化将允许外部供应商使用NFC芯片进行店内支付、交通系统票价、工作徽章、家庭和酒店钥匙以及奖励卡。该公司表示,对政府身份证的支持将在稍后推出。用户还可以将第三方支付应用程序设置为默认系统,以取代 Apple Pay。苹果一直不愿向开发人员开放该芯片,理由是安全问题。这一变化还威胁到其从Apple Pay交易中产生的收入。该公司从通过iPhone支付的所有付款中抽取一部分。不过,根据周三的声明,根据新方法,苹果仍将要求开发人员支付“相关费用”以使用NFC芯片并签订“商业协议”。苹果表示,这确保了只有“满足某些行业和监管要求并致力于苹果持续的安全和隐私标准的授权开发人员”才能访问该系统。这家总部位于加利福尼亚州库比蒂诺的公司计划在澳大利亚、巴西、加拿大、日本、新西兰、美国和英国推出该计划。它没有提到欧盟,这是近几个月来推动这一功能最多的地区。按照苹果在官方新闻中所说,从 iOS 18.1 开始,开发者将能够在 iPhone 上自己的 app 中使用 Secure Element 提供 NFC 非接触式交易,这与 Apple Pay 和 Apple Wallet 无关。使用新的 NFC 和 SE(安全元件)API,开发人员将能够为店内支付、汽车钥匙、闭环交通、公司徽章、学生证、家庭钥匙、酒店钥匙、商家忠诚度和奖励卡以及活动门票提供应用内非接触式交易,未来将支持政府 ID。苹果表示,由于用户的安全和隐私对 Apple 来说至关重要,因此这款新解决方案旨在为开发者提供一种安全的方式,让他们可以在自己的 iOS app 内提供 NFC 非接触式交易。NFC 和 SE API 利用安全元件,这是一种行业标准的认证芯片,旨在将敏感信息安全地存储在设备上。Apple 投入了大量资源来设计保护用户安全和隐私的解决方案,在进行非接触式交易时利用了 Apple 专有的硬件和软件技术,包括安全隔区、生物识别认证和 Apple 服务器。要在使用这些 API 的 App 中进行非接触式交易,用户可以直接打开该 App,或者在 iOS 设置中将 App 设置为默认的非接触式 App,然后双击 iPhone 上的侧边按钮以发起交易。为了将这种新的解决方案整合到他们的 iPhone 应用程序中,开发人员需要与 Apple 签订商业协议,申请 NFC 和 SE 权利,并支付相关费用。这样可以确保只有满足特定行业和法规要求,并承诺遵守 Apple 持续的安全和隐私标准的授权开发者才能访问相关的 API。NFC 和 SE API 将在即将到来的 iOS 18.1 开发者种子计划中提供给澳大利亚、巴西、加拿大、日本、新西兰、英国和美国的开发者,随后将在更多地点推出。开发者和用户将继续享受 Apple Pay 和 Wallet 的简单、安全和私密的体验。

参考链接: https://www.apple.com/newsroom/2024/08/developers-can-soon-offer-in-app-nfc-transactions-using-the-secure-element/

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

5张PPT,撑起百亿IPO

文章来源:东四十条资本
文章原标题:《5张PPT,撑起一个IPO》

图片来源:由GPTNB生成

今年最热门的IPO之一。作者丨张雪

就在黄仁勋高位陆续减持英伟达时,其新晋竞争对手Cerebras上市又迎来新进展,首次明确了上市时间表,可能于今年10月登录纳斯达克。


另据Caplight称,二级市场投资者对Cerebras的估值在42亿至50亿美元之间,此次IPO将标志着半导体行业的一个里程碑,也是今年最热门的IPO之一。

公开资料显示,Cerebras从成立之初到现在共完成了六轮融资,共筹集7.587亿美元。

从融资节奏来看,每年一轮不算激进,估值增长则是另一番情景:2016年A轮融资完成后,估值为6450万美元,而到2021年,其估值已超40亿美元,也就是说短短五年,其估值涨了62倍。

不过有趣的是,在2021年AIGC逐渐开始火热后,Cerebras反而没有一次融资,最近一轮的F融资,还是在2021完成的,并且据报道,为了这次IPO能成功吸引到投资者,Cerebras还在准备一轮估值相比F轮下降47.16%的F-1轮融资。IPO前的估值波动如此剧烈,反映出市场对Cerebras的前景有不少分歧。

那么问题来了,Cerebras究竟是什么来头,50亿VS3万亿,这么大的数量级差距,Cerebras凭什么配看作英伟达的竞争对手呢?

Cerebras是谁?

不同于英伟达传统的竞争对手,某种意义上说,Cerebras是一个年轻公司,尽管它成立于八年前。

Cerebras的故事要从其两个创始人谈起。作为联合创始人,Andrew Feldman和Gary Lauterbach分别担任Cerebras的CEO和CTO。

其中,Andrew毕业于斯坦福大学,其第一份工作是在RiverStone Networks担任营销和企业发展副总裁,他伴随了RiverStone整个创业生涯,从成立之初到其2001年成功IPO。离开RiverStone后,他加入了Force10 Networks,从事产品管理、营销和业务拓展等业务。

另一位联合创始人-Gary在计算机架构领域享有极高的声誉,被认为是行业内领先的计算机架构师之一,他持有超过50项专利。

在早期职业生涯中,他曾在Sun Microsystems担任杰出工程师,是UltraSPARC III和 UltraSPARC IV 微处理器的首席微处理器架构师,并在Sun实验室担任DARPA HPCS Petascale计算项目的首席架构师。除此之外,Gary还担任过9300万美元美国能源部高效能计算项目的主要研究员。

需要指出的是,Cerebras并非是这两个人的首次合作。

在创办Cerebras之前,他们与Anil Rao在2007年创办了一家专注于低功耗服务器技术的公司-SeaMicro,SeaMicro以其创新的微服务器设计而知名,这些设计被设计用于提高数据中心的效率,同时显著降低能耗。

2012年,为了加强自己在数据中心服务器市场的竞争力,AMD宣布以3.34亿美元的价格收购SeaMicro,随着这笔交易的完成,Andrew Feldman和Gary Lauterbach也加入了AMD。

好景不长,2015年,AMD宣布放弃SeaMicro业务,专注于高性能服务器CPU,这时,Andrew Feldman和Gary Lauterbach也选择了离开,随后成立了Cerebras,继续在高性能计算领域进行创新。

成立之初,Cerebras只有五张PPT和一份新计算机架构的理论计划。

在当时几乎没人相信这家初创公司能推出可与Nvidia芯片相媲美的产品,不过,他们真的做到了,即发布了适用于模型训练和推理等生成式人工智能工作负载的海量内存的特殊大型芯片。

剑指英伟达

Cerebras开始引起轰动,是因为他们预见到了生成式人工智能的繁荣。

这个团队很早就发现了传统芯片架构在满足人工智能和深度学习应用日益增长的需求方面的局限性。为了应对这种情况,他们着手开发晶圆级引擎( WSE),它的大小与餐盘差不多,与业内常用的拇指指甲大小的芯片形成鲜明对比。

WSE在单个硅片上集成了数千个内核和数百亿个晶体管,大大缩短了处理器之间的数据通信时间,并能够更快、更高效地处理人工智能算法。WSE也被看做是Cerebras竞争优势的核心所在,它也被公认为有史以来最大的半导体芯片。

截止目前,Cerebras分别在2019年,2021年和2024年推出了WSE-1、WSE-2和WSE-3三款WSE产品。值得一提的是,Cerebras推出的WSE-2在今年被计算机历史博物馆纳入馆藏,并认为其在人工智能领域的变革性成就。

另外,Cerebras整体的AI系统设计方法也是其优势之一,该方法既包括创新的硬件,也包括复杂的软件解决方案(Cerebras Software Framework),这使得用户无需具备硬件架构方面的深厚专业知识即可在WSE上高效部署AI模型。

与此同时,该系统可以定制以支持广泛的AI应用,从药物发现和基因组学到气候科学和金融建模,为很多行业提供了新的可能性,也填补了AI研发生态系统中的一个关键空白。

这两点也是使其成为英伟达少数竞争者的重要原因。此外,Cerebras自称是第一家利用不依赖GPU的AI系统,来训练容量高达130亿个参数LLM的公司。

而Cerebras今年3月发布的新品,更是与英伟达进行了直面较量,Cerebras表示WSE-3引擎是当今世界上最快的AI处理器,容量是Nvidia H100的880倍,带宽是Nvidia H100的7000倍。

有分析称,Cerebras之所以可以成为英伟达的竞争对手,是因为它在制造和销售芯片的方式上提供了差异化的方法,而且它有可能吸引到成为AI芯片竞赛参与者所需的资金。

5年估值涨62倍

公开资料显示,Cerebras从成立之初到现在共完成了六轮融资,共筹集了7.587亿美元的风险资金。

从融资节奏来看,基本每年一轮,不算激进,但其估值增长来看,则是另一番情景,其2016年A轮融资完成后,估值为6450万美元,而到2021年,其估值已超40亿美元,也就是说短短五年,其估值涨了62倍。

此外,虽说Cerebras提早押中了生成式人工智能的浪潮,但在最近两年大模型的融资风暴中,并没有获得投资人的青睐。

最新一轮融资还是在2021年完成的。

2021年,Cerebras推出了世界上第一个数百万核心的人工智能集群架构,可以处理 120万亿个参数的神经网络。

同年11月宣布的F轮融资中,Cerebras筹集了 2.5亿美元,该轮融资由Alpha Wave Ventures、阿布扎比增长基金和阿布扎比科技集团G42联合领投,其他投资者包括Altimeter、Benchmark、Coatue、Eclipse、Moore和VY。

这里需要指出的是,按照Benchmark的惯例,他们是只在早期项目出手的,而此次却参与了Cerebras的F轮,足以见得这家公司的特别之处。

此外,OpenAI 联合创始人兼首席执行官Sam Altman参与了Cerebras的8000万美元D轮融资,并在官网被列为投资人列表的第一。

另由于差异化打法,Cerebras在与Groq、Samba Nova、Graphcore和Tenstorrent等众多AI芯片初创公司中,已经得了最大的成功。

可即便有多家明星机构的加注,Cerebras现在也已经身处人工智能的风暴中心,但其对IPO似乎并不乐观。

据The Information的消息人士透露,为了进一步吸引投资者,Cerebras将通过F1轮融资创建优先股,与上一轮融资相比“大幅折扣”。

相关文件显示,Cerebras期望以14.66美元的价格进行新的F-1轮融资,比F轮价格27.74美元下降了47.16%,这表明Cerebras现在的内部估值约为24.4亿美元,而这与开篇提到的二级市场给出的估值形成了鲜明对比。

诚然,Cerebras究竟价值几何,还需要等到其真正上市才能见分晓,现有可以参考的是,受益于英伟达在二级市场掀起的上涨浪潮,为AWS和微软等公司提供服务的数据中心厂商Astera Labs的股价在3月份IPO时飙升了76%.

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

百万级原子模拟,从头算精度,北京科学智能研究院提出AI+大尺度电子结构模拟新方法

在计算材料科学领域,准确高效地模拟材料的电子结构一直是一个非常关键而又极具挑战性的问题。基于密度泛函理论的第一性原理计算方法的高计算需求依然是大尺寸长时间材料模拟所面临的难题。


北京科学智能研究院 (AI for Science Institute, Beijing) 提出了一种基于深度学习的高效紧束缚方法,称为 DeePTB,从而高效地表示具有从头算精度的材料电子结构,极大地简化了计算复杂度,并实现百万级大尺寸结构的电子、光电响应性质的计算模拟。

当与分子动力学相结合时,DeePTB 可以同时促进原子和电子行为的有效和准确的有限温度模拟。DeePTB 的可用性弥合了电子模拟中准确性和可扩展性之间的差距,通过实现大规模电子结构计算,将推动材料科学和相关领域的发展。

相关研究以「Deep learning tight-binding approach for large-scale electronic simulations at finite temperatures with ab initio accuracy」为题,于 8 月 8 日发表在《Nature Communications》上。

虽然基于 DFT 的第一性原理方法提供了准确且通用的模拟材料电子性质的方法,但是随着系统中的原子数量增加,第一性原理的计算量急剧增加,而在真实材料或者器件体系中往往包含成百万千万量级的原子数,难以很直接使用第一性原理软件完成计算模拟。

一些复杂材料场景远远超过了 DFT 方法的模拟尺寸,一方面是因为 DFT 的自洽迭代过程复杂,另一方面,DFT 需要足够大的基组来保证精度,导致产生的哈密顿量的尺寸较大,难以进行后续的性质计算。

因此使用更小和更稀疏的矩阵来描述电子哈密顿量的紧束缚(Tight-Binding, TB)方法提供了一种更为实用的替代方案。然而,传统的 TB 方法也存在精度与效率的矛盾。例如基于 Wannier 函数的 TB 方法虽然具有较高的精度,但是其构造过程需要 DFT 自洽迭代计算,仍然限制了其在大尺寸体系下的应用。

发展通用的 TB 哈密顿量模型方法软件框架 DeePTB 实现精度效率以及迁移率的统一,是具有重要意义的课题。

DeePTB 方法框架及特点

DeePTB 方法的整体框架图下图所示,对于给定构型中指定近邻范围内的成键原子对, 首先训练其基于物理约束下的经验公式系数,然后在此基础上提取成键原子对的局域化学环境,通过 embedding 网络构造 symmetry-preserving 描述子,并基于 fitting 网络映射为局域环境依赖的 TB 参数,突破传统模型的双中心近似,并基于 PyTorch 机器学习框架,利用 DFT 电子本征值构造损失函数,系统地进行高效的参数自动拟合。

DeePTB 方法具有如下特点:

  • 实现精度与效率的统一,通过神经网络修正实现以经验紧束缚模型计算效率并保持第一性原理的计算精度。
  • 采用 eigenvalues 作为训练标签,用户可以灵活地选择任何 DFT 软件生产训练标签,可以是平面波基组,也可以是 LCAO 基组,也可以是任意泛函(LDA、GGA、even Hybrid functionals)。同时也可以轻松实现并处理自旋轨道耦合相互作用。
  • 使用更小的基组,相对完整的 LCAO DFT 哈密顿量,TB 使用的更小的基组,甚至做到只拟合费米面附近的能带。
  • 采用正交基组 TB 形式,无需额外处理交叠矩阵,因此可以接入大规模 TB 算法,例如 tight-binding propagation method (TBPM),轻松实现百万千万量级原子的第一性原理精度的电子性质计算。真正实现器件级尺寸的量子力学模拟。
  • 基于 Slater-Koster 框架,支持用户自定义经验 TB 拟合公式,并可以系统地增加神经网络修正,提高精度。为目前文献上存在各种经验拟合公式以及参数提供一个统一的实现和提高精度的训练平台。
  • 支持与分子动力学结合,实现有限温度下原子的动力学过程中以及结构系综采样中的电子结构和性质的模拟。

预测结构扰动构型的 TB 哈密顿量以及电子结构

研究人员以在电子器件中被广泛使用的 IV 族元素(C、Si、Ge、Sn)和 III-V 族化合物(如 GaAs 等)组成的半导体材料作为测试对象。

首先,进行分子动力学(MD)模拟在有限温下的结构构型采样,并基于不同 MD 轨迹的构型,使用 DFT 软件计算其对应的电子本征值作为 DeePTB 的训练和测试数据。模型测试全部体系的决定系数 (R^2≈0.9999  ),本征值偏差只有十几至几十个 meV 左右。其中 III-V 族化合物的测试集同时包含了立方和六方两种不同的相下的构型。

此外,DeePTB 模型还展现出了以下出色的泛化能力:

  • 推广到更大尺寸的超胞结构,显示出极佳的尺度可扩展性。
  • 处理应变效应,准确预测应变调控下的能带结构及带隙大小。
  • 兼容不同的 DFT 基组、泛函和自旋轨道耦合效应,表现出强大的灵活性和通用性。

百万原子尺寸高效建模

研究人员选择 III-V 族化合物 GaP 作为大尺寸建模的应用案例,构造了 50 × 50 × 50  的超胞结构。

首先基于 DP 深度势能进行 DeePMD 分子动力学模拟有限温的结构采样,然后基于得到的采样构型,利用 DeePTB 进行紧束缚模型哈密顿量的构建,并基于预测的 TB 模型使用 TBPLaS 软件实现的 TB propagation method (TBPM) 方法进行无需对角化的快速的电子性质计算,得到包括有限温下的态密度(DOS)、光电导率、介电函数以及复折射率等电子性质及光电相应,如下图所示。

计算结果表明, DeePTB 的计算结果与文献结果符合良好,峰值位置的轻微差异主要是因为用于训练的 DeePTB 模型的交换关联泛函(GGA)倾向于低估半导体材料的电子带隙的缘故。这些结果表明了 DeePTB 高精度建模以及进行器件级尺度电子结构及性质的模拟计算的能力。

关于 DeePTB 框架的潜力

对于不同的交换关联 (XC) 函数,能带结构的色散特征大致相同。因此,原则上,可以首先在计算效率高的 XC 函数(如 LDA 或 GGA)上训练模型,然后将其转移到更昂贵、更准确的函数(如 SCAN 或 HSE)。这使得能够高度准确地描述实验可观测量,以用于接近现实的材料模拟等情况下所需的大规模模拟。

此外,对于大规模样本,模拟应变对电子特性的影响是一项计算繁琐的任务。DeePTB 可以通过在较小的样本上训练模型并将其转移到更大的系统来有效地加速这些模拟。这为电子结构应变工程的理论研究带来了优势。

MD 可以提供离子自由度的模拟,这类似于晶体结构的温度探针,其中离子振动是基本现实。在需要大规模和长时间模拟的情况下,DeePTB 可用于模拟温度和结构相关的电子特性。DeePTB 使得考虑其他实际情况(如缺陷或杂质及其对电子结构的影响)成为可能和可行。

DeePTB 探索的另一个方向是模拟磁系统的特性。鉴于 DeePTB 的这些多样化潜在应用,它可以在电子模拟领域产生深远的影响。

参考内容:https://mp.weixin.qq.com/s/StetT81-UD6AGGgv-60GPA



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

1篇Outstanding、5篇Oral!字节跳动今年ACL这么猛? 来直播间聊聊!

本周学术界瞩目的焦点,无疑是在泰国曼谷举行的 ACL 2024 顶会。这场盛会吸引了全球众多杰出的研究者,大家汇聚一堂,共同探讨和分享最新学术成果。


官方公布的数据显示,本届 ACL 共收到近 5000 篇论文投稿,其中 940 篇被主会录用,168 篇工作入选大会口头报告(Oral),录取率低于 3.4%,这当中,字节跳动 共有 5 篇成果中选 Oral。

在 8 月 14 日下午的 Paper Awards 环节,字节跳动旗下成果《G-DIG: Towards Gradient-based DIverse and high-quality Instruction Data Selection for Machine Translation》被主办方官宣入选 Outstanding Paper(1/35)。

ACL 2024 现场照片

回溯 ACL 2021,字节跳动曾摘下唯一一篇最佳论文桂冠,是 ACL 成立 59 年以来,中国科学家团队第 2 次摘得最高奖项!

为深入探讨今年的前沿研究成果,我们特意邀请字节跳动论文的核心工作者解读分享。8 月 20 日下周二 19:00-21:00,「字节跳动 ACL 2024 前沿论文分享会」线上开播!

豆包大语言模型研究团队负责人王明轩,将携手字节跳动多位研究员黄志超、郑在翔、李朝伟、张欣勃、及 Outstanding Paper 神秘嘉宾,分享 ACL 部分精彩中选成果,研究方向涉及自然语言处理、语音处理、多模态学习、大模型推理等领域,欢迎预约!

活动议程

ACL 2024 活动议程

ACL 2024 活动议程

精选论文解读

RepCodec:一种用于语音离散化的语音表示编解码器
论文地址:RepCodec:一种用于语音离散化的语音表示编解码器

随着大型语言模型(LLMs)近期的快速发展,离散语音标记化在将语音注入 LLMs 中发挥重要作用。然而,这种离散化导致信息的丢失,从而损害整体性能。为提高这些离散语音标记的性能,我们提出了 RepCodec,这是一种用于语义语音离散化的新型语音表示编解码器。

与重建原始音频的音频编解码器不同,RepCodec 通过从诸如 HuBERT 或 data2vec 等语音编码器重建语音表示来学习 VQ 码本。语音编码器、编解码器编码器和VQ码本共同形成了一个将语音波形转换为语义标记的流程。大量实验表明,RepCodec 凭借其增强的信息保留能力,在语音理解和生成方面显著优于广泛使用的 k-means 聚类方法。此外,这种优势在各种语音编码器和语言中都存在,肯定了 RepCodec 的鲁棒性。该方法可以促进语音处理方面的大型语言模型研究。

DINOISER:通过噪声操纵增强的扩散条件序列生成模型
论文地址:DINOISER:通过噪声操纵增强的扩散条件序列生成模型


期待你的互动提问

  • 直播时间:2024 年 8 月 20 日(周二) 19:00-21:00
  • 直播平台:微信视频号【豆包大模型团队】、小红书号【豆包研究员】

欢迎你填写问卷告诉我们,关于 ACL 2024 论文你感兴趣的问题,在线和多位研究员畅聊!

豆包大模型团队持续热招中,欢迎点击此链接,了解团队招聘相关信息。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

「每周只上一天班」谷歌散漫制度遭前CEO怒斥:输给OpenAI,再下去要输创业公司了

「谷歌决定拥抱生活与工作平衡:更早下班、远程工作,胜过在竞争中取胜。」施密特说道。


「而说到初创公司,他们之所以能成功,是因为人们在拼命地工作。」

在本周三公布的一份斯坦福大学公开课视频中,谷歌前 CEO 埃里克・施密特(Eric Schmidt)在被问到谷歌为什么落后于 OpenAI 时,终于开炮了。

「很抱歉我这么直白,但重要的是:如果你们都离开大学去创办公司,你肯定不会让自己的员工在家办公,如果你愿意的话。」

这番言论很快引发了轩然大波。

输出了大量前沿 AI 技术的谷歌,一直被认为是人工智能领域的「黄埔军校」。如今绝大多数生成式 AI 模型的基础架构 Transformer 来自谷歌 2017 年的著名论文。而更早一波让全世界认识 AI 的深度学习浪潮,也是在 2012 年前后由谷歌大脑「AI 识别猫」研究后逐渐开始的。

然而在 ChatGPT 改变整个科技领域的浪潮里,谷歌的地位却显得有点尴尬。最近一年多,我们似习惯了这家科技巨头作为「追赶者」出现。

AI 大模型是科技领域前所未有的机会,而机遇当前,谷歌的策略一直是跟随和对标。人们正在批评谷歌的方向、人才与制度,甚至进取心。这也就怪不得在斯坦福大学 CS 323 的一堂公开课上,大学教授会向施密特抛出这样的问题了。

「每周只需要来办公室一天」是谷歌逐渐落后的最大原因吗?

有网友评论道:如果你只想要个工作,在家办公就好了。但如果你追求一份事业,请现场办公。

也有人表示反对:人来了不等同于在工作。最近几年大家的经历证明,任何专注的人都可以在任何地方工作,并且效率提高 200%。

还有很多网友对此持吃瓜的态度。有人揶揄道:我还以为他们每周一天(去办公室)的时间都没有呢。

也有人想爆料:我认识个哥们在谷歌是顶尖程序员。不过他现在身兼三职,还都是全职,每天只花两个小时处理谷歌的工作。

与此形成鲜明对比的是 OpenAI 的「卷」。

思维链作者,在 OpenAI 任职的 Jason Wei 几乎在同时引用了一位年轻的 OpenAI 工程师的言论:「为什么目前我做得不错?我并不认为这是因为我比其他人更聪明或更有经验,而是因为我的竞争优势在于我愿意坐下来彻底地调试并完全理解代码。我愿意熬夜完成工作,不管这需要多长时间。这都是我自愿的,我不怕任何从零打造的项目,因为我知道面对任何事,我都能行。

Jason Wei 这段话底下的画风就不一样了,引发了很多网友共鸣,「这才是制胜之道」。

「我认识的很多成功工程师背后都有相似的故事,不盲目地完成手头的项目,而是愿意花费大量时间钻研。」

这很难不让人联想到 Jason Wei 爆出的在 OpenAI 「996」的作息表。在 OpenAI 的一天从 9:45 开始,一口气都不停歇地工作 12 个小时,直到凌晨一点。

虽然这个工作强度让很多外国网友直呼:「好可怕,你睡觉的时间都从哪里挤出来的?」

最可怕的是,这些被 OpenAI 精挑细选出来的「天才」,都是自愿地加班加点。但这可能是斯密特在斯坦福演讲中说的:「创业公司之所以能成功,是因为那里的人们工作非常努力。」一个生动的注脚。


施密特在斯坦福演讲


「灵活的工作安排并不会拖慢我们的工作进度」,Alphabet 工人工会对此表示。「真正阻碍谷歌员工每天工作效率的是:人员不足、优先事项的不断变化、频繁的裁员、工资停滞不前以及管理层在项目跟进上的不足。」

根据年报,截至去年年底,Alphabet(谷歌母公司)旗下的员工数量约为 18.2 万名。而在让员工重返办公室方面,公司也遇到了挑战,例如一些员工会说自己通勤太远,或者家中有老人孩子需要照顾。在某些情况下,员工会对返回办公室的强制要求提出反对。

埃里克・施密特是谷歌创始「三巨头」之一,另外两人是拉里・佩奇和谢尔盖・布林。

施密特曾在 2001 年至 2011 年担任谷歌 CEO。他在 2018 年卸任执行董事长,并在 2019 年离开了 Alphabet 董事会,但他目前仍是 Alphabet 的股东。

他与妻子共同创立了慈善投资机构 Schmidt Futures,资助科学和技术研究。他还是美国非营利组织 Special Competitive Studies Project 的主席,专注于支持人工智能等技术发展。

自从 OpenAI 在 2022 年底推出 ChatGPT 以来,谷歌一直在 AI 领域防守。在今年早些时候,谷歌发布的 Gemini 可谓「闯了不少大祸」,不仅生成的人像图片存在种族偏见,还建议每个人一天吃一块石头、用胶水来黏合披萨上的芝士,挨了不少批评。

虽然谷歌已经在昨天发布了加强版的 Gemini,还推出了对标 GPT-4o 的语音助手 Gemini Live,但在演示环节,Gemini Live 还是小小「翻车」了一下,前两次试用拍照识图功能都失败了,直到第三次换手机才成功。

在被质疑后,谷歌承认了 demo 造假。

最近科技领域的快速发展,着实让谷歌的这几位创始人着急。去年有消息称,隐退多年的谢尔盖・布林已经回到一线开始亲手写代码。施密特在斯坦福大学的呼吁,也有点恨铁不成钢的感觉。不过可以肯定的是,谷歌正在从内到外,逐渐寻求掌握主动权。

已经火热的大模型竞争,还会更激烈吗?

参考内容:



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

「每周只上一天班」谷歌散漫制度遭前CEO怒斥:输给OpenAI,再下去要输创业公司了

「谷歌决定拥抱生活与工作平衡:更早下班、远程工作,胜过在竞争中取胜。」施密特说道。


「而说到初创公司,他们之所以能成功,是因为人们在拼命地工作。」

在本周三公布的一份斯坦福大学公开课视频中,谷歌前 CEO 埃里克・施密特(Eric Schmidt)在被问到谷歌为什么落后于 OpenAI 时,终于开炮了。

「很抱歉我这么直白,但重要的是:如果你们都离开大学去创办公司,你肯定不会让自己的员工在家办公,如果你愿意的话。」

这番言论很快引发了轩然大波。

输出了大量前沿 AI 技术的谷歌,一直被认为是人工智能领域的「黄埔军校」。如今绝大多数生成式 AI 模型的基础架构 Transformer 来自谷歌 2017 年的著名论文。而更早一波让全世界认识 AI 的深度学习浪潮,也是在 2012 年前后由谷歌大脑「AI 识别猫」研究后逐渐开始的。

然而在 ChatGPT 改变整个科技领域的浪潮里,谷歌的地位却显得有点尴尬。最近一年多,我们似习惯了这家科技巨头作为「追赶者」出现。

AI 大模型是科技领域前所未有的机会,而机遇当前,谷歌的策略一直是跟随和对标。人们正在批评谷歌的方向、人才与制度,甚至进取心。这也就怪不得在斯坦福大学 CS 323 的一堂公开课上,大学教授会向施密特抛出这样的问题了。

「每周只需要来办公室一天」是谷歌逐渐落后的最大原因吗?

有网友评论道:如果你只想要个工作,在家办公就好了。但如果你追求一份事业,请现场办公。

也有人表示反对:人来了不等同于在工作。最近几年大家的经历证明,任何专注的人都可以在任何地方工作,并且效率提高 200%。

还有很多网友对此持吃瓜的态度。有人揶揄道:我还以为他们每周一天(去办公室)的时间都没有呢。

也有人想爆料:我认识个哥们在谷歌是顶尖程序员。不过他现在身兼三职,还都是全职,每天只花两个小时处理谷歌的工作。

与此形成鲜明对比的是 OpenAI 的「卷」。

思维链作者,在 OpenAI 任职的 Jason Wei 几乎在同时引用了一位年轻的 OpenAI 工程师的言论:「为什么目前我做得不错?我并不认为这是因为我比其他人更聪明或更有经验,而是因为我的竞争优势在于我愿意坐下来彻底地调试并完全理解代码。我愿意熬夜完成工作,不管这需要多长时间。这都是我自愿的,我不怕任何从零打造的项目,因为我知道面对任何事,我都能行。

Jason Wei 这段话底下的画风就不一样了,引发了很多网友共鸣,「这才是制胜之道」。

「我认识的很多成功工程师背后都有相似的故事,不盲目地完成手头的项目,而是愿意花费大量时间钻研。」

这很难不让人联想到 Jason Wei 爆出的在 OpenAI 「996」的作息表。在 OpenAI 的一天从 9:45 开始,一口气都不停歇地工作 12 个小时,直到凌晨一点。

虽然这个工作强度让很多外国网友直呼:「好可怕,你睡觉的时间都从哪里挤出来的?」

最可怕的是,这些被 OpenAI 精挑细选出来的「天才」,都是自愿地加班加点。但这可能是斯密特在斯坦福演讲中说的:「创业公司之所以能成功,是因为那里的人们工作非常努力。」一个生动的注脚。

不论如何,事情闹得实在太大了。埃里克・施密特最近撤回了这段发言。「关于谷歌和他们对工作时间的安排,我说错了,」本周三,施密特在发给《华尔街日报》的一封邮件中表示:「我对我的错误表示遗憾。」

在演讲结束后,斯坦福大学的 Stanford Online 账号在 YouTube 上发布了这段视频。截至周三下午,视频的观看量超过 4 万次,现在视频也被下架了,仅视频作者才能观看。

其实在视频的大部分时间里,施密特都在讨论大模型技术的未来。他认为到明年 AI 模型将统一三大关键支柱:超长上下文窗口、智能体和文本到动作,我们无法预测它会产生哪些影响,但很快每个人都会有很多智能体可供指挥。

谷歌和 OpenAI 自疫情以来都实施了类似的返岗政策。不过自 2022 年起,两家公司都要求员工每周至少有三天到办公室工作。同时,谷歌也强调了混合工作制的好处。谷歌表示,它会联系那些没有每周出现少于三天的员工,提醒他们需要来线下面对面工作。

在施密特之外,还有一长串的知名企业家并不喜欢在家办公政策。这其中包括摩根大通 CEO 杰米・戴蒙(Jamie Dimon)和特斯拉 CEO 埃隆・马斯克,他们都对在家办工的政策提出了批评,认为这会使公司效率降低、竞争力下降。戴蒙在几年前曾表示:「高层人员不能仅靠坐在桌子或在屏幕后面前领导公司,」马斯克也曾表示:「员工每周至少需要在办公室工作 40 小时」。

「灵活的工作安排并不会拖慢我们的工作进度」,Alphabet 工人工会对此表示。「真正阻碍谷歌员工每天工作效率的是:人员不足、优先事项的不断变化、频繁的裁员、工资停滞不前以及管理层在项目跟进上的不足。」

根据年报,截至去年年底,Alphabet(谷歌母公司)旗下的员工数量约为 18.2 万名。而在让员工重返办公室方面,公司也遇到了挑战,例如一些员工会说自己通勤太远,或者家中有老人孩子需要照顾。在某些情况下,员工会对返回办公室的强制要求提出反对。

埃里克・施密特是谷歌创始「三巨头」之一,另外两人是拉里・佩奇和谢尔盖・布林。

施密特曾在 2001 年至 2011 年担任谷歌 CEO。他在 2018 年卸任执行董事长,并在 2019 年离开了 Alphabet 董事会,但他目前仍是 Alphabet 的股东。

他与妻子共同创立了慈善投资机构 Schmidt Futures,资助科学和技术研究。他还是美国非营利组织 Special Competitive Studies Project 的主席,专注于支持人工智能等技术发展。

自从 OpenAI 在 2022 年底推出 ChatGPT 以来,谷歌一直在 AI 领域防守。在今年早些时候,谷歌发布的 Gemini 可谓「闯了不少大祸」,不仅生成的人像图片存在种族偏见,还建议每个人一天吃一块石头、用胶水来黏合披萨上的芝士,挨了不少批评。

虽然谷歌已经在昨天发布了加强版的 Gemini,还推出了对标 GPT-4o 的语音助手 Gemini Live,但在演示环节,Gemini Live 还是小小「翻车」了一下,前两次试用拍照识图功能都失败了,直到第三次换手机才成功。

这已不是谷歌第一次在大模型演示环节掉链子了,2023 年 12 月 Gemini 首次登场时,展示 Gemini 原生多模态能力的演示视频经过剪辑。在下面这段视频中,Gemini 似乎可以实时根据手势判断出这是在玩「石头、剪刀、布」,然而这段视频仅展示了结果,剪辑掉了引导 Gemini 判断的过程。

工作人员首先给 Gemini 陆续展示三张单个手势的图片,问它分别看到了什么,再把三张手势图片一起发给 Gemini,问它这是在干什么,并提示是一个「游戏」。通过以上一步步的提示和引导,Gemini 最终给出了答案:你在玩「石头、剪刀、布」。

在被质疑后,谷歌承认了 demo 造假。

最近科技领域的快速发展,着实让谷歌的这几位创始人着急。去年有消息称,隐退多年的谢尔盖・布林已经回到一线开始亲手写代码。施密特在斯坦福大学的呼吁,也有点恨铁不成钢的感觉。不过可以肯定的是,谷歌正在从内到外,逐渐寻求掌握主动权。

已经火热的大模型竞争,还会更激烈吗?

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

1篇Outstanding、5篇Oral!字节跳动今年ACL这么猛? 来直播间聊聊!

本周学术界瞩目的焦点,无疑是在泰国曼谷举行的 ACL 2024 顶会。这场盛会吸引了全球众多杰出的研究者,大家汇聚一堂,共同探讨和分享最新学术成果。


官方公布的数据显示,本届 ACL 共收到近 5000 篇论文投稿,其中 940 篇被主会录用,168 篇工作入选大会口头报告(Oral),录取率低于 3.4%,这当中,字节跳动 共有 5 篇成果中选 Oral。

在 8 月 14 日下午的 Paper Awards 环节,字节跳动旗下成果《G-DIG: Towards Gradient-based DIverse and high-quality Instruction Data Selection for Machine Translation》被主办方官宣入选 Outstanding Paper(1/35)。

ACL 2024 现场照片

回溯 ACL 2021,字节跳动曾摘下唯一一篇最佳论文桂冠,是 ACL 成立 59 年以来,中国科学家团队第 2 次摘得最高奖项!

为深入探讨今年的前沿研究成果,我们特意邀请字节跳动论文的核心工作者解读分享。8 月 20 日下周二 19:00-21:00,「字节跳动 ACL 2024 前沿论文分享会」线上开播!

豆包大语言模型研究团队负责人王明轩,将携手字节跳动多位研究员黄志超、郑在翔、李朝伟、张欣勃、及 Outstanding Paper 神秘嘉宾,分享 ACL 部分精彩中选成果,研究方向涉及自然语言处理、语音处理、多模态学习、大模型推理等领域,欢迎预约!

活动议程

活动议程图1
活动议程图2

精选论文解读

RepCodec Framework
RepCodec:一种用于语音离散化的语音表示编解码器
论文地址:https://arxiv.org/pdf/2309.00169

随着大型语言模型(LLMs)近期的快速发展,离散语音标记化在将语音注入 LLMs 中发挥重要作用。然而,这种离散化导致信息的丢失,从而损害整体性能。为提高这些离散语音标记的性能,我们提出了 RepCodec,这是一种用于语义语音离散化的新型语音表示编解码器。

期待你的互动提问

  • 直播时间:2024 年 8 月 20 日(周二) 19:00-21:00
  • 直播平台:微信视频号【豆包大模型团队】、小红书号【豆包研究员】

欢迎你填写问卷告诉我们,关于 ACL 2024 论文你感兴趣的问题,在线和多位研究员畅聊!
招聘信息 点击此链接,了解团队招聘相关信息



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB