AI大模型落地,为什么是央国企先行?

最高191亿元,最低不到1万元。大模型狂飙两年,国内“AGI阵队”已然形成。


同步进行着的,还有央国企的大模型项目建设。

8月6日,神州数码集团发布公告表示,子公司神州鲲泰中标《中国移动2024年至2025年新型智算中心采购(标包1)》,投标报价约191亿元,中标份额10.53%。2024年7月,湖南省委党校湖南行政学院发布招标信息,采购数字机器人服务,报价9000元。

一个是智算中心采购,一个是数字机器人服务;可以看到的是,如今在央国企内部,大模型项目建设已行至中途。甚至毫不夸张地说,在大模型浪潮席卷而来的今天,央国企正在成为一股先行力量,推动着国内大部分的AI大模型落地项目。

据不完全统计,从2024年1-7月,央国企采购大模型项目数量已超过950个,且均匀布局在智算中心、大模型预训练、Agent和行业应用等多个方向。

大模型纷纷落地国央企,阵势如此浩荡的背后,政策推动成为决定性因素。据沙丘智库,自2023年以来,国资委多次对中央企业发展人工智能提出要求。其中,在2024年2月的中央企业人工智能专题推进会上,提出中央企业要“开展AI+专项行动”。会上就有10家央企签署倡议书,表示将主动向社会开放人工智能应用场景。

同年7月,国新办举行“推动高质量发展”系列主题新闻发布会,提出未来五年,中央企业预计安排大规模设备更新改造总投资超3万亿元,更新部署一批高技术、高效率、高可靠性的先进设备。

政策的推动,当然是其中不可忽视的因素。但除了政策影响,站在产业数字化和数智化的潮头,央国企纷纷落地大模型的背后还有哪些推动因素?一个更值得思考的问题是,和云计算时代金融行业成为先锋官不同的是,在如今的AI大模型时代,为什么央国企会成为先行力量?

一、运营商、政务、能源抢先建设智算中心

AI大模型史上最大项目,当属“智算中心”。

预训练成本的疯狂上涨和推理需求的不断攀升,都在让智算中心成为必要。近日,OpenAI CEO Sam Altman在接受采访时表示,“OpenAI在年内不会发布ChatGPT-5,目前公司专注于ChatGPT-o1的研发和运营。”

GPT-5为什么不发了?原本预计推迟发布的o1又为什么提前登场?这背后的原因不由得引人深思,而训练成本就是这其中的关键因素之一。

言归正传,国内对大模型的预训练需求也愈加迫切。在加速构建国内AGI梯队的同时,性能不断刷新的大模型需要大规模智算集群的支撑。如今,万卡集群已然成为大模型军备赛的标配。而除了国内AI企业和电信运营商,正在推动落地的央国企也在加速构建智算集群,以提高AI大模型的训练及推理效率。

通常来讲,智算中心是由地方政府或电信运营商主导建设。据中国信通院不完全统计,截止2024年7月底,纳入监测的智算中心(含已建和在建)已达87个。

2023年10月,沈阳智能计算中心新基建项目工程总承包(EPC)成交结果出炉,百度携手中国建筑第八工程局有限公司(中建八局)成功中标,中标金额为9.1亿元。具体包括机房建设、机柜设计、智算中心平台,以及百度为其提供的AI软硬件能力的综合性解决方案。

而像这样的智算中心采购项目,央国企已经开始了铺天盖地的建设。对此,产业家根据金额大小,列举了近两年央国企采购智算中心项目金额最高的10个。

对比云计算时代,传统数据中心的中标方大多都是IDC厂商;而在如今的AI时代,则多了不少AI企业和互联网厂商的身影。

另外,从行业分布来看,政务和运营商对智算中心的出资则更加大手笔。对此,产业家统计了运营商、能源和政务三大领域中智算中心项目的占比:结果显示,政务行业对智算中心的投入更大,其中包括GPU租赁、硬件以及算力调度平台的采购。

实际上,从智算中心投入比就可以看出央国企对AI大模型的需求。

可以看到的是,自2023年三季度,央国企就已经开始紧锣密鼓地筹备智算中心建设。而智算中心只是央国企落地AI的一个起点。

一方面,这与上文提到的政策时间点正好吻合;另一方面,2023年第三季度也恰好是以百度、阿里、华为和电信运营商为首的“国内AGI梯队”刚刚形成。

除了智算中心,央国企对AI大模型建设的另一个重点则是行业应用,即针对特定场景搭建大模型平台或应用。

以电信运营商为例,据不完全统计,从2023年至今,运营商对AI大模型的项目建设达到了238起,其中除了75起智算中心建设外,剩余都围绕特定的场景构建大模型,主要有智能客服、营销和数字人方面的采购。

不同行业对于AI大模型的需求不同,项目重点自然也不一样。对于政务和运营商行业而言,之所以智算中心占比更大,除了政策推动,更重要的原因是对于私有化部署、本地部署的需求极高,尤其是政务领域;另一方面,相对于其他行业针对单点或各别环节的大模型应用开发,政务和运营商对大模型的需求则更为系统化,更需要从GPU资源到算力调度平台来发挥作用。

相比之下,在应用AI大模型最多的三个行业中,能源领域对智算中心的投入较少,而更多围绕大模型训练和开发方面,尤其是针对特殊场景如何训练并优化算法,如何微调模型等等。

另外,值得注意的是,对于这些对行业know-how要求更高的领域而言,他们选择中标方的时候也更为讲究;比如在挑选算力调度平台和大模型预训练、开发阶段时,中标方则围绕以百度、科大讯飞为首的AI企业;而在选择在大模型开发过程中,需要特定技术研究时,则会选择南方电网这类更懂know-how的企业。

最后,不同于云计算时代,金融行业成为头部落地试验田;在如今的AI大模型时代,在央国企当中,有四大行业脱颖而出,分别是教育、能源、运营商、政务;而金融行业却并没有表现出像云计算时代那么强的意愿。

二、AI大模型:颠覆传统IT架构背后

时代变迁。在过去的云计算时代,大型企业进行数字化转型需要从购买或租赁服务器,到选址建数据中心,再到选择合适的云架构,接下来到平台开发环节及上层应用的搭建。

通常来讲,一家大型企业,如能源或工业企业来说,面对分布在各环节的数据,通常需要建底层的PaaS平台,从而实现灵活调用、互联互通;但尽管如此,数据孤岛、数据烟囱依然存在。

然而,这种从IaaS到PaaS再到SaaS的架构,在如今的AI大模型时代已经彻底被颠覆。企业往往需要一个行业大模型即可搞定,而不再会为了构建多个复杂应用,费时搭建PaaS平台。

诚然,企业在云计算时代交得学费也并没有浪费,在AI大模型时代,央国企在政策引导、需求迫使和环境因素等多方作用下已经开始先行落地AI大模型。

而在这其中,很大一部分都是基于过去云计算时代一些无法解决的顽疾,希望在AI大模型这里找到更好的解法。

可以观察到一个现象,目前央国企在大模型落地方面,主要围绕两点,一个是智算中心,一个是行业应用。后者包括大模型预训练,大模型开发,以及针对各别环节或特定场景构建大模型应用或解决方案。

通常来说,后者通过大模型基于特定场景的解决方案,都是在过去云计算时代无法实现的。

以运营商为例,虽然智能客服已经存在很多年,准确地说,自云计算时代以来,各类智能客服软件和解决方案层出不穷,然而对于整个行业来讲,转人工率依旧居高不下,普遍都在80%以上。而当时代的列车刚刚驶入大模型时代,智能客服就成了大模型落地的第一块试验田。

再比如在能源行业,知识如何沉淀,再如何让新人用起来,一直都是一大难题。即使在云计算时代,工业互联网平台林立,很多问题依旧没有答案。而在如今的大模型时代,一个行业大模型便可以解决很多问题。这其中关键发挥作用的便是在行业大模型构建过程中的RAG搭建环节,它相当于一个企业知识库,任何输入的知识,都可以轻松调用。

像上述所展示的,对于某些行业来说,大模型并不是“鸡肋”。相反,它能够扮演“超强大脑”的角色,将企业的全部智慧汇聚到一起,并有的放矢地发挥作用。

然而,对有些行业而言,大模型目前还并未找到用武之地。

比如在金融行业,目前落地较多的项目主要围绕知识库问答方面,很难深入到核心业务。一方面,是出于金融监管和数据隐私等顾虑;另一方面,也是更重要的,目前AI幻觉问题还很难彻底得到解决,任何AI算法可能为金融行业所带来的错误预测和建议,都可能带来重大经济损失。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

华人高管频频离职,OpenAI发生了什么

OpenAI 的离职潮还在继续。

11月9日,上任OpenAI研究与安全副总裁仅3个月后,OpenAI 安全系统团队负责人翁荔(Lilian Weng)在 社交媒体X上宣布将离开OpenAI这家自己已经工作近 7 年的公司。


而在不久前,翁荔还以OpenAI研究副总裁(安全)的身份回国参加了B站的超级科学晚活动,讲述如何培养出下一代聪明且安全的AI技术。

据悉,翁荔是OpenAI里目前职位最高的华人科学家之一,也是OpenAI今年以来,十余位中高层领导先后出走后的最新一个案例。

01、核心人才接连出走,OpenAI变动频繁

“我做出了一个非常艰难的决定,将于11月15日离开OpenAI,这将是我在公司最后一天。”11月9日,OpenAI华人科学家、ChatGPT的贡献者之一——翁荔在社交平台X上公开分享了自己的离职信。

据悉,翁荔本科毕业于北大,后来曾前往香港大学进行短期交流,并在印第安纳大学伯明顿分校取得博士学位。她于2018年正式加入OpenAI,成为该公司的机器人团队的一员,用两年时间开发出了“一只能解魔方的机器人手”;后来,又参与了GPT-4项目的预训练、强化学习和对齐、模型安全等方面的工作。最著名的Agent公式也由她提出,即:Agent=大模型+记忆+主动规划+工具使用。

翁荔还是OpenAI最近一年这波频繁的离职潮中,被最新提拔起来的有大陆背景的职位最高的华人科学家。

翁荔

她在去年被指派创建并领导了安全系统团队(Safety Systems),解决减少现有模型如ChatGPT滥用等问题。而在今年7月,在第三位安全主管杨·莱克(Jan Leike)离职约两个月后,翁荔正式升任OpenAI新一任安全主管

在翁荔之前,另一位在Open AI担任重要职务的华人科学家Peter Deng也已离职。他在2023年6月正式加入OpenAI,担任ChatGPT的消费产品副总裁。Deng此前是Facebook产品经理,也是扎克伯格最信任、器重的高管之一。OpenAI公司发言人证实,Peter Deng已经在几个月前离职。

事实上,华人正在成为OpenAI发展的一股重要力量。2022年11月,ChatGPT惊艳问世,87人的主创团队中,华人占比10.34%,达到9人,且其中有5人本科就读于中国内地高校。

而后陆续亮相的多…

这其中,既包括了首席科学家、首席技术官、首席研究官、Sora视频生成模型负责人、GPT-4o多模态模型负责人在内的至少十几位中高层领导,也包括了OpenAI的多位初创成员。

据悉,2015年帮助创立OpenAI的13人中,目前仅有3人还留在OpenAI,即首席执行官Sam Altman、OpenAI语言和代码生成团队负责人Wojciech Zaremba,以及还在长期休假中的OpenAI总裁兼联合创始人Greg Brockman。

02、OpenAI,日子不像以前那么好过了

多位核心技术人员和高管频繁出走背后,OpenAI的日子远不如去年好过。

一方面,不管是OpenAI内部,还是外部,关于AI安全方面的理念冲突始终高悬

去年7月,OpenAI超级对齐团队正式成立,承接的使命是:用20%的算力,在未来4年内解决控制超级智能AI的核心技术挑战。但不到一年时间,超级对齐团队的两名负责人——OpenAI联合创始人、首席科学家Ilya Sutskever,和RLHF发明者之一Jan Leike,就在今年5月同一天官宣离开OpenAI。

其中,Jan Leike更是直接跳槽到了OpenAI的最强竞对、Claude背后的团队——Anthropic,继续超级对齐工作,并连发十几条推文,炮轰OpenAI,控诉其没有兑现20%算力的承诺,“在过去几年里,OpenAI的安全文化和流程已经让位于耀眼的产品”

而后,更多超级对齐团队成员的相继离职,也引发了外界更为广泛的讨论。今年10月,新晋2024诺贝尔物理学奖得主Geoffrey E.Hinton甚至在获奖后的一次新闻活动中公开“diss”OpenAI首席执行官Sam Altman,称“OpenAI在成立时,主要目标是开发通用人工智能,并确保其安全。但随着时间的推移,事实证明Altman更关心的是利润而非安全,这很不幸”,并表示对自己的一名学生“解雇了Sam Altman感到自豪”。

而另一方面,OpenAI面临的资金压力也在持续加大,赚钱速度还远赶不上“亏钱”

今年10月,有外媒披露,OpenAI今年预计实现营收37 亿美元,但亏损仍将约50亿美元。而这还只是开始,有机构通过对OpenAI的财务数据分析推测,OpenAI将于2029年实现盈利,届时营收将达到1000亿美元,但在此之前OpenAI依然会存在较为严重的亏损,预测2026年亏损幅度将达到140亿美元。

与此同时,受算力限制、Scaling law放缓等多重因素影响,OpenAI的大模型产品研发进度也在放缓

2024年2月,Sora横空出世,一举将AI视频赛道变得炙手可热。但时至近日,快手旗下的文生视频大模型可灵已上线数月,Sora却仍是款“期货”产品。取而代之的是,Sora团队两位负责人之一的Tim Brooks,在10月4日正式宣布离职,跳槽到了谷歌旗下的DeepMind公司。

至于万众期待的下一代大型AI模型GPT-5,在前不久的一场Reddit有问必答会议上,也被OpenAI首席执行官Sam Altman确认,由于计算能力的限制,新产品推出的节奏未能如预期般迅速,OpenAI今年将不会推出GPT-5,但计划在晚些时候带来一些“极为出色的新版本”,以缓解外界的期待。

但不可否认的是,OpenAI在新项目和新产品上投入的巨资和持续探索,也在为整个行业探路。如同此前的ChatGPT和Sora,在它确定下来一个方向后,其他企业也能有机会以更小的成本,迅速赶上。

Altman正在加码解决资金问题。10月3日,OpenAI在官网宣布,已成功获得66亿美元融资。本轮融资结束后,OpenAI估值将达到1570亿美元(约1.1万亿元人民币),成为有史以来估值最高的创业公司之一

与此同时,OpenAI的组织结构有可能再次改变。今年9月,有报道称,OpenAI正在制定一项计划,将其核心业务重组为一家营利性利益公司,不再受非营利性董事会的管理,从而使公司对投资者更具吸引力。消息人士随后透露,非盈利组织OpenAI将继续存在,并持有这家营利性公司的少数股权。

而据11月5日的最新消息显示,OpenAI正与加州总检察长办公室就改变公司结构进行初步谈判,以成为一家营利性企业。

新一轮人员动荡潮下,OpenAI的故事,仍然在备受瞩目和持续动荡中交织演绎。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

哪个正常人能拒绝一只毛茸茸的「电子猫咪」?

猫咪应该想不到,有一天自己可能会被电子毛球抢走「工作」。

通常,机器人是冷冰冰的存在,哪怕外形可爱,一层金属外壳多少让人望而却步。


但如果不再是冰冷的金属外壳,而是温暖的,适合拥抱的毛绒材质,似乎能离人的心更近。

毛茸茸的 Moflin 就是这样的存在。它是一款由人工智能驱动的自主机器人,通过交流,Moflin 可以以多种方式改变自己的情绪,包括愤怒、悲伤、快乐,并像真实的生物一样做出反应。

「Moflin 有一颗像活物一样的心,是一个能让你振作起来的朋友」,Moflin 全身被灰色或黄色的绒毛覆盖,看起来像豚鼠,又有点像兔子,只是没有竖起来的耳朵。

拥有一只 Moflin,不用像养小猫小狗一样给它铲屎、修毛、剪指甲、洗澡,也不用给它打疫苗,甚至喂食也不需要,只需要没电时,放在它的小篮子里,边「睡」边充电就可以;但却可以像拥有小猫小狗一样得到抚慰。

基于内置 AI,Moflin 会对主人的行为给出不同的互动反应,如果主人抚摸、拥抱它,它会变得快乐、安全、平静,如果主人不关注它,它也会产生一点负面情绪,变得紧张、焦虑和悲伤。而通过花时间在一起,主人跟的 Moflin 感情会逐渐加深,双方都会变得更加依恋对方,跟真的养小猫小狗一样。

不用很多费心思的付出,只用不到三千块,就可以拥有真实的养宠陪伴感。未来,随着技术的持续发展,AI 电子宠物可能会变得更加智能和人性化,成为生活中不可或缺的伙伴。

虽然 Moflin 和类似产品在情感表现上尚存局限,但它们所带来的陪伴感为人提供了一种新的生活方式和情感寄托。无论是为了减轻孤独感,还是为了寻找一种全新的互动体验,这类产品都展示了科技与情感的进一步可能。

01、毛茸茸的 AI 机器宠物

Moflin 最初由日本初创公司 Vanguard Industries 开发,并于 2020 年在 Kickstarter 上推出,最初的生产因疫情期间的供应链问题而受阻,现在由卡西欧制造和分销,预计已于 11 月 7 日开始发售,价格为 59,400 日元(约合 2779 元)。此外,CASIO 还提供维修、清洁、更换毛皮的「Club Moflin」订阅服务,每年 6600 日元,折合人民币约 312.81 元。

在 AI 的驱动下,Moflin 就像一个有情感的「生物」,能够通过语音和基于手势的识别软件与主人「建立更深层次的联系」,其情绪会根据它与主人互动的方式而改变,如果主人抚摸、拥抱它,它会变得快乐、安全、平静,如果主人不关注它,它也会产生一点负面情绪,变得紧张、焦虑和悲伤,而通过花时间在一起,主人跟的 Moflin 感情会逐渐加深,双方都会变得更加依恋对方,就像养真实的宠物一样。

刚带回家的话,Moflin 的「动作和声音会比较幼稚」;到共处的第 25 天,依恋感开始产生;再到第 50 天左右,它会变得更加活跃,可以用蠕动和类似喵喵的声音来回应主人。在不同的主人、成长环境下,mofin 的个性也会有所不同,

这种随着时间推移,互动逐渐加深的过程,跟抚养真实宠物的过程已经很接近。在不同的主人、成长环境下,mofin 的个性也会有所不同,

更逼真的是:Moflin 配有一张小床…
```

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

OpenAI CEO万字专访:2025年实现AGI,是我一生最兴奋事!

著名初创企业加速器Y Combinator首席执行官GarryTan,专访了OpenAI首席执行官Sam Altman。二人主要讨论了Sam早期在YC加速器的经历,后来为何离开并创立了OpenAI,以及对AGI的看法和OpenAI当时是如何力排众议,坚信深度学习才是AI的未来。


同时给正在AI创业的企业提供了一些创业路径和经验。在结尾(46分钟)的快速问答环节,Garry向Sam提问,关于2025年,有什么让你感到非常兴奋的事情?Sam回答:“AGI。对一个‘孩子’来说,我对这个比任何祝贺都感到兴奋,这也是一生中最让我兴奋的事情。它将彻底改变我们生活,我真的等不及了,为了我们的孩子,携手全世界共建一个更美好的世界。”Sam在创立OpenAI之前,曾担任过Y Combinator的CEO,也正是这段经历彻底改变了他的一生,开拓了他的视野、思维、人脉,为后来创立OpenAI奠定了重要基础。SamAltman早年在YC加速器的经历2005年,当Sam还是斯坦福大学的一名新生时,便与YC加速器结下了不解之缘。那时的他年轻且充满冲劲,对创业有着浓厚的兴趣和独特的见解。尽管YC创始人PaulGraham起初建议他次年再来,但他凭借着坚定的决心和自信,成功说服了对方,以大二学生的身份加入了YC加速器。在YC加速器的这段经历,对Sam产生了深远的影响。当时YC加速器的氛围吸引了他,这里聚集着一群特立独行、充满激情且勇于追求自我理想的人。这种独特的环境让他坚信,在创业的道路上,可以勇敢地去尝试各种可能性,并且这种尝试是极具价值的。Sam意识到,身边围绕着一群志同道合、同样坚持不懈的伙伴,是推动创业成功的重要力量。这也使得他深刻体会到,对于年轻的创业者而言,尽早找到一个积极向上、富有创造力的圈子,对个人成长和事业发展具有不可估量的意义。随着时间的推移,Sam在YC加速器中不断积累经验,他的创业视野也逐渐拓宽。他对经营研究实验室产生了浓厚的兴趣,并将这种兴趣转化为实际行动。大约在2014年底到2015年初,当时人工智能领域正处于快速发展和变革的时期,各种讨论和探索层出不穷。《超级智能》一书的问世,以及DeepMind(已被谷歌收购)等公司取得的…
Photo source: 由GPTNB生成

Source: https://www.aixinzhijie.com/article/6847190

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

当我让AI在双十一购物,为啥它们都只买电子产品啊?

来源:数字生命卡兹克

图片来源:由GPTNB生成

明天不是就双十一了吗,各家的满减优惠算得我头疼。
就在我用AI算满减怎么凑,看着我的购物车的里那些奇奇怪怪的各种商品时,我突然想到一个有趣的问题:
“如果AI是个人,它会在双十一买什么?”
我就把这个问题,随手问了几个AI。


然而,就是这么简单的问题,让我发现了AI之间存在着一个“诡异”的现象:
十个AI,八个都选择给自己买电子产品
不是一两次,而是重复测了三四五六七八……N次。

(文章内容过长,省略其余部分)

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

LoRA、完全微调到底有何不同?MIT 21页论文讲明白了

本文旨在了解两种微调大型语言模型方法之间的差异:完全微调和低秩自适应 (LoRA)。这两种方法都用于将预训练模型适应特定的下游任务,但它们却有所不同。


微调(Fine-tuning)是将经过预训练的大语言模型应用于下游任务的关键范例。最近,低秩自适应 (LoRA) 等方法已被证明可以在各种任务上达到完全微调模型的性能,同时可训练参数的数量却大大减少。

这就提出一个问题,即它们学到的解决方案真的等效吗?

带着这一疑问,来自 MIT 的研究者在论文《 LORA VS FULL FINE-TUNING: AN ILLUSION OF EQUIVALENCE 》中进行了深入探讨。

论文地址:https://arxiv.org/pdf/2410.21228v1

作者通过分析预训练模型权重矩阵的光谱特性来研究不同的微调方法如何改变模型。

研究发现,完全微调与 LoRA 产生的权重矩阵奇异值分解结构有显著不同,并且经过微调后的模型在面对超出适应任务分布的测试时也显示出不同的泛化行为。

特别是,LoRA 训练的权重矩阵中出现了称为「侵入维度(intruder dimensions)」的新的高秩奇异向量,而在完全微调中则不会出现这种情况。

这些结果表明,即使在微调分布上表现相同,但使用 LoRA 和完全微调更新的模型访问参数空间的不同部分。

作者通过研究 LoRA 微调模型中出现侵入维度的原因、它们为什么不受欢迎,以及如何最小化这些效果来展开研究。

最后,作者给出了以下几点观察:

首先,LoRA 和完全微调在结构上产生不同的参数更新,这种差异由侵入维度的存在产生的。这些侵入维度是奇异向量,具有较大的奇异值,并且与预训练权重矩阵中的奇异向量近似正交。相比之下,完全微调模型在光谱上与预训练模型保持相似,不包含侵入维度。

其次, 从行为上看,与完全微调相比,具有侵入维度的 LoRA 微调模型会忘记更多的预训练分布,并且表现出较差的稳健连续学习能力:具有侵入维度的 LoRA 微调模型在适应任务分布之外不如完全微调模型,尽管分布准确度相当。

最后, 即使在目标任务上低秩 LoRA 表现良好,但更高秩的参数化可能仍然是可取的。低秩 LoRA(r ≤ 8)适合下游任务分布,完全微调和高秩 LoRA(r = 64)让模型泛化能力更强、自适应能力更加鲁棒。然而,为了利用更高的秩,LoRA 更新模型必须是秩稳定的。

沃顿商学院副教授 Ethan Mollick 对此评论道:事实证明,使用 LoRA 定制通用 LLM(Apple 调优其设备内置模型的方式),对 LLM 的限制远大于微调,因为它们失去了一些泛化能力。原因是 LoRA 增加了不祥的侵入维度。

LoRA 和完全微调模型的差异

本文采用神经网络参数的奇异值分解 SVD 来理解微调对预训练权值的变化。

特别是,本文测量了用 LoRA 微调过的权重矩阵中的奇异向量或完全微调过的权重矩阵中奇异向量映射到预训练权重中的奇异向量的程度,使用它们的余弦相似性。这些关系如图 1 和图 3 所示,颜色表示预训练和微调奇异向量之间的余弦相似度。

图 2 (b) 中观察到,LoRA 和完全微调的奇异向量与预训练奇异向量的相似度非常不同:与完全微调相比,使用 LoRA 微调的模型的奇异向量与预训练奇异向量的平均余弦相似度似乎要低得多。

图 2 (b) 中左下角有一个唯一的红点,作者将这些新维度命名为侵入维度,其正式定义如下:

LoRA 微调模型包含高秩侵入维度,而完全微调的模型则不包含。为了量化特定权重矩阵的侵入维度集的大小,作者使用图 4 所示的算法。

即使在 LoRA 微调模型学习效果不如完全微调的任务中,侵入维度也存在。

观察图 5b、5c 和 5d,我们可以清楚地看到,即使 LoRA 的 r=256,高秩奇异向量集中仍出现侵入维度。重要的是,当 r=2048 时没有侵入维度,而是展示了与完全微调非常相似的曲线。这支持了早先的发现:随着秩增加超过一个阈值,侵入维度会消失,LoRA 开始趋向于与完全微调相似。

了解更多内容,请参考原论文。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

RESAAS拓展人工智能能力,推动商业数据交换增长

RESAAS Services Inc. (“RESAAS”) (TSXV: RSS) (OTCQB: RSASF),作为房地产行业技术解决方案的领先提供者,今天宣布该公司的商业数据交换平台(CODE)取得了加速增长,其增长动力来自人工智能(AI)的运用。图片{ width=60% }


RESAAS CODE内的AI能力正在推动新客户类型和进入新的国家市场的增长。这一创新是RESAAS致力于提供可访问数据解决方案以推动商业地产行业进步的承诺的延续,特别是针对商业经纪公司的研究、市场情报和数据运营部门。

“RESAAS为商业地产领域带来创新,赋予我们的客户实时市场可见性、可伸缩增长以及跨多个资产类别和国家市场的数据驱动扩张的能力,”RESAAS首席执行官Tom Rossiter表示。“通过最近的增强功能,新客户将能够通过自助入职流程加入CODE。”

随着现有客户的需求增长,RESAAS致力于扩大CODE支持的资产类别数量。在“办公”资产类别已经上线并投入使用的同时,正在集成次级和三级资产类别。这些增加将进一步将RESAAS CODE定位为跨越不断增长的商业地产类别的综合数据交换平台。

RESAAS CODE安全地接收、组织、转换并与经纪客户共享数据。经纪和机构房东客户订阅每年访问RESAAS CODE,产生月度循环收入。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

RESAAS扩展AI能力以促进商业数据交换增长

RESAAS Services Inc. (“RESAAS”)(TSXV: RSS)(OTCQB: RSASF)是房地产行业技术解决方案的领先提供商,今天宣布了公司Commercial Data Exchange平台(CODE)的加速增长,这得益于人工智能(AI)的应用。图片{ width=60% }


RESAAS CODE内的AI能力正在推动新客户类型和进入新的国家市场的增长。这种创新遵循RESAAS致力于提供可访问的数据解决方案来推动商业房地产行业的进步,特别是对于商业经纪公司的研究、市场情报和数据运营部门。
“RESAAS将创新带入商业房地产领域,赋予我们的客户实时市场可见性、可扩展的增长和跨多类资产和国家市场的数据驱动扩张能力,” RESAAS首席执行官Tom Rossiter表示。“通过最近的增强,新客户将能够通过自助入职流程加入CODE。”
随着现有客户需求的增长,RESAAS致力于扩大CODE支持的资产类别数量。办公资产类别已经在使用中,次级和三级资产类别正在整合中。这些增加将进一步将RESAAS CODE定位为跨越不断增长的商业房地产类别的综合数据交换平台。
RESAAS CODE安全接收、整理、转换和与经纪客户共享数据。经纪和机构房东客户按年订阅以获取对RESAAS CODE的访问权,从中产生月度经常性收入。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Equifax CEO Mark W. Begor将继续领导公司至2025年以后

Equifax® (NYSE: EFX)今天宣布,Mark W. Begor将继续担任首席执行官(CEO),超出他目前2025年雇佣协议的到期时间。图片{ width=60% }


“在过去6年里,Mark为Equifax提供了清晰的愿景和坚强果断的领导。尽管2022年和2023年抵押市场下降34%,但他在充满挑战的经济条件下取得了强劲的财务业绩,自2018年以来营收增长了50%,并将Equifax市值从2018年的140亿美元增至330亿美元,年复合增长率为14%,”Equifax董事会主席Mark Feidler表示。“Mark及其团队已成功完成了一项总额超过15亿美元的基于云的企业范围技术转型,现在他们正利用这一转型来推动全球创新和增长。董事会仍然相信他独特地位于继续领导业务并为股东创造价值。”

Begor于2018年4月加入Equifax,并成功推动了一项全面的技术转型,改变了公司几乎每一个方面的基础设施。这次向云端的转型是Equifax历史上最大的投资,是加速创新、推出新产品和增长的关键推动因素,使顾客、消费者和投资者受益。Begor还通过自2018年以来投资超过45亿美元完成了25项战略性并购,他领导的公司每年连续四年推出超过100个新产品,且自2022年以来,活力指数超过10%。

“我对新Equifax的未来比以往任何时候都更有活力,很高兴领导公司实现其业界领先的云技术投资所带来的好处。利用Equifax云端的强大力量,结合其区别化数据资产和专利的EFX.AI技术,将使Equifax能够帮助我们的客户从表现更佳的评分、模型和产品中增长,”Begor表示。“我很高兴领导新Equifax的下一篇章,我们期待这将带来更高的增长、边际扩张和扩大自由现金流,使Equifax能够加速返还现金给投资者并推动股东回报。”

前瞻性陈述

本发布包含前瞻性陈述和前瞻性信息。所有涉及我们期望或预计将来发生的事件或发展,包括有关未来运营结果的声明以及类似的关于我们的财务展望和业务计划的声明,均属于前瞻性陈述。我们认为,这些前瞻性陈述在作出时是合理的。然而,前瞻性陈述面临可能导致实际结果与我们的历史经验和目前的期望或预期大为不同的风险和不确定性。这些风险和不确定性包括,但不限于,在我们于2023年12月31日提交的10-K表中描述的那些,以及随后向美国证券交易委员会提交的文件中描述的那些。由于这些风险和不确定性的存在,我们建议您不要过分依赖任何前瞻性陈述。前瞻性陈述仅于作出时刻有效。我们不承诺公开更新或重新修订任何前瞻性陈述,无论是出于新信息、未来事件还是其他原因,除非法律有要求。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Equifax CEO Mark W. Begor将继续领导公司直至2025年以后

Equifax® (NYSE: EFX)今天宣布,Mark W. Begor将继续担任首席执行官(CEO),超越他目前2025年服务协议的到期日期。图片{ width=60% }


“在过去的6年中,Mark为Equifax提供了清晰的愿景和坚定的领导。尽管2022年和2023年按揭市场下滑34%,他在挑战性经济形势下取得了强劲的财务业绩,自2018年以来,营收增长了50%,并将Equifax的市值从2018年的140亿美元增至330亿美元,年复合增长率达14%,” Equifax董事会主席Mark Feidler表示。“Mark及其团队已经成功完成了一项价值超过15亿美元的企业级基于云技术的转型,他们目前正在利用这项转型推动全球创新和增长。董事会仍然对他有信心,相信他有独特的能力继续领导业务并为股东创造价值。”

Begor于2018年4月加入Equifax,并成功推动了一项改变公司几乎每个基础设施方面的完整技术转型。这次向云转型是Equifax历史上最大的投资,也是促进创新、推出新产品和增长的关键支持者,使顾客、消费者和投资者受益。在他的领导下,Equifax通过自2018年以来对25项战略性并购投入45亿美元,扩大了其差异化数据资产,并已连续四年每年推出超过100种新产品,自2022年以来Vitality指数一直保持在10%以上。

“我比以往任何时候都更充满活力,对新Equifax的未来感到兴奋,并且很高兴在公司利用其行业领先的云技术投资所带来的益处时领导公司。结合Equifax云的强大力量,以及其差异化的数据资产和专利的EFX.AI技术,Equifax将能够帮助我们的客户从更高效的得分、模型和产品中实现增长,” Begor表示。“我很高兴领导新Equifax的下一章,我们期望将实现更高的增长、边际扩张和扩大的自由现金流生成,将Equifax定位为加速向投资者返现和推动股东回报。”

前瞻性声明:此发布包含前瞻性声明和前瞻性信息。所有预期将来发生的事件或发展,包括有关未来经营结果的声明,以及类似我们的财务展望和业务计划的声明,均为前瞻性声明。我们认为这些前瞻性声明在其做出时是合理的。然而,前瞻性声明受到可能导致实际结果与我们的历史经验和目前的期望或预测有重大出入的风险和不确定性的影响。这些风险和不确定性包括,但不限于,我们在截至2023年12月31日的10-K表和随后向美国证券交易委员会提交的文件中描述的风险。由于此类风险和不确定性,我们建议您不要过度依赖任何前瞻性声明。前瞻性声明只有在发表时才有效。我们承诺在法律要求的情况下,在新信息、未来事件或其他方面公开更新或修订任何前瞻性声明。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB