为了玩《黑神话:悟空》,我们测试了43个GPU

《黑神话:悟空》是一款深受中国神话启发的全新动作角色扮演游戏。游戏邀请玩家扮演天选之人踏上史诗般的旅程,穿越令人惊叹的风景,揭开古老传说中隐藏的真相。


这款游戏凭借其令人惊叹的视觉效果(虚拟引擎5)、激烈的战斗和丰富的世界构建,在发布前就引起了人们的关注。

就游戏细节而言,我们就讲到这里,因为今天的文章主要讨论 GPU 基准测试。最终目标是在相同的测试条件下对大量显卡进行基准测试,看看它们的性能如何。这样您就可以看到与当前设置相比,潜在升级的速度有多快。

图片来源:由GPTNB生成

Black Myth: Wukong 还提供了 Steam 上的免费基准测试工具,这非常棒。我们希望所有游戏开发商都能提供这样的工具。下载 7GB 后,您可以在系统上运行基准测试。这将帮助您确定当前设置玩游戏的效果如何。如果您需要 GPU 升级,本指南将向您展示您可以从当前一代 GPU 以及上一代的大多数型号中获得多少性能提升。

Wukong 由 Unreal Engine 提供支持,画面效果令人惊叹。这是一款由 Nvidia 赞助的游戏,因此非常重视光线追踪,不过FSR和XeSS升级与 DLSS 一起受支持。FSR 和 DLSS 以及 TSR 也提供帧生成功能。

为了进行基准测试,我们测试了五种不同的配置,每种配置有三种分辨率,最多有 41 个 GPU,因此产生了大量数据。我们已经在两个系统上使用基准测试工具记录了超过 40 小时,这两个系统都使用Ryzen 7 7800X3D,并且它们已经过校准,可以提供一致的结果。

原文链接: https://www.techspot.com/review/2883-black-myth-wukong-benchmark/

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

AMD豪掷49亿美元收购最大服务器制造商!原因竟是太缺人!CEO苏姿丰回应,打法跟英伟达果真不一样!

49亿美元!AMD以“接近5个独角兽”的代价,下狠手买买买,收购了最大的服务器制造商ZT。

ZT,何许人也

ZT这个名字或许你不熟悉,但如果你知道他的客户和业务后,一定会大吃一惊。


据了解,ZT Systems 公司成立已有三十年之久,专注于为最大的 AI超大规模企业构建定制计算基础设施,不用猜,微软、Meta、亚马逊肯定在这些“AI 超大规模企业”之列。

ZT总部位于美国新泽西州出了名的老牌数据中心西考卡斯。早在1994年,ZT Systems 赶上了当时的HFT热潮,制造个人电脑和 SMB 服务器,业务相当不错。

2004年开始,该公司收缩范围,重新专注于金融服务公司供 HFT 和其他金融科技客户所需的高性能服务器。

2010 年,ZT Systems…

AMD如此阔绰,看上对方什么了?

你可能想不到,AMD收购Zt,很大部分原因并不是其强大的服务器设备的收入。那么AMD到底怎么想的?

AMD首席执行官苏姿丰对此次收购给出了答案:

“此次收购服务于AMD的长期的AI战略,目标是打造AMD领先的AI训练和推理解决方案。这些解决方案可以在云计算和企业客户中快速大规模部署。ZT增加了世界一流的系统设计和机架级解决方案专业技术,这将大大加强我们的数据中心人工智能…

AMD用收购解决人才荒!

AMD 要做的是提高其系统架构和工程水平。然而AMD目前的“并行开发能力”远远不够。据AMD执行副总裁 Norrod 透露,AMD 大约有 500 名系统工程师,而ZT Systems 有 1,100 名工程师从事这项工作。

鉴于 AMD 接下来的宏达计划——不仅要按照一种标准构建系统,还要按照多种标准构建系统,因此它需要更多人来帮助设计和构建未来的 GPU 加速系统(Instinct系列AI数据中心芯片的采用,这些芯片将与NVIDIA的GPU展开竞争),以便对其进行测试(但不是…

下面是Norrod对外媒采访时的解释:

“我们一直在关注路线图,了解将竞争力和领先性能及效率融入系统的复杂性。对于人工智能系统,业内所有人都越来越清楚地意识到,这将给在如此功率水平、信号速率以及如此复杂的水平下设计系统带来巨大的挑战。要让它们保持运行和可管理,将会非常困难。”

“有一整套问题亟待解决,而满足这些要求的需求又会追溯到硅开发流程的早期阶段。我们对其中一些问题很熟悉,因为在制造超级计算机时就会遇到这些问题。但是,当你观察人工智能系统的发展时,就会发现复杂性飙升得如此之快,因此,从硅定义流程的一开始,我们就必须拥有足够数量的世界级系统设计工程师来帮助我们,这一点至关重要。因此,我们清楚地意识到,我们需要大幅提升我们的实力。”

“更为复杂的是,在我们提升实力的同时,我们希望坚持AMD在开放生态系统和客户选择方面的传统,而不是以专有的方式锁定一切。这就意味着我们需要更多的人。因为如果你试图打造一个专有系统,并让全世界每个人都使用它,只要他们保持原样,就可以随心所欲地使用…

AMD的长期AI路线图描述了在AI时代对抗英伟达的决心,但这实际上是关于上市时间、系统设计和工程实力的问题。

有媒体解释了AMD此举的动向:AMD在整合优秀CPU,乃至现在的GPU方面做得很好,但它还需要整合网络堆栈和系统主板,并将它们全部纳入经过大规模测试和验证的机架式和集群式系统设计中。这就是英伟达推出DGX系列的原因,AMD也同意它需要做这件事,但它不会为客户构建系统,也不会成为高性能计算(HPC)或人工智能(AI)集群的总承包商。

收购后,ZT人员去向

虽然ZT Systems 首席执行官Frank Zhang 将继续经营制造业务,并在 AMD 完成收购后履行公司对现有客户的承诺,但与此同时,Zhang 也表达了自己制造业务极有可能会有新的买家,他接下来会寻找公司来购买拥有约 1,500 名员工的制造业务,“因为 AMD 对从事服务器制造和服务器销售业务不感兴趣,因此不想与其客户竞争。”

不得不说,AMD这个打法跟英伟达有点不同。

而ZT的另一位大佬,Doug Huang,他曾在戴尔数据中心解决方案部门担任工程总监,2013年1月,当他转向机架式系统时,被聘请为ZT Systems平台工程副总裁。黄先生一路晋升,成为ZT Systems工程和全球制造部门负责人,并于2023年1月被任命为公司总裁。Huang将继续留在AMD,领导约1600名系统设计师和工程师的团队。

据悉,此次收购ZT,将于明年上半年完成,AMD将以现金和股票的形式支付49亿美元,其中还包括最高可达4亿美元的有条件支付部分。但ZT员工的去向也成为了AMD接下来一个悬而未决的问题。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

美籍华人说:中国的7nm只是玩数字游戏,不但性能没提升,而且与美国还有10年的技术差距

文章来源:月听雪

图片来源:由GPTNB生成

前沿导读

在一次采访当中,美籍华人黄仁勋这样评价华为的芯片工艺:
我对华为说自己7纳米并不感到意外,14纳米也好,7纳米也好,造手机没问题,都不过是他们说个数字而已,但性能并没有提升。在半导体领域,我们大概领先10年。


图片来源:由GPTNB生成

制程工艺

现阶段,透露出来的中国芯片制程工艺也就是海思麒麟的7nm,其次就是龙芯CPU的14nm工艺。黄仁勋说的话不能算错,也不能算对。
他是站在英伟达水平的层面来评判华为的芯片工艺,从技术手段上面来说,由国产供应链打造的等效7nm的制程工艺,在性能表现上面必然是不如海外国家的产品。
华为芯片的这种7nm工艺,并且支持超线程技术,只能说是临时救场的技术手段。
通过超线程调用所有的核心分工,以牺牲大核心性能的前提下保证中低负载场景的使用体验,这也是在被制裁的情况下,能最大提升芯片性能的做法。

图片来源:由GPTNB生成

DUV光刻机最极限的制程工艺也就是7nm,再往下发展,就需要极紫外线工艺的介入。
而英伟达作为全球芯片行业的顶级企业之一,所拿到的资源是全球化的,不管是设备材料,还是设计工艺的技术,都属于行业最好的水平。
黄仁勋以英伟达的眼光来看待华为芯片的工艺,说是数字游戏也并不为过。
下面我们来说技术差距:
在电脑芯片领域,龙芯最新的3a6000在性能水平上面可以达到英特尔10代酷睿4核心的水平,技术差距在5年左右。
而被大众称之为麒麟9000s和麒麟9010的两款芯片,在整体的性能方面相当于高通的骁龙888的水平,技术差距在3年左右。
如果单独看实际的使用效果,在中低负载方面能达到骁龙8的水平,也就是三星4nm的技术水平,而高负载的水平就差一些了,跟台积电的4nm工艺的差距很大。
受制于产业链的因素,两款新的麒麟芯片在功耗上面都不低。

图片来源:由GPTNB生成
图片来源:由GPTNB生成

国产供应链

从整体工业的发展情况来看,说国产供应链的水平距离海外主流水平的差距有10年也并不夸张。
在芯片设计领域,我国的水平已经持平海外国家,甚至在部分产品上面已经有反超的迹象,但是在制造产业链上面,受制于人的情况依然严重。
在高端制造设备上面,由尹志尧带队的中微半导体制造的刻蚀机,是中国第一台拥有自主知识产权的高端芯片制造设备。
并且中微半导体的刻蚀机已经出口给了海外国家,就连台积电这种国际顶尖的晶圆加工厂,也有一部分刻蚀机是来自于中微半导体制造的。

图片来源:由GPTNB生成

至于光刻机领域,我国的上海微电子已经打造出部分光刻机产品,但是还没有能在消费级电子产品领域投入使用的设备。
在其他芯片产业链当中,盛美半导体的发展势头最猛。盛美半导体是国内集研发、设计、制造、销售于一体的半导体产业链公司,是中国半导体设备的五强企业。
已经在刻蚀、清洗、除胶、抛光、电镀、显影等多个领域有了自主技术和制造设备的产出。

图片来源:由GPTNB生成

现在这些国产的芯片制造设备,绝大部分都是从国外给挖到国内的。
不管是中微半导体、中芯国际、还是盛美半导体,都是当年上海市副秘书长江上舟,动用自己的力量,把这些人以及企业从国外给挖到了国内,又从国家和政府的层面拉来了资助和政策扶持,这才有了现在中国国产芯片设备向上发展的好趋势。
在这其中,盛美半导体本身是美籍华人王晖在美国创办的企业,并且在发展到一定程度之后,美国相关部门打算直接收购了盛美半导体,变成由美国部门掌控的美国企业。
江上舟知道了以后,立马找到王晖跟他协商。最终江上舟说服了王晖回国发展,连同盛美半导体一起挖到了中国上海。

图片来源:由GPTNB生成

以上海市为中心,集设计、制造、供应链体系为一体的半导体产业链开始进入快车道发展。
现阶段已经在部分产业链和制造设备上面追上了国际水平,但是在部分高精度设备上面,依然跟国际水平有多年的差距。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Nature子刊,上智院、复旦、中国气象局研发次季节AI大模型「伏羲」,突破「可预报性沙漠」

编辑 | ScienceAI
作者 | 伏羲团队

国务院印发的《气象高质量发展纲要(2022—2035 年)》明确提出要「提前一个月预报重大天气过程」,而这离不开 15 天以上的次季节气候预测技术。

次季节气候预测关注的是未来 15~60 天的气候异常,可以为农业、水利、能源等领域的生产安排提供重要支撑。


相比时效在两周以内的中短期天气预报,次季节气候预测的不确定性更大。它不仅需要考虑初值问题,还要考虑边界强迫的影响,预测来源更为复杂,预测技巧也较少。因此,次季节气候预测一直被称为「可预报性沙漠」,

由于其复杂性,甚至连 AI 大模型在时间尺度上的表现亦长期未能超越传统模型。

为了解决这个问题,上海科学智能研究院(简称上智院)、复旦大学、中国气象局国家气候中心联合研发了「伏羲」次季节气候预测大模型(FuXi-S2S) ,首次超越传统数值预报模式的标杆 —— 欧洲中期天气预报中心(ECMWF)的 S2S 模式。

近日,该成果以「A Machine Learning Model that Outperforms Conventional Global Subseasonal Forecast Models」为题的论文,被国际权威综合性期刊《Nature Communications》杂志收录发表。

作为一种机器学习模型,「伏羲」次季节气候预测大模型包含较为全面的变量:13 个气压层的 5 个高空大气变量和 11 个地面变量。其独特之处在于能够快速有效地生成大型集合预测,在大约 7 秒内完成长达 42 天的全球日平均预报。

这些预测信息对于农业规划、资源管理、灾害准备,以及抵御热浪干旱、寒潮洪水等极端天气事件至关重要。

「伏羲」次季节气候预测大模型在技术上实现了两个关键性创新:

一是引入了海气相互作用过程,特别是将热带大气季节内振荡(MJO)这个次季节最重要的可预报性来源纳入模型;

二是在隐空间中创新性设计了智能扰动生成模块,从而可以在当前气候系统状态下刻画未来一个预报时次气候系统演变的概率特征,进而有效抓住气候系统的物理不确定性。

这些技术突破使得该模型对降水的全球预测能力显著提升,尤其在我国长江中下游地区等热带外地区更为显著。

MJO 是一种周期性的大气环流模式,其影响范围从热带到中高纬度地区。预测 MJO 可以帮助气象学家和气候学家更准确地理解和预测未来数周到数月内的降水模式、风暴活动、温度变化,以及干旱和洪涝等极端天气事件的发生。

「伏羲」次季节气候预测大模型有效提升了对 MJO 的预测技巧,将 MJO 的预测技巧达到了 36 天,大幅超过了 ECMWF 的 S2S 模式的 30 天时长。

此外,「伏羲」次季节气候预测大模型还可以通过构建显著图 (Saliency map) 识别导致极端事件发生的潜在信息,这一能力在预测 2022 年巴基斯坦洪水期间的极端降雨方面得到了验证。

具体过程为,首先定义一个损失函数,例如下图绿色方框标出的巴基斯坦平均降水异常百分率,保持模型参数固定,然后通过反向传播求解梯度最终输出输入图像像素的梯度,来反映输入气象要素对于巴基斯坦降水异常百分率的正相关和负相关作用。

凭借「伏羲」次季节气候预测大模型强大的预测能力和前兆信号识别能力,可以为应对极端天气事件提供有效的工具和策略。

展望

以往,全球仅有少数国家能够研发并实时运行传统数值预报模式,其研发和运行需要大量人力和计算资源,且依赖超级计算机上成千上万的 CPU。

如今,伏羲气象大模型等基于人工智能的模型在训练完成后运行速度更快,…

论文链接:
https://www.nature.com/articles/s41467-024-50714-1



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

为什么学线代时不知道:矩阵与图竟然存在等价关系

在学习数学时,我们常因所学知识的难度和抽象而受挫;但有些时候,只需换个角度,我们就能为问题的解答找到一个简单又直观的解法。举个例子,小时候在学习和的平方 (a+b)² 公式时,我们可能并不理解为什么它等于 a²+2ab+b²,只知道书上这么写,老师让这么记;直到某天我们看见了这张动图:

登时恍然大悟,原来我们可以从几何角度来理解它!

现在,这种恍然大悟之感又出现了:非负矩阵可以等价地转换成对应的有向图!

如下图所示,左侧的 3×3 矩阵其实可以等价地表示成右侧的包含三个节点的有向图,并且这种表示方式对矩阵和图论都大有帮助。


这个例子来自致力于让每个人都能看懂数学(make math accessible for everyone)的数学家 Tivadar Danka。这位自称「混乱善良(Chaotic good)」的数学家通过一系列推文和博客文章生动地介绍了矩阵和图的这种等价性及其用途。截至目前,这些推文已被阅读了超过 200 万次,收获了超过 3200 次转发和 9100 次收藏。

矩阵与有向图的对价性

如上图的例子所示,如果我们将其中每一行都视为一个节点,则每一个元素都可表示成一条有向且加权的边。当然,0 元素可以忽略不计。如果该元素位于第 i 行第 j 列,则对应于从节点 i 到节点 j 边。

乍一看,这似乎很复杂,但我们可以先看其中一个节点。

如图所示,对于这个 3×3 的矩阵,第 1 行对应于最顶部的节点(我们这里称之为 1 号节点),其包含 3 个元素但其中一个为 0,因此该节点延伸出了两条边。其中黄色边表示的是 (1,1) 处的元素 0.5,因此它是指向自身且权重为 0.5 的有向边。同理,蓝色边是指向 2 号节点且权重为 1 的边。

这样一来,我们便能分析出,矩阵的第 i 列便对应于指向 i 号节点的所有边。

这种等价表示有什么用?

非负矩阵与有向图之间的这种等价性既能帮助我们更好地理解矩阵及其运算,也能帮助简化一些计算过程;反过来,这也能帮助我们从新的视角理解图。

举个例子,矩阵的幂就对应于图中的游走。

如上图所示,对于 n×n 的方形矩阵 A 的 k 次幂,其中每个元素的求和过程都会纳入所有可能的 k 步游走。

举个例子,假设我们要计算上述 3×3 矩阵的平方。

如果使用矩阵乘法,则我们需要这样计算:

对于运算结果的第一个元素,我们可以得到结果 = 0.5×0.5+1×0.2+0×1.8 = 0.45。最终,我们可以得到完整的结果为:

但如果借助上述的图游走方法,则可以通过游走路径来得到结果。同样,对于结果矩阵的第一个元素,就需要对符合 a_{1,l}→a_{l,1} 的所有 2 步游走路径求和。

但是,如果这个有向图表示的是马尔科夫链的状态,其转移概率矩阵的平方本质上就表示该链 2 步之后达到某个状态的概率。

不仅如此,用图表示矩阵还能让我们深入了解非负矩阵的结构。为此,Danka 表示我们需要先了解「强连通分量(strongly connected components)」这一概念。

强连通分量

什么是强连通分量?对于一个有向图,如果能从该图中的每个节点到达其它每个节点时,我们就说该图是强连通的。如下图所示。

而强连通分量就是指有向图中能够实现强连通的部分 / 子图。如下图所示,左右各有一个强连通分量,而中间的白色边不属于任何强连通分量。

下图则展示了另一个例子,其中黄色部分是强连通分量:

对应于强连通图的矩阵是不可约矩阵,而非负矩阵中的所有其它矩阵都是可约矩阵。

Danka 通过一个例子给出了解释。(为了说明简单,例子中的权重均为单元权重,但实践中这些权重值可以是任意非负值。)

下面将这个包含强连通分量但本身并不强连通的图转写成对应的矩阵形式:

而这个矩阵是可约矩阵。

可以看到,在主对角线上的两个子矩阵分别表示两个强连通分量,而右上方的子矩阵表示从第 1 个强连通分量指向第 2 个强连通分量的边,左下方的则表示从第 2 个强连通分量指向第 1 个强连通分量的边(因为没有这样的边,所以全为 0)。

这种书写分块矩阵的形式被称为弗罗贝尼乌斯标准形(Frobenius normal form)。

那么,我们很自然就会问:我们能将任意非负矩阵都转换成弗罗贝尼乌斯标准形矩阵吗?

通过使用有向图来表示非负矩阵,我们可以轻松地看出答案是肯定的,因为任何表示非负矩阵的有向图都可以表示成互相连接的强连通分量。这个过程非常简单:

  1. 为非负矩阵构建对应的有向图;
  2. 找到其中的强连通分量;
  3. 换更好的方式标注各个节点。

如此便大功告成了!

用图来得到弗罗贝尼乌斯标准形

那么,这个更好的方式是什么呢?

以上述的例子为基础,我们来看看这个过程。

首先,将各个强连通分量融合成单个对象,如下图所示。这时候我们可以将每个强连通分量视为一个黑箱 —— 我们不关心其内部结构,只看其外部连接。

然后,在这个新图中,我们需要找到只有出边而没有入边的分量。这个具体示例中只有一个,我们将其标记为 0 号:

接下来一步较为麻烦:对每个分量进行编号,使得每个分量的编号都是离 0 号最远的距离。如下示例能更清晰地说明这一点:

可以看到,0 号到中间的分量有两条路径,那么选择离 0 最远的那条路径对其进行编号。最终得到:

实际上,这定义的是分量的顺序。接下来标记各个分量的内部节点:

如果该图本身来自一个矩阵,则这样的重新标注过程就能得到一个弗罗贝尼乌斯标准形矩阵!

实际上,这个重新标注的过程就是使用一个置换矩阵 P 对原矩阵执行变换,而该置换矩阵由多个转置矩阵的积构成。

以下为该定理的完整形式:

当然,用图表示矩阵的用途远不止于此,比如我们还可以使用矩阵的特征值来定义图的特征值。事实上,这一思路催生了谱图理论(spectral graph theory)这一研究领域。

结语

很显然,矩阵和图之间的这种等价关系既有助于图论研究,也能为线性代数的计算和分析提供一个新视角。其也有一些重要的实际用途,比如 DNA 数据就常被表示成矩阵或图的形式。

另外,我们都知道矩阵运算对于当前的大模型 AI 的重要性,而以知识图谱为代表的图也正通过检索增强式搜索等技术成为当前 AI 的重要助力。将这两者关联起来,或许能在 AI 可解释性以及图人工智能方面带来一些新的突破。至少,这能帮助我们更好地学习线性代数。

实际上,上述内容正是提炼自 Tivadar Danka 正在编写的《Mathematics of Machine Learning》一书。这本书将由浅入深地介绍与机器学习相关的数学知识,让读者真正知其然也知其所以然,并且 Danka 自信地宣称这会是「学习机器学习的最佳资源」。目前他已经在网上发布了两章预览,感兴趣的读者可访问:https://tivadardanka.com/mathematics-of-machine-learning-preview/



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

为什么学线代时不知道:矩阵与图竟然存在等价关系

在学习数学时,我们常因所学知识的难度和抽象而受挫;但有些时候,只需换个角度,我们就能为问题的解答找到一个简单又直观的解法。举个例子,小时候在学习和的平方 (a+b)² 公式时,我们可能并不理解为什么它等于 a²+2ab+b²,只知道书上这么写,老师让这么记;直到某天我们看见了这张动图:

图片

登时恍然大悟,原来我们可以从几何角度来理解它!

现在,这种恍然大悟之感又出现了:非负矩阵可以等价地转换成对应的有向图!

如下图所示,左侧的 3×3 矩阵其实可以等价地表示成右侧的包含三个节点的有向图,并且这种表示方式对矩阵和图论都大有帮助。


图片

这个例子来自致力于让每个人都能看懂数学(make math accessible for everyone)的数学家 Tivadar Danka。这位自称「混乱善良(Chaotic good)」的数学家通过一系列推文和博客文章生动地介绍了矩阵和图的这种等价性及其用途。截至目前,这些推文已被阅读了超过 200 万次,收获了超过 3200 次转发和 9100 次收藏。

图片

矩阵与有向图的对价性

如上图的例子所示,如果我们将其中每一行都视为一个节点,则每一个元素都可表示成一条有向且加权的边。当然,0 元素可以忽略不计。如果该元素位于第 i 行第 j 列,则对应于从节点 i 到节点 j 边。

乍一看,这似乎很复杂,但我们可以先看其中一个节点。

图片

如图所示,对于这个 3×3 的矩阵,第 1 行对应于最顶部的节点(我们这里称之为 1 号节点),其包含 3 个元素但其中一个为 0,因此该节点延伸出了两条边。其中黄色边表示的是 (1,1) 处的元素 0.5,因此它是指向自身且权重为 0.5 的有向边。同理,蓝色边是指向 2 号节点且权重为 1 的边。

这样一来,我们便能分析出,矩阵的第 i 列便对应于指向 i 号节点的所有边。

图片

这种等价表示有什么用?

非负矩阵与有向图之间的这种等价性既能帮助我们更好地理解矩阵及其运算,也能帮助简化一些计算过程;反过来,这也能帮助我们从新的视角理解图。

举个例子,矩阵的幂就对应于图中的游走。

图片

如上图所示,对于 n×n 的方形矩阵 A 的 k 次幂,其中每个元素的求和过程都会纳入所有可能的 k 步游走。

举个例子,假设我们要计算上述 3×3 矩阵的平方。

图片

如果使用矩阵乘法,则我们需要这样计算:

图片

对于运算结果的第一个元素,我们可以得到结果 = 0.5×0.5+1×0.2+0×1.8 = 0.45。最终,我们可以得到完整的结果为:

图片

但如果借助上述的图游走方法,则可以通过游走路径来得到结果。同样,对于结果矩阵的第一个元素,就需要对符合 a_{1,l}→a_{l,1} 的所有 2 步游走路径求和。

但是,如果这个有向图表示的是马尔科夫链的状态,其转移概率矩阵的平方本质上就表示该链 2 步之后达到某个状态的概率。

不仅如此,用图表示矩阵还能让我们深入了解非负矩阵的结构。为此,Danka 表示我们需要先了解「强连通分量(strongly connected components)」这一概念。

强连通分量

什么是强连通分量?对于一个有向图,如果能从该图中的每个节点到达其它每个节点时,我们就说该图是强连通的。如下图所示。

而强连通分量就是指有向图中能够实现强连通的部分 / 子图。如下图所示,左右各有一个强连通分量,而中间的白色边不属于任何强连通分量。

下图则展示了另一个例子,其中黄色部分是强连通分量:

对应于强连通图的矩阵是不可约矩阵,而非负矩阵中的所有其它矩阵都是可约矩阵。

图片

Danka 通过一个例子给出了解释。(为了说明简单,例子中的权重均为单元权重,但实践中这些权重值可以是任意非负值。)

下面将这个包含强连通分量但本身并不强连通的图转写成对应的矩阵形式:

图片

而这个矩阵是可约矩阵。

图片

可以看到,在主对角线上的两个子矩阵分别表示两个强连通分量,而右上方的子矩阵表示从第 1 个强连通分量指向第 2 个强连通分量的边,左下方的则表示从第 2 个强连通分量指向第 1 个强连通分量的边(因为没有这样的边,所以全为 0)。

这种书写分块矩阵的形式被称为弗罗贝尼乌斯标准形(Frobenius normal form)。

图片

那么,我们很自然就会问:我们能将任意非负矩阵都转换成弗罗贝尼乌斯标准形矩阵吗?

通过使用有向图来表示非负矩阵,我们可以轻松地看出答案是肯定的,因为任何表示非负矩阵的有向图都可以表示成互相连接的强连通分量。这个过程非常简单:

  1. 为非负矩阵构建对应的有向图;
  2. 找到其中的强连通分量;
  3. 换更好的方式标注各个节点。

如此便大功告成了!

用图来得到弗罗贝尼乌斯标准形

那么,这个更好的方式是什么呢?

以上述的例子为基础,我们来看看这个过程。

首先,将各个强连通分量融合成单个对象,如下图所示。这时候我们可以将每个强连通分量视为一个黑箱 —— 我们不关心其内部结构,只看其外部连接。

图片

然后,在这个新图中,我们需要找到只有出边而没有入边的分量。这个具体示例中只有一个,我们将其标记为 0 号:

图片

接下来一步较为麻烦:对每个分量进行编号,使得每个分量的编号都是离 0 号最远的距离。如下示例能更清晰地说明这一点:

图片

可以看到,0 号到中间的分量有两条路径,那么选择离 0 最远的那条路径对其进行编号。最终得到:

图片

实际上,这定义的是分量的顺序。接下来标记各个分量的内部节点:

图片

如果该图本身来自一个矩阵,则这样的重新标注过程就能得到一个弗罗贝尼乌斯标准形矩阵!

图片

实际上,这个重新标注的过程就是使用一个置换矩阵 P 对原矩阵执行变换,而该置换矩阵由多个转置矩阵的积构成。

以下为该定理的完整形式:

图片

当然,用图表示矩阵的用途远不止于此,比如我们还可以使用矩阵的特征值来定义图的特征值。事实上,这一思路催生了谱图理论(spectral graph theory)这一研究领域。

结语

很显然,矩阵和图之间的这种等价关系既有助于图论研究,也能为线性代数的计算和分析提供一个新视角。其也有一些重要的实际用途,比如 DNA 数据就常被表示成矩阵或图的形式。

另外,我们都知道矩阵运算对于当前的大模型 AI 的重要性,而以知识图谱为代表的图也正通过检索增强式搜索等技术成为当前 AI 的重要助力。将这两者关联起来,或许能在 AI 可解释性以及图人工智能方面带来一些新的突破。至少,这能帮助我们更好地学习线性代数。

实际上,上述内容正是提炼自 Tivadar Danka 正在编写的《Mathematics of Machine Learning》一书。这本书将由浅入深地介绍与机器学习相关的数学知识,让读者真正知其然也知其所以然,并且 Danka 自信地宣称这会是「学习机器学习的最佳资源」。目前他已经在网上发布了两章预览,感兴趣的读者可访问:https://tivadardanka.com/mathematics-of-machine-learning-preview/



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Nature子刊,上智院、复旦、中国气象局研发次季节AI大模型「伏羲」,突破「可预报性沙漠」

编辑 | ScienceAI
作者 | 伏羲团队

国务院印发的《气象高质量发展纲要(2022—2035 年)》明确提出要「提前一个月预报重大天气过程」,而这离不开 15 天以上的次季节气候预测技术。
次季节气候预测关注的是未来 15~60 天的气候异常,可以为农业、水利、能源等领域的生产安排提供重要支撑。


相比时效在两周以内的中短期天气预报,次季节气候预测的不确定性更大。它不仅需要考虑初值问题,还要考虑边界强迫的影响,预测来源更为复杂,预测技巧也较少。因此,次季节气候预测一直被称为「可预报性沙漠」,
由于其复杂性,甚至连 AI 大模型在时间尺度上的表现亦长期未能超越传统模型。
为了解决这个问题,上海科学智能研究院(简称上智院)、复旦大学、中国气象局国家气候中心联合研发了「伏羲」次季节气候预测大模型(FuXi-S2S) ,首次超越传统数值预报模式的标杆 —— 欧洲中期天气预报中心(ECMWF)的 S2S 模式。
近日,该成果以「A Machine Learning Model that Outperforms Conventional Global Subseasonal Forecast Models」为题的论文,被国际权威综合性期刊《Nature Communications》杂志收录发表。

作为一种机器学习模型,「伏羲」次季节气候预测大模型包含较为全面的变量:13 个气压层的 5 个高空大气变量和 11 个地面变量。其独特之处在于能够快速有效地生成大型集合预测,在大约 7 秒内完成长达 42 天的全球日平均预报。
这些预测信息对于农业规划、资源管理、灾害准备,以及抵御热浪干旱、寒潮洪水等极端天气事件至关重要。
「伏羲」次季节气候预测大模型在技术上实现了两个关键性创新:
一是引入了海气相互作用过程,特别是将热带大气季节内振荡(MJO)这个次季节最重要的可预报性来源纳入模型;
二是在隐空间中创新性设计了智能扰动生成模块,从而可以在当前气候系统状态下刻画未来一个预报时次气候系统演变的概率特征,进而有效抓住气候系统的物理不确定性。
这些技术突破使得该模型对降水的全球预测能力显著提升,尤其在我国长江中下游地区等热带外地区更为显著。

图示:流程架构概述。(来源:论文)

MJO 是一种周期性的大气环流模式,其影响范围从热带到中高纬度地区。预测 MJO 可以帮助气象学家和气候学家更准确地理解和预测未来数周到数月内的降水模式、风暴活动、温度变化,以及干旱和洪涝等极端天气事件的发生。
「伏羲」次季节气候预测大模型有效提升了对 MJO 的预测技巧,将 MJO 的预测技巧达到了 36 天,大幅超过了 ECMWF 的 S2S 模式的 30 天时长。

图示:使用 2017 年至 2021 年的所有测试数据,对 ECMWF 亚季节到季节 (S2S) 重新预报 (蓝色) 和 FuXi-S2S 预报 (红色) 之间的集合均值的实时多元马登-朱利安振荡 (MJO) (RMM) 双变量相关 (COR) 进行比较。(来源:论文)

此外,「伏羲」次季节气候预测大模型还可以通过构建显著图 (Saliency map) 识别导致极端事件发生的潜在信息,这一能力在预测 2022 年巴基斯坦洪水期间的极端降雨方面得到了验证。
具体过程为,首先定义一个损失函数,例如下图绿色方框标出的巴基斯坦平均降水异常百分率,保持模型参数固定,然后通过反向传播求解梯度最终输出输入图像像素的梯度,来反映输入气象要素对于巴基斯坦降水异常百分率的正相关和负相关作用。
凭借「伏羲」次季节气候预测大模型强大的预测能力和前兆信号识别能力,可以为应对极端天气事件提供有效的工具和策略。

图示:对 ECMWF 亚季节到季节 (S2S) 模型和 FuXi-S2S 模型对 2022 年巴基斯坦洪水预测的比较分析,以及有助于 FuXi-S2S 模型准确预测的前兆信号。(来源:论文)

展望
以往,全球仅有少数国家能够研发并实时运行传统数值预报模式,其研发和运行需要大量人力和计算资源,且依赖超级计算机上成千上万的 CPU。
如今,伏羲气象大模型等基于人工智能的模型在训练完成后运行速度更快,计算资源需求更少,为发展中国家提供了更可承受的选项。
人工智能在气候变化风险管理领域也拥有广阔的发展空间。它能够改变气候科学的研究范式,突破传统模式的局限性,实现更精细的空间分辨率和更长时间尺度的精准气候风险预报。此技术将广泛应用于极端气候预测、交通运输、保险、新能源、期货交易、城市规划等多个产业领域。
目前,「伏羲」次季节气候预测大模型仍有提升空间,例如其空间分辨率为 1.5 度,与 ECMWF 次季节模式的 36 公里的空间分辨率相比仍相对粗糙,目前预报的是日均气温、缺少日最高温度和日最低温度等。
此外,「伏羲」次季节大模型还在探索把最高气压层从当前的 50hPa(百帕)提升到 1hPa 甚至是临近空间,赋能更多应用场景。

作者简介
上智院研究员陈磊,复旦大学人工智能创新与产业研究院博士后仲晓辉,以及中国气象局气候研究开放实验室吴捷副主任为论文共同第一作者。上智院院长、复旦大学浩清特聘教授漆远,上智院科研副院长、复旦大学人工智能创新与产业研究院研究员李昊,以及中国气象局气候研究开放实验室研究员陆波为论文的共同通讯作者。
全体作者:Lei Chen, Xiaohui Zhong, Hao Li#, Jie Wu, Bo Lu#, Deliang Chen, Shang-Ping Xie, Libo Wu, Qingchen Chao, Chensen Lin, Zixin Hu & Yuan Qi#(标#的为通讯作者)

论文链接:
https://www.nature.com/articles/s41467-024-50714-1


1


感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

人工智能生成的移民讽刺歌曲冲进德国前50名

一个关于移民的歌曲,其中的音乐、歌声和艺术作品完全是使用人工智能生成的,在德国最受欢迎的50首歌曲中名列前茅,这可能是领先的音乐市场首次出现。


《爱上了塔拉胡恩》是一首将现代歌词(其中许多基于关于移民的种族刻板印象)与60年代的德国流行音乐相结合的讽刺歌曲。这首歌在德国排名第48位,全球第四大音乐市场。在发布不到一个月的时间里,这首歌在Spotify上有350万次播放,并在该流媒体平台的全球热门榜上排名第3。创作者Josua Waghubinger,艺名Butterbro,表示,他通过将自己的歌词输入到Udio中,这是一种能够根据简单的文本提示生成歌声和乐器的生成式人工智能工具,制作了这首歌的合唱部分。在合唱在TikTok上得到良好反响后,他使用了音乐工具来添加一节。这位IT专业人员和业余音乐家在接受德国音乐制作播客《音乐厨房》采访时表示:“我认为这首歌仍然有足够的创作自由,使其成为一个创意项目。” 这首歌不仅因使用的制作技术而引起德国媒体的关注,还因其歌词内容而引起关注。翻译为《爱上了塔拉胡恩》,这首歌引用了阿拉伯表达“taeal huna”的德国化版本,这个词原本是指“过来”,但现在在德国常用来描述那些有移民背景的年轻男性团体,通常带有贬义。歌词讽刺了上世纪60年代歌曲中经典的“好女孩爱上了坏男孩”的故事情节,例如香格里拉乐队(Shangri-Las)的《Pack Leader》。AI生成的歌手追求对象穿着“路易斯皮带、古奇包和Air Max运动鞋”,“香水店的味道”。当她的情人生气时,她思考,“他就像一个甜蜜的巴卡拉瓦”-这可能是一种试图将他与土耳其文化联系起来的尝试。Waghubinger表示,他想制作一首取笑过于男性化行为的歌曲,“带着眼睛眨眼,没有歧视”,但他补充说,他的最终动机是制作一首在社交媒体上会走红的歌曲。“这是我给自己设定的挑战,”他告诉《音乐厨房》。但保守派大报《世界报》的文化编辑玛丽-路易斯·戈德曼表示,这首歌在讽刺和歧视之间走了一条细线。“将移民青年文化与德国流行音乐保守主义混合,会让一样多听众兴奋也会冒犯更多人,”她说。“歌曲中的塔拉胡恩[指的是歌曲中的人物]并没有隐藏他过时的性别形象,但对于Butterbro是否在贬低、赞美或攻击它存在争议。”音乐杂志《Diffus》的作家菲利西娅·阿哈耶称,这首歌的流行“存在双重问题”,因为“塔拉胡恩”在德国和奥地利的年轻人中被牢固地确立为对移民的侮辱,右翼团体例如使用这个术语塑造鬼怪形象,并煽动对伊斯兰教的仇恨和对异国人的恐惧。她说:“问题在于Butterbro似乎不明白这个术语的负面问题。他的歌曲在一定程度上正在帮助使这个术语成为主流。”在德国社交媒体上流传着许多类似风格的使用人工智能生成的歌曲,混合了上世纪60年代甜蜜的流行音乐和粗鄙的性化歌词。音乐制作人越来越多地使用人工智能来生成模仿知名歌手风格的歌声。2023年,披头士乐队发布了《此时与彼时》,这首歌曲使用了AI的帮助来推理约翰·列侬的歌声。一个带有AI生成版本图帕克·莎库尔(Tupac Shakur)声音的歌曲上传到加拿大说唱歌手Drake的Instagram账户上,但据报道,已故说唱歌手的律师威胁要起诉后,这首歌曲就消失了。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

UTime Limited & Dr. Ehud Baron将开创人工智能驱动的健康解决方案

UTime有限公司 (纳斯达克:WTO)(“UTime”或“公司”)很高兴宣布与XCardio公司达成了一项谅解备忘录(“MOU”)。图片{ width=60% }


该公司是由医疗技术创新领袖Ehud Baron博士所拥有的日本公司。此次合作侧重于共同开发最先进的持续血压监测设备BPWatch,旨在推进心血管疾病管理。该联合项目还旨在通过从向消费者销售BP手表的低利润业务转变为使用按病人每月付款结构的高利润、可持续收入模式来开发新的收入模式。

Ehud Baron博士将他在血压、血液动力学、健康映射和人工智能诊断方面的专业知识带入到这一战略合作中。这一合作凸显了UTime致力于通过尖端医疗可穿戴技术增强健康和福祉的新承诺。在战略合作和先进研究的支持下,UTime努力提供全球疾病预防和健康管理的有效解决方案。

Ehud Baron博士曾是以色列理工学院、加州大学伯克利分校和斯坦福大学的前教授。他还创立并领导过几家在心脏病、睡眠和人工智能领域的公司。

鉴于2019年COVID-19大流行后全球对健康和疾病预防的强调日益提升,UTime已将开发先进的医疗可穿戴产品置于优先发展位置。2024年,UTime与Ehud Baron博士展开了一项战略倡议,利用Baron博士的持续血压测量技术创造新的血压监测手表。与Ehud Baron博士的合作预计将在推动UTime在血压监测解决方案方面的努力中发挥关键作用。未来,UTime致力于扩大其医疗可穿戴产品范围,利用Baron博士的专业知识满足全球对先进健康技术的增长需求。


注意:Title、Date、Body 三个部分的内容,放入到对应的位置。最后只需要输出为Markdown源文件格式内容。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Sway AI推出与Microsoft Azure的无代码AI集成

Sway AI,一家自动化无代码AI领军企业,今日宣布已将其无代码AI环境与Microsoft Azure进行了集成。图片{ width=60% }


这一集成使Azure客户能够直接在Microsoft Azure上构建和部署安全的人工智能和机器学习应用程序。
“Sway AI的创始人兼首席执行官Hassan Ahmed表示:“Microsoft Azure强大的安全性、可扩展性和全面的云服务,使这一理想的集成成为可能,使企业能够快速构建Gen AI和预测性分析用例,同时解决他们对规模、数据安全性和隐私的担忧。我们将AI引入数据所在的地方,而不是相反。”
这一集成利用了Sway AI的创新性无代码环境,该环境简化了AI开发过程,使用户无需具备广泛的数据科学和编程技能即可创建、测试和部署人工智能和机器学习模型。通过将这种用户友好的环境与Azure的云基础设施相结合,企业可以在保持严格的安全和隐私标准的同时,快速扩展其AI项目。这种合作将简化AI工作流程,缩短开发时间,并降低成本,使更广泛范围的用户可以访问AI。
除了提升可访问性和安全性,将Sway AI与Azure集成还为寻求利用AI力量的公司带来了巨大好处。该组合产品与现有的Azure云服务(如Azure的AKS托管的Kubernetes、密钥保管库用于身份和密钥管理、存储和虚拟网络)实现了无缝集成。这使组织能够利用其现有数据和基础设施,同时获得Sway AI无代码环境的优势。因此,企业可以专注于获取可操作见解并实现其战略目标,而无须传统AI开发所带来的复杂性。
Microsoft Azure AI副总裁Ali Dalloul补充道:“我们与Sway AI的合作为我们的客户提供了强大易用的工具,在Azure生态系统内安全地构建和部署AI解决方案。此集成将有助于不同行业的创新和效率提升。”
通过此集成,Azure客户可以使用Sway AI易于使用的无代码环境和独特的安全架构。Sway的无代码环境旨在面向数据分析师和业务团队,以便他们可以承担自己的AI项目的开发和管理,从而推动见解和改善决策制定。借助Azure上的Sway AI,这些客户无需担心数据安全性,因为他们的数据在Azure中用于所有数据准备、模型训练和推理过程中,保持着最高的数据安全性和管理水平,以满足操作、法律和法规遵从性所需的要求。
有关Sway AI及其与Microsoft Azure集成的更多信息,请访问www.swayai.com。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB