AI大航海时代,再看不懂PCB真要落伍了

初识PCB:电子产品之母,你很难不动心

1)有电的地方就有PCB
Printed Circuit Board,缩写为大家熟知的PCB,又被称为印刷电路板,因其制造采取“电子印刷”工艺而得名。
PCB的作用,是充当电子元器件进行电气互连的载体与起到支撑作用的基座,不仅为线路提供电绝缘等电气阻抗特性,还承载着电子设备的数字/模拟信号传输、电源供给、射频信号发射/接收等功能。


其应用下游涵盖消费电子、PC、通信、汽车电子、航空等众多产业,所以PCB也被称为电子产品之母。

PCB行业的市场规模,跟随数字经济发展,历年来都是持续增长的态势,期间穿插着周期波动。根据行业内最权威统计机构Prismark的数据,全球PCB市场规模在2022年达到了817亿美元,预计到2027年,全球的PCB市场规模将有望首次突破1000亿美元。
1000亿美元是一个不容忽略的大市场,特别是中国PCB行业在全球的地位和竞争力远远领先于半导体产业。

中国PCB受益于产业转移而独领全球
中国PCB行业产值的快速增长主要受益于产业转移和劳动力、资源优势。中国大陆已在全球形成全球最大的PCB产业集群,占据全球大部分市场份额,而其他国家如日本、中国台湾等则保留了部分高端PCB产能。

每一次创新都不会缺席
PCB行业在过去几年深度参与了众多产业创新中,如5G建设、汽车电子控制单元增加、AI算力基础设施军备竞赛等。特别是涉及AI服务器领域的PCB技术不断升级,展现出巨大的市场潜力。

再看PCB:回归现实,为什么并没有那么诱人?
尽管PCB行业市场规模巨大且持续增长,但行业分析及投资上存在诸多挑战。PCB行业的特性散点较多,产品种类、下游需求和上市公司等方面呈现分散状态,导致投资难度增加。

提出了两点入手建议:

  1. 重点关注结构性成长,特别是在小型化和高频高速领域的创新;
  2. 拥抱大腿客户,与核心客户合作可获得更多机会。

到底该怎么看PCB:中等生意,建议从这两点入手
PCB行业表面吸引力大,但实际投资存在风险和挑战。建议关注结构性成长和与核心客户合作,抓住局部机会。

本文链接:https://www.aixinzhijie.com/article/6846432

图片链接展示:

  • 图片来源:由GPTNB生成
  • 全球PCB产值统计,资料来源:Prismark
  • PCB分类,资料来源:深南电路招股说明书
  • PCB龙头公司的ROE水平不算高,资料来源:公司财报


感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

持平 GPT-4o,毒舌属性拉满, Gork-2 是吃了一个马斯克吧|AI 鲜测

今天,马斯克突然一次发布了两款模型Grok-2和Grok-2 mini。相较于上一个版本Grok-1.5,Grok-2在对话、编码和推理等方面的能力取得很大进步。


另外其实早在LMSYS大模型竞技中,Grok-2就穿着马甲”sus-column-r”悄悄上线了PK了,并且优于Grok-2的实力已经超过了 Claude 3.5 Sonnet 和 GPT-4-Turbo,与GPT-4o不相上下。

目前,Grok-2和Grok-2 mini两种模型的测试版现在都在 X 平台上发布,X Premium 和 Premium+ 用户已经可以体验两种模型了。马斯克带领的团队确实像坐上了“火箭”一样,x AI的这个开发速度堪称极速版Open AI,另外更有网友表示“马斯克在6个月内完成了其他公司需要5年的工作。”

话不多说,作为尊贵的Premium+ 用户,咱先一手测评一下Grok-2的实力到底如何!

part 01融合爆火的Flux实力碾压DALL·E3

值得一说的是,本次Grok-2融合了前段时间火爆全网的Flux AI,强强联合了属于是,现在更是网友们直接玩坏了,我申请加入战场🤪。

有一说一,别太真实了吧,背景和人物与现实都很接近,Grok-2你敢生成我都有点不敢看了,我甚至都有点怀疑是不是有真的照片投喂给Grok-2了。当同样的提示词给了DALL·E3,结果直接跟我说对不起,拜拜了。那再让马斯克和山姆奥特曼来个世纪大和解👇

马斯克我知道,但是另外一个大哥你谁啊?一定是因为我的提示词不够准确,没输入山姆·奥特曼的全名?

突然生成了,这画面太美,我不敢看🫣。两个人的面部表情都太自然了,我都有点磕你俩了。Grok-2就这个生图水平,简直就是把DALL·E3吊起来暴打呀。

part 02Grok-2是马斯克的嘴替吧!

新闻天天有,今天特别多!今天不光是x AI宣布Grok-2正式发布,还有谷歌的Gemini Live 发布以及OpenAI宣布ChatGPT-4o的最新版本上线。但今天大家讨论的都是突然发布的Grok-2,对此,我们采访不到马斯克,但是可以采访一下Grok-2本人具体是个什么看法呢。

不管是英文版还是中文版,Grok-2回答的每个点的小标题看着都很正常,但每点具体回答句句都真实到了我!终于看的一个不那么官方的回答了我废话的AI了!Grok-2这简直是把马斯克的心里话给说出来了呀!Grok-2这直言不讳的毒舌功力堪比最近爆火的Twitter Personality。这流量密码算是被你拿捏住了Grok-2。另外Grok-2的回答会搜索X的用户发布的内容。PS:想要体验直言不讳版本的朋友们,记得选择趣味模式!

part 03Grok-2智斗“弱智吧”

再借用一下网友的快乐源泉“弱智吧”中的经典问题,看一下Grok-2如何机智应答👇。

三个问题Grok-2都没有被带坑里,并且回答的逻辑清晰,另外Grok-2在每个回答结尾还都主动的给一些建议和看法,还挺有意思的。最后再测一下经典的9.11和9.9比大小的问题,当我用英文版prompt提问时,输出的结果竟然是正确的,还非常抽象的把9.11 比作一头鼻子稍大的大象,9.9 比作一头吃了太多香蕉的大象。最后得出结论:9.9 是更大的数字。几乎触及 10,而 9.11 仍然徘徊在 9 出头。而当我再用中文提问时Grok-2突然开始胡说八道,还举了三个没用的例子来证实它的谬论😂,看来Grok-2对于中文的理解能力还是欠缺一点。

总的来说,Grok-2虽然推出的还是测试版本,但综合的实力确实很强,而且开发速度很快,这点跟期货OpenAI相比确实强了不知道多少倍。接下来,就要看各大AI模型该如何应对马斯克的挑战了,但也没关系,毕竟Grok开源嘛~



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

腾讯把12亿用户,都变成了免费的"标注民工"

你有没有想过,当你在网上进行简单的验证码操作时,其实你已经无意间成为了一名“标注民工”?
昨天晚上,我在登录QQ邮箱和LOL官网的时候。
发现腾讯的验证码变了。


不再是之前的验证码了,而是变成了一段Prompt加六张AI生成的图。

右下角赫然写着:
图片由混元AI生成。

腾讯,终于把用验证码做标注的手,伸向了他那12亿的用户。
拿验证码当标注系统,让用户免费标注,其实在远古时代,就已经不是什么新鲜事了,但是用生成式AI来跟验证码做结合,这确实还是我,所看的头一回。

先说说验证码这个东西。

这玩意从最开始发明起,其实只有一个目的,
就是为了区分机器和人
简称“CAPTCHA”,全称就贼长了,“Completely Automated Public Turing Test to Tell Computers and Humans Apart”
翻译过来是,“全自动区分计算机和人类的图灵测试”。
你看看,图灵测试。
刚开始,有个斯坦福公益验证码系统,reCAPTCHA。
它最成名的项目,就是用验证码来数字化海量的书籍和旧报纸。那时候的Ocr真的不咋地,而且很多年前的书和报纸那糊的真的差强人意。
当时,reCAPTCHA系统会向用户在验证码上,展示两组扭曲的单词,其中前面的一组是计算机已经识别的,另一个是计算机难以识别的。

如果用户正确输入前半部分,那么 reCAPTCHA就会假设用户输入的后半部分也是正确的,然后把录入结果返回至reCAPTCHA的项目主机。
结果返回主机后,主机还会把这个结果再派发给多个用户进行交叉验证,以确保没有不小心或故意输错单词的情况。


1
2
![图片来源:由GPTNB生成](http://www.jesonc.com/upload/3B33CB85B496C0CB6FBA4C2BD79320AD/1723704516349/FpRSa4x08wXu0FxqaGj5i69eI4W4.png)


如果继续需要下方内容,请告诉我。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

AI大航海时代,再看不懂PCB真要落伍了

初识PCB:电子产品之母,你很难不动心
1)有电的地方就有PCB
Printed Circuit Board,缩写为大家熟知的PCB,又被称为印刷电路板,因其制造采取“电子印刷”工艺而得名。
PCB的作用,是充当电子元器件进行电气互连的载体与起到支撑作用的基座,不仅为线路提供电绝缘等电气阻抗特性,还承载着电子设备的数字/模拟信号传输、电源供给、射频信号发射/接收等功能。


其实,理解PCB也没有这么复杂,在家中,不同的电器需要通过复杂的电路最终连接起来,电子设备也是类似的,里面的元器件需要通过电路连接才能运转。只不过当今的电子设备越来越追求小型化,所以如芯片、电容、电感、电阻、继电器等元器件,就需要通过PCB板子上的微缩化线路连接起来,而不是直接使用笨重的电线。
这就形成了,有电的地方就有PCB,其应用下游涵盖消费电子、PC、通信、汽车电子、航空等众多产业,所以PCB也被大家亲切的称为电子产品之母。
PCB行业的市场规模,跟随数字经济发展,历年来都是持续增长的态势,期间穿插着周期波动。根据行业内最权威统计机构Prismark的数据,全球PCB市场规模在2022年达到了817亿美元,过去的复合增速在3.8%左右。按照这个速度,预计到2027年,全球的PCB市场规模将有望首次突破1000亿美元。
1000亿美元是一个什么概念,同为元器件的半导体,全球市场规模5000-6000亿美元,PCB的市场将达到半导体的1/5,这显然是不容忽略的一个大市场。另外,中国的PCB行业在全球的地位,是远领先于半导体的,是一个相当具有竞争力的环节。

图:全球PCB产值统计,资料来源:Prismark

中国PCB受益于产业转移而独冠全球
过去十多年,中国PCB行业产值的复合增速达到8%,基本倍速于全球行业增速的3.8%。PCB是一个资本、劳动和技术的密集度都相对均衡的行业,因此过去产业跟随着电子产业的变迁以及对低成本的追求,从由美欧日转向韩国、中国台湾,最后又转向中国大陆。
可以说PCB和中国是天作之和。首先,中国是全球PCB消费的主要地区,在生产端又具备劳动力、资源、政策、产业聚集等全方位的优势;最终过去30年,在台商、港商的帮助下,中国大陆最终在珠三角和长三角,形成全球最大的PCB产业集群。
产能角度,2006年中国便超越日本成为全球第一大PCB生产国,时至今日,中国大陆产能在全球的 占比达已经达到惊人的54%。日本、中国台湾,只保留了部分高端PCB产能。而现如今的中国PCB企业,开启了在泰国、越南等东南亚地区建厂的热潮,颇有行业领导者的风采。
技术方面,国内PCB企业的实力也不容小觑。如苹果手机用的软板FPC,鹏鼎控股和东山精密,已经替代日系企业,占据了主要的份额。在配合特斯拉的智能汽车战略中,国内的世运电路、东山精密等企业走到了最前面;而最新的AI服务器中的HDI板,国内的沪电股份、胜宏科技等也大有超越台企的趋势。
根据Prismark的预计,即使到2028年,中国还是牢牢占据PCB的头把交椅,即使份额提升最快的东南亚,也得益于中国企业过去投建新的产能而非其本土…

该文章结果被截断,无法继续输出。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

腾讯把12亿用户,都变成了免费的"标注民工"

文章来源:数字生命卡兹克

你有没有想过,当你在网上进行简单的验证码操作时,其实你已经无意间成为了一名“标注民工”?

昨天晚上,我在登录QQ邮箱和LOL官网的时候。
发现腾讯的验证码变了。


不再是之前的验证码了,而是变成了一段Prompt加六张AI生成的图。

图片来源:由GPTNB生成

右下角赫然写着:
图片由混元AI生成。

腾讯,终于把用验证码做标注的手,伸向了他那12亿的用户。
拿验证码当标注系统,让用户免费标注,其实在远古时代,就已经不是什么新鲜事了,但是用生成式AI来跟验证码做结合,这确实还是我,所看的头一回。

先说说验证码这个东西。

这玩意从最开始发明起,其实只有一个目的,
就是为了区分机器和人
简称“CAPTCHA”,全称就贼长了,“Completely Automated Public Turing Test to Tell Computers and Humans Apart”
翻译过来是,“全自动区分计算机和人类的图灵测试”。
你看看,图灵测试。
刚开始,有个斯坦福公益验证码系统,reCAPTCHA。
它最成名的项目,就是用验证码来数字化海量的书籍和旧报纸。那时候的Ocr真的不咋地,而且很多年前的书和报纸那糊的真的差强人意。
当时,reCAPTCHA系统会向用户在验证码上,展示两组扭曲的单词,其中前面的一组是计算机已经识别的,另一个是计算机难以识别的。

image

如果用户正确输入前半部分,那么 reCAPTCHA就会假设用户输入的后半部分也是正确的,然后把录入结果返回至reCAPTCHA的项目主机。
结果返回主机后,主机还会把这个结果再派发给多个用户进行交叉验证,以确保没有不小心或故意输错单词的情况。
他们用这个系统,在十几年里,数字化了几千万的书籍和报纸。

本来一切都挺美好的,然后,Google下场了,他们把reCAPTCHA给收了。
没过多久,就让用户开始识别,google街景中,那些难以识别的门牌号了。。。

image

这其实,就是明晃晃的让你当标注民工,无偿来给google标注训模型了。
google那时候几亿用户,每天验证码会被调用上千万次。
这大概就好像,让几百万个人每人为给你干5秒钟活儿,然后一分钱都不给一样,你说这是不是已经,把白嫖玩到极致了。
直到后面,离谱的东西越来越多,你要标注的东西,也越来越多。

比如这些奇奇怪怪非人视角让你选一个bus的照片。

image

当然最离谱最好玩的,得数15年的12306,当时开脚本抢票的太多,12306的流量压力实在太大,被逼的开启了神迹级的验证码,据说人类首次正确率仅为8%,得错3次以上的人占比有65%。
这种逆天验证码的题目是这样的。

image

刘慈欣我不敢打包票,但是范伟我是全认出来了。。
时间走走停停,一眨眼,来到了2024年。
为了自己家的混元大模型,腾讯也把手,伸向了验证码。

image

让我们开始,来做AI绘图大模型的标注了。
这部分的标注,其实不是啥图片美学质量的标注,而是对于图片理解和映射的标注。
通俗地讲,就是语义理解。

现在做的,还是最基础最简单的分类,我们标起来,还是挺轻松的。毕竟里面都知道,左上角是鸭子,中间是老虎,左下角是蜜蜂,右下角是赛车。
而那两张白杨树林,其实,你选任意一个,或者选两个,都能过。

比如我这个图:一簇在悬挂花盆在生长的多肉。

image

其实你会看到有两张都跟多肉有关,而根据定语,一簇,更符合左上角第一张图,右上角那个其实不是一簇是一堆,但是我选了他,依然能过。
而你想把两个都选,你也都能过。

所以这个标注之心啊,一点都不藏着掖着。

但是确实这个做法很有用,比如还是这句Prompt,真正核心难点是一簇。
用这种方式,对整体的语义理解,确实有非常大的帮助。

而且现在明显还是初期,给的prompt和图,都非常的简单,标注的难度也不高,甚至一些大厂的标注模型直接机标可能都应付的过来。
但是如果下一次,是“一只在清朝宫殿里生长的杜鹃花”呢?
一只、清朝宫殿、杜鹃花。难度直接拉满。

甚至另外几个选项给你的也不是差异这么大的动物汽车啥的,给你的都是菊花、杜鹃花、喇叭花、玫瑰花,来吧你就选吧,加油啊标注民工。
要知道,标注真的很贵的,之前跟国内一家做AI绘图大模型的公司聊过,才知道他们标注分为机标和人标,而人标的成本,大概是数据量的十分之一
也就是你拿出去3000万的数据,人工标一次,就得300万RMB干出去。

而腾讯12亿用户,每天验证码起码也是千万的量级,这标注费用,你可以算算这省了多少钱吧。

所以说,大厂在如今还在大数据的时代,优势是真的大。。。
不过这种标注,目前来看还是只能解决语义理解的标注,但是能把这个解决也已经很牛逼了,虽然美学一般,但是语义理解能达到极强,这就是妥妥的国内版Dalle3
而Dalle3的短板大家肯定也清楚,实在太丑了。

而要标美学表现,难度其实就大很多,真的得找懂设计、懂美学的人来标注。

Midjourney当年其实就是吃了这波红利。

第一波获得用户,而且获得的还是一大波的有美学背景的专业用户,然后每次你生图的时候给你生成4张图拼一块的一张整图,
你还必须选一张你觉得最好的进行提取或优化。

image

这就是一种强行的数据标注。
所以Midjourney在如今的美学表现上一骑绝尘,是因为他们在美学的标注上,做的太好了,而别的家想在这块赶上,基本不可能,因为最高质量的那波用户,基本已经全在Midjourney那了。
而腾讯未来想做这件事,其实在我看来,还真是有可能的。

因为你其实看Midjourney的路径,核心点就一个:海量的专业用户
腾讯缺专业用户吗,怎么可能会缺,12亿用户捏在手上,用户画像做的那么齐全,我想把有设计师背景的用户挑出来,难吗?一点都不难。
我想给挑出来的这些设计师背景的用户推送美学标注的验证码,难吗?也不难。

所以啊,现在在我看来,腾讯的验证码标注,才刚刚向前迈了半步,后面的模型空间,还很大。
唯一问题就是,腾讯内部有点封闭,用户画像数据PCG做QQ的那边肯定有,但是混元跟PCG不是一个事业群,也不知道能不能拿得到。
能拿到的话,那就是王炸。
但是不管怎样。

你我都已经,身在其中了。
10年前,就已经是了。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

AI在用 | 穿越了!3款AI工具让梵高、莫扎特们「活」在当下

机器之能报道
编辑:杨文

以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。
因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。


我们也欢迎读者投稿亲自实践的创新型用例。

最近,有博主将一堆世界名人的自画像制成了动画,吸引了不少网友围观。
例如,文森特・梵高略带忧郁地抚摸着红色的络腮胡子:
Vincent Van Gogh

一副贵族气质的莫扎特摆弄起礼服:
Mozart

写出《傲慢与偏见》的简・奥斯汀坐在椅子上露出微笑:
Jane Austen

贝多芬忘我地拉着小提琴:
Beethoven

视频链接:https://mp.weixin.qq.com/s/OWlRaSs5sOpb6VShvuhkRA

此外,网友还「复活」了民国时期女演员们:
民国女演员

视频链接:https://mp.weixin.qq.com/s/OWlRaSs5sOpb6VShvuhkRA

-1-

「复活」躺在历史课本中的名人们
有请我们的老朋友:即梦、可灵和D-ID 。
将名人的自画像转成动画,第一步就是把画作变成摄影风格的人物照片。
即梦的参考图功能正好派上用场。
即梦链接:
https://jimeng.jianying.com/ai-tool/image/generate

我们以梵高为例。导入参考图,选择「角色形象」。
Img1

输入提示词:写实,摄影风格。选择生图模型即梦通用 v1.4 以及图片比例。
Img2

最终生成效果:
Img3

从中挑选一张,投喂给可灵。
可灵链接:
https://klingai.kuaishou.com/image-to-video/new

提示词描述为:男人笑了。负提示词为:模糊,变形,毁容,低质量,扭曲。
Img4

来看看效果:
Img5

如果还想来个进阶版本,让梵高开口说话,我们可以使用 D-ID 这款 AI 数字人应用。
D-ID 链接:
https://studio.d-id.com/

其玩法也很简单。只需上传一张图片,然后设置表情、动作、姿势、声音以及输入所说内容即可。
Img6

值得注意的是,上传的图片要求是正面照、居中、表情自然、嘴巴紧闭、光线良好,不要有面部遮挡。
Img7

上效果:
Img8

-2-

让民国老照片栩栩如生
「复活」民国时代的名媛也分三步走:上色、调画质、动起来。
首先,我们使用的上色工具为 Palette。该工具内含 20 种滤镜,可免费使用。
Palette 链接:https://Palette.fm/

我们上传一张民国时期女演员胡枫的黑白照片,选择「Classic Palette」滤镜,眨巴眼的工具就能完成调色。
Img9

上色之后的效果:
Img10

然后,我们使用美图秀秀的「画质修复」功能来提高画质。
Img11

接下来,我们使用Vidu让画面动起来。提示词为:女子自然地笑起来。
Vidu链接:https://www.vidu.studio/create
Img12

看效果:
Img13

OK!今天的 AI 小课堂就到这儿,古德拜!

工具链接 ——
即梦链接:
https://jimeng.jianying.com/ai-tool/image/generate
可灵链接:
https://klingai.kuaishou.com/image-to-video/new
D-ID 链接:
https://studio.d-id.com/
Palette 链接:
https://Palette.fm/
Vidu 链接:
https://www.vidu.studio/create
美图秀秀APP

以后我们会带来更多好玩的AI用例,也欢迎大家进群交流。
Img14

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

蚂蚁集团T空间启用,超3000人入驻 技术人才占比近8成

日前,蚂蚁集团在北京的自有园区——蚂蚁T空间正式启用,蚂蚁集团创新科技总部正式落地北京。蚂蚁集团董事长兼CEO井贤栋在T空间启用仪式上说,“蚂蚁会利用北京人才和科创高地的优势,加大投入,开启蚂蚁科技的全新篇章。


蚂蚁T空间

一直以来,北京都是蚂蚁集团重要的创新研发中心,早在2010年,支付宝(中国)就设立了北京分公司,2020年国产分布式数据库OceanBase商业化公司也落户北京。去年蚂蚁集团与北京海淀区政府签署战略合作协议,宣布在海淀区设立创新科技总部。据了解,该总部覆盖了蚂蚁在蚂蚁人工智能和数据要素领域的前沿科技探索和实践,下设四大业务主体:蚂蚁技术研究院、OceanBase国产数据库总部、数字蚂力总部、蚂蚁数科北方总部。

T空间位于中关村南翼。在8月14日的媒体沟通会上,蚂蚁集团首席技术官何征宇向记者说,“T既代表技术‘Technology’,也代表人才‘Talent’,蚂蚁T空间的命名反映蚂蚁在北京的技术和人才布局。蚂蚁集团北京总部从CBD迁往中关村,也是蚂蚁集团坚定向科技迈进的决心写照。他表示,未来十年,蚂蚁将持续加大科技投入,科技战略聚焦在人工智能和数据要素两大领域。

蚂蚁重投以大模型为代表的人工智能技术,坚持面向产业、全栈布局,希望让AI像扫码支付一样便利每个人的生活,为老百姓解决生活中的问题;布局全链数据要素技术,包括分布式数据库,区块链、隐私计算和绿色计算,助力数据价值释放和共享,希望让数据价值的流动像自来水一样即开即用。

北京创新科技总部是落实两大科技战略的商业化探索实践地,也为其提供核心技术支撑。落户在北京创新科技总部的四大业务主体,也正是蚂蚁在这两大科技战略上的商业实践和技术探索的载体。

OceanBase是蚂蚁集团100%“根自研 ”的国产分布式数据库,承载了蚂蚁科技创新的起步。自2010年诞生以来,OceanBase已经支撑十余年“双11”,全球唯一接连打破“数据库世界杯”TPC-C和TPC-H测试纪录。自2020年落地北京正式商业化独立运营以来,OceanBase已经助力金融、政务、运营商、零售、互联网等多个行业的1000多家客户实现了关键业务系统升级,并保持在独立分布式数据库厂商里金融市场第一的份额。

蚂蚁数科是蚂蚁集团科技商业化、系统化实践的代表,伴随着区块链、隐私计算、安全科技等技术产品化落地,将有力推动产业数字化进程。目前,蚂蚁数科已经服务超1万家企业,科技商业化成果初具规模。作为蚂蚁数科北方总部所在地,北京也是蚂蚁数科云服务、安全科技等前沿技术研发的重要基地。

此外,蚂蚁集团旗下的数字蚂力公司总部也扎根北京。数字蚂力是蚂蚁围绕AI技术为企业提供智能服务的业务板块,也是蚂蚁集团今年刚刚成立的AI商业化公司。具体来说,数字蚂力为企业智能化经营提供三类服务:一是提供智能客服与营销服务,通过客服领域大模型为客户提供“AI云客服”及智能营销、智能培训质检等各类服务,帮助企业降低经营成本提升经营效率;二是提供智能运营服务,为企业提供包括在法律、合规等环节的智能服务方案;三是智能技术服务,通过CodeFuse代码大模型,帮助企业实现智能研发,降低技术研发的门槛,提升技术的可用性。

在北京设立的蚂蚁技术研究院,致力于探索前沿科技,明确了“突破数据要素核心技术”、“探索人工智能新边界”两大前沿方向,攻坚包括可编辑实时生成式人工智能、具身智能和智能机器人、数据存储、高性能实时图计算技术、密态计算等相关技术,为蚂蚁科技创新储备未来力量。

北京人才资源丰沛,高校和科研院所密集,这是吸引蚂蚁在京业务布局的重要因素。截至今年6月底,蚂蚁集团在京员工3000余人,技术研发团队超过2000人,技术人才占比近80%,硕士学历及以上人才占比近60%。与此同时,蚂蚁集团和北京高校科研机构也有密切合作。先后与清华大学建立2个联合实验室,并与北京大学、清华大学、中国人民大学、北京邮电大学等在京10所高校开展课题合作。

蚂蚁与清华大学联合攻坚的AI视觉成果获吴文俊人工智能自然科学奖一等奖;蚂蚁与北京邮电大学攻坚图智能技术,获中国电子学会科技进步一等奖;蚂蚁与中国人民大学合作的“区块链法律教学与课程体系改革”协同育人项目,获2022年国家级教学成果二等奖。


注意:Title、Date、Body 三个部分的内容,放入到对应的位置。最后只需要按照格式标准输出为Makedown源文件格式内容。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

比原始分辨率高36倍,北航、清华团队用AI在多空间组学平台上高分辨率表征组织,登Nature子刊

编辑 | 萝卜皮

空间组学的最新进展已将分子类别分析的范围扩展到转录组学之外。然而,许多此类技术都受到空间分辨率的限制,阻碍了科学家深入表征复杂组织结构的能力。


现有的计算方法主要侧重于转录组学数据的分辨率增强,缺乏针对各种组学类型的新兴空间组学技术的适应性。

在这里,北京航空航天大学和清华大学的研究人员提出了 soScope,这是一个统一的生成框架,旨在提高从各种空间组学技术获得的分子谱的数据质量和空间分辨率。

soScope 可以汇总来自组学、空间关系和图像的多模态组织信息,并通过分布先验与组学特定建模联合推断出具有增强分辨率的组学谱。

通过对 Visium、Xenium、spatial-CUT&Tag、slide-DNA/RNA-seq 等多种空间组学平台的综合评估,soScope 提高了识别具有生物学意义的肠道和肾脏结构的性能,揭示了无法以原始分辨率解决的胚胎心脏结构,并纠正了测序和样本处理中出现的样本和技术偏差。

此外,soScope 扩展到空间多组学技术 spatial-CITE-seq 和空间 ATAC-RNA-seq,利用跨组学参考同时进行多组学增强。soScope 提供了一种多功能工具来提高不断扩展的空间组学技术和资源的利用率。

该研究以「Tissue characterization at an enhanced resolution across spatial omics platforms with deep generative model」为题,于 2024 年 8 月 2 日发布在《Nature Communications》。

组织是由具有不同分子状态和空间组织的细胞构成的。空间组学技术近年来取得了显著进展,可以在保持空间背景的同时,对各种分子类别进行空间分析。

这些技术在多种生物领域中提供了重要见解,虽然取得了早期成功,但仍面临两个主要挑战:冷冻或福尔马林固定的组织可能影响分子状态,降低测序准确性;同时,大多数技术的空间分辨率有限,难以揭示组织结构的细微异质性。

虽然计算技术能够改善空间组学数据的分辨率,但目前的方法大多仅针对单一组织模态,难以充分利用多模态信息。

在这里,北航和清华的研究团队引入了空间组学范围(soScope),这是一个完全生成的框架,它模拟来自不同空间组学技术的点级概况的生成过程,旨在提高它们的空间分辨率和数据质量。

为了实现这一目标,soScope 将每个点视为增强空间分辨率的“子点”的集合,其组学特征与空间位置和形态模式相关。

然后,soScope 使用多模态深度学习框架整合斑点组学概况、空间关系和高分辨率形态学图像,并联合推断子斑点分辨率下的组学概况。通过选择组学特定分布,soScope 可以对不同的空间组学数据进行精确建模和减少变异。

soScope 提供了一种统一的工具,该工具结合了多模态组织图谱,以增强具有不同分子类别的组学图谱。soScope 可以有效提高空间分辨率,减少不必要的变化,并能够表征无法在原始分辨率下检测到的复杂组织结构。

该团队广泛评估了 soScope 对通过多种空间技术分析的多种分子类型的有效性和普遍性,包括 Visium、Xenium、spatial-CUT&Tag、slide-DNA-seq、slide-RNA-seq、spatial-CITE-seq 和 spatial ATAC-RNA-seq。

在健康和患病组织中,soScope 改进了组织域识别,提高了已知标记的可区分性,并纠正了数据和技术偏差。该方法能够揭示比原始分辨率高出 36 倍的更精细的组织结构。它可以有效地适应空间多组学数据,以同时增强多组学概况。

研究人员注意到,有几种基于成像的空间组学技术,例如 seqFISH、STARmap 和 MERFISH,它们可以直接实现单细胞分辨率的空间分析,但代价是组学通量较低和组织区域较小。虽然 soScope 为预先指定的亚点或细胞位置提供了增强的配置文件,但它可能无法达到亚细胞分辨率。

为了进一步提高分辨率,可以修改 soScope 以包含来自同一组织的配对单细胞组学数据,以更高分辨率为亚点推断提供信息。此外,soScope 还整合了 H&E 图像作为输入,在某些临床研究中,人类专家可以轻松对其进行注释。研究人员可以修改 soScope,以整合人类标签并以半监督方式指导后验推理,以改进潜在表征和概况学习。

对于包含来自同一器官的多个连续切片的较大数据集,soScope 可以在部分数据上进行训练并应用于其余组织切片,以降低计算成本。

随着可用空间组学数据资源的不断扩展和新空间技术的出现,研究人员相信 soScope 有潜力成为一种多功能工具,充分利用空间组学数据并增强科学家对复杂组织结构和生物过程的理解。

论文链接:https://www.nature.com/articles/s41467-024-50837-5



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

百万级原子模拟,从头算精度,北京科学智能研究院提出AI+大尺度电子结构模拟新方法

编辑 | KX

在计算材料科学领域,准确高效地模拟材料的电子结构一直是一个非常关键而又极具挑战性的问题。基于密度泛函理论的第一性原理计算方法的高计算需求依然是大尺寸长时间材料模拟所面临的难题。


北京科学智能研究院 (AI for Science Institute, Beijing) 提出了一种基于深度学习的高效紧束缚方法,称为 DeePTB,从而高效地表示具有从头算精度的材料电子结构,极大地简化了计算复杂度,并实现百万级大尺寸结构的电子、光电响应性质的计算模拟。当与分子动力学相结合时,DeePTB 可以同时促进原子和电子行为的有效和准确的有限温度模拟。DeePTB 的可用性弥合了电子模拟中准确性和可扩展性之间的差距,通过实现大规模电子结构计算,将推动材料科学和相关领域的发展。相关研究以「Deep learning tight-binding approach for large-scale electronic simulations at finite temperatures with ab initio accuracy」为题,于 8 月 8 日发表在《Nature Communications》上。

虽然基于 DFT 的第一性原理方法提供了准确且通用的模拟材料电子性质的方法,但是随着系统中的原子数量增加,第一性原理的计算量急剧增加,而在真实材料或者器件体系中往往包含成百万千万量级的原子数,难以很直接使用第一性原理软件完成计算模拟。一些复杂材料场景远远超过了 DFT 方法的模拟尺寸,一方面是因为 DFT 的自洽迭代过程复杂,另一方面,DFT 需要足够大的基组来保证精度,导致产生的哈密顿量的尺寸较大,难以进行后续的性质计算。因此使用更小和更稀疏的矩阵来描述电子哈密顿量的紧束缚(Tight-Binding, TB)方法提供了一种更为实用的替代方案。然而,传统的 TB 方法也存在精度与效率的矛盾。例如基于 Wannier 函数的 TB 方法虽然具有较高的精度,但是其构造过程需要 DFT 自洽迭代计算,仍然限制了其在大尺寸体系下的应用。因此发展通用的 TB 哈密顿量模型方法软件框架 DeePTB 实现精度效率以及迁移率的统一,是具有重要意义的课题。

DeePTB 方法框架及特点

DeePTB 方法的整体框架图下图所示,对于给定构型中指定近邻范围内的成键原子对, 首先训练其基于物理约束下的经验公式系数,然后在此基础上提取成键原子对的局域化学环境,通过 embedding 网络构造 symmetry-preserving 描述子,并基于 fitting 网络参数映射为局域环境依赖的 TB 参数,突…
DeePTB 方法架构

DeePTB 方法具有如下特点:

  • 实现精度与效率的统一,通过神经网络修正实现以经验紧束缚模型计算效率并保持第一性原理的计算精度。
  • 采用 eigenvalues 作为训练标签,用户可以灵活地选择任何 DFT 软件生产训练标签,可以是平面波基组,也可以是 LCAO 基组,也可以是任意泛函(LDA、GGA、even Hybrid functionals)。同时也可以轻松实现并处理自旋轨道耦合相互作用。
  • 使用更小的基组,相对完整的 LCAO DFT 哈密顿量,TB 使用的更小的基组,甚至做到只拟合费米面附近的能带。
  • 采用正交基组 TB 形式,无需额外处理交叠矩阵,因此可以接入大规模 TB 算法,例如 tight-binding propagation method (TBPM),轻松实现百万千万量级原子的第一性原理精度的电子性质计算。真正实现器件级尺寸的量子力学模拟。
  • 基于 Slater-Koster 框架,支持用户自定义经验 TB 拟合公式,并可以系统地增加神经网络修正,提高精度。为目前文献上存在各种经验拟合公式以及参数提供一个统一的实现和提高精度的训练平台。
  • 支持与分子动力学结合,实现有限温度下原子的动力学过程中以及结构系综采样中的电子结构和性质的模拟。

预测结构扰动构型的 TB 哈密顿量以及电子结构

研究人员以在电子器件中被广泛使用的 IV 族元素(C、Si、Ge、Sn)和 III-V 族化合物(如 GaAs 等)组成的半导体材料作为测试对象。首先,进行分子动力学(MD)模拟在有限温下的结构构型采样,并基于不同 MD 轨迹的构型,使用 DFT 软件计算其对应的电子本征值作为 DeePTB 的训练和测试数据。模型测试全部体系的决定系数 (R^2≈0.9999 ),本征值偏差只有十几至几十个 meV 左右。其中 III-V 族化合物的测试集同时包含了立方和六方两种不同的相下的构型。
对 IV 组和 III-V 系统的 DeePTB 预测的验证

此外,DeePTB 模型还展现出了以下出色的泛化能力:

  • 推广到更大尺寸的超胞结构,显示出极佳的尺度可扩展性。
  • 处理应变效应,准确预测应变调控下的能带结构及带隙大小。
  • 兼容不同的 DFT 基组、泛函和自旋轨道耦合效应,表现出强大的灵活性和通用性。

DeePTB 向更大尺寸和应变结构的推广

百万原子尺寸高效建模

研究人员选择 III-V 族化合物 GaP 作为大尺寸建模的应用案例,构造了 50 × 50 × 50 的超胞结构。首先基于 DP 深度势能进行 DeePMD 分子动力学模拟有限温的结构采样,然后基于得到的采样构型,利用 DeePTB 进行紧束缚模型哈密顿量的构建,并基于预测的 TB 模型使用 TBPLaS 软件实现的 TB propagation method (TBPM) 方法进行无需对角化的快速的电子性质计算,得到包括有限温下的态密度(DOS)、光电导率、介电函数以及复折射率等电子性质及光电相应。

模拟含有 10^6 个原子的 GaP 的温度相关特性

计算结果表明, DeePTB 的计算结果与文献结果符合良好,峰值位置的轻微差异主要是因为用于训练的 DeePTB 模型的交换关联泛函(GGA)倾向于低估半导体材料的电子带隙的缘故。这些结果表明了 DeePTB 高精度建模以及进行器件级尺寸电子结构及性质的模拟计算的能力。

关于 DeePTB 框架的潜力

对于不同的交换关联 (XC) 函数,能带结构的色散特征大致相同。因此,原则上,可以首先在计算效率高的 XC 函数(如 LDA 或 GGA)上训练模型,然后将其转移到更昂贵、更准确的函数(如 SCAN 或 HSE)。这使得能够高度准确地描述实验可观测量,以用于接近现实的材料模拟等情况下所需的大规模模拟。

此外,对于大规模样本,模拟应变对电子特性的影响是一项计算繁琐的任务。DeePTB 可以通过在较小的样本上训练模型并将其转移到更大的系统来有效地加速这些模拟。这为电子结构应变工程的理论研究带来了优势。

MD 可以提供离子自由度的模拟,这类似于晶体结构的温度探针,其中离子振动是基本现实。在需要大规模和长时间模拟的情况下,DeePTB 可用于模拟温度和结构相关的电子特性。DeePTB 使得考虑其他实际情况(如缺陷或杂质及其对电子结构的影响)成为可能和可行。

DeePTB 探索的另一个方向是模拟磁系统的特性。鉴于 DeePTB 的这些多样化潜在应用,它可以在电子模拟领域产生深远的影响。

参考内容:https://mp.weixin.qq.com/s/StetT81-UD6AGGgv-60GPA

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

1篇Outstanding、5篇Oral!字节跳动今年ACL这么猛? 来直播间聊聊!

本周学术界瞩目的焦点,无疑是在泰国曼谷举行的 ACL 2024 顶会。这场盛会吸引了全球众多杰出的研究者,大家汇聚一堂,共同探讨和分享最新学术成果。


官方公布的数据显示,本届 ACL 共收到近 5000 篇论文投稿,其中 940 篇被主会录用,168 篇工作入选大会口头报告(Oral),录取率低于 3.4%,这当中,字节跳动 共有 5 篇成果中选 Oral。在 8 月 14 日下午的 Paper Awards 环节,字节跳动旗下成果《G-DIG: Towards Gradient-based DIverse and high-quality Instruction Data Selection for Machine Translation》被主办方官宣入选 Outstanding Paper(1/35)。

回溯 ACL 2021,字节跳动曾摘下唯一一篇最佳论文桂冠,是 ACL 成立 59 年以来,中国科学家团队第 2 次摘得最高奖项!为深入探讨今年的前沿研究成果,我们特意邀请字节跳动论文的核心工作者解读分享。8 月 20 日下周二 19:00-21:00,「字节跳动 ACL 2024 前沿论文分享会」线上开播!

豆包大语言模型研究团队负责人王明轩,将携手字节跳动多位研究员黄志超、郑在翔、李朝伟、张欣勃、及 Outstanding Paper 神秘嘉宾,分享 ACL 部分精彩中选成果,研究方向涉及自然语言处理、语音处理、多模态学习、大模型推理等领域,欢迎预约!

活动议程

精选论文解读

RepCodec:一种用于语音离散化的语音表示编解码器
论文地址:https://arxiv.org/pdf/2309.00169

随着大型语言模型(LLMs)近期的快速发展,离散语音标记化在将语音注入 LLMs 中发挥重要作用。然而,这种离散化导致信息的丢失,从而损害整体性能。为提高这些离散语音标记的性能,我们提出了 RepCodec,这是一种用于语义语音离散化的新型语音表示编解码器。

DINOISER:通过噪声操纵增强的扩散条件序列生成模型
论文地址:https://arxiv.org/pdf/2302.10025

虽然扩散模型在生成诸如图像和音频等连续信号方面取得了巨大成功,但在学习像自然语言这样的离散序列数据仍然存在困难。尽管最近一系列文本扩散模型通过将离散状态嵌入为连续状态隐空间来规避离散性这一挑战,但它们的生成质量仍然不尽人意。

为了理解这一点,我们首先深入分析基于扩散模型的序列生成模型的训练过程,并确定了它们的三个严重问题…

…(后续部分内容过多,省略)


1
{Body}


感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB