O’Reilly推出AI学院,提升生成式AI技能增长

新提供为订户提供数百种与角色和行业相关的学习资源,帮助组织内的GenAI技能提升;也可作为独立订阅服务
O’Reilly,作为技术和商业洞察驱动学习的主要来源,今日宣布推出O’Reilly AI学院,这是一个新的提供,提供数百本生成式AI专注的书籍、现场活动、点播课程等,以帮助企业员工建立必要的技能,将GenAI工具投入使用并提高生产力。图片{ width=60% }


最新功能将提供给当前订户,他们可以完全访问O’Reilly在线学习平台,并将作为独立订阅服务提供给所有希望提升员工新技术技能的组织。

在过去一年中,生成式AI及其能力已经席卷全球,根据BCG最近的一项调查,全球高管有85%计划在2024年增加对AI和GenAI的支出。然而,绝大多数员工尚未将这项新技术纳入其技能范围。尽管大多数领导人同意,他们的员工在未来三年内需要接受关于GenAI的再培训,但目前只有10%的员工接受过GenAI工具的培训,近60%的领导表示对自己的执行团队在GenAI方面的熟练程度缺乏信心。

鉴于围绕这一革命性技术的培训需求增加,O’Reilly设计了最新的提供,以促进整个组织内的GenAI技能提升。O’Reilly AI学院提供定制学习轨道,确保组织内的每个个体和团队都获得必要的技能,建立在生成式AI方面的坚实基础上。其中一个主要学习轨道,针对每个人的GenAI基础常识,关注广泛的技能范围,包括提示基础知识和提高生产力。当前可用的其他轨道包括高管和领导的GenAI以及项目管理的GenAI,未来几个月将添加特定角色的轨道,包括人力资源、业务分析师、产品经理等。

O’Reilly AI学院提供的学习轨道得到了其他300份根据角色和行业定制的内容的支持,以满足安全、数据、金融、营销和项目管理团队的需求,覆盖政府和医疗保健等部门。这些内容包括从书籍和有声读物到现场和点播课程、简短文本和视频的各种形式,因此团队成员可以专注于他们需要了解的内容,并选择最适合他们学习的方式。

O’Reilly总裁Laura Baldwin表示:“新工具利用GenAI每天进入市场,支持营销、销售、财务和人力资源等团队,都致力于帮助提高生产力。但要充分享受GenAI的全部好处,你组织中的每个人都需要精通这项技术,包括技术含量较低的团队。”“通过推出O’Reilly AI学院,我们旨在提升每位员工对如何利用GenAI的理解,让他们能够提高自己的问题解决能力、决策能力和适应能力,以推动业务成果在一个越来越被人工智能驱动的世界。”

成功完成O’Reilly AI学院学习轨道的学习者有机会获得完成徽章和证书,以宣传他们的GenAI技能。这些徽章可以嵌入在电子邮件、各种社交媒体上,包括LinkedIn等平台。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

沙特阿拉伯发起,DCO启动首个全球GenAI中心

数字合作组织(DCO)在利雅得举办的全球人工智能峰会上宣布,推出其生成式人工智能(GenAI)卓越中心(CoE)计划。图片{ width=60% }


这一开创性举措旨在通过促进合作,推动可持续和包容性增长,将DCO成员国的角色转变为全球GenAI领域的关键创新者。

DCO秘书长迪玛·阿尔·亚哈(Deemah AlYahya)在一份关于该计划的声明中表示:“我非常荣幸地宣布生成式人工智能卓越中心的启动,这是数字合作组织倡导并由沙特阿拉伯王国支持的开创性举措。DCO正在大胆迈出步伐,最大限度地发挥多边合作的价值,抓住GenAI时代的机遇。GenAI卓越中心提供的平台将使DCO成员国能够生产GenAI解决方案。”

亚哈补充道:“这一举措的核心是一个多边框架,确保DCO成员国之间的互通与合作,支持他们从GenAI技术的消费者转变为积极的生产者。这种方法为DCO成员国在GenAI创新领域成为全球领导者和知识产权中心铺平了道路。”

GenAI CoE计划的关键好处包括促进政府、私营部门和学术界之间的包容性合作,确保所有成员国都能参与GenAI革命,此外,通过将其转变为GenAI解决方案的创造者,建立本地能力,增加知识产权和推动创新,激发成员国的创新。

DCO致力于推进其成员国的人工智能能力并促进创新,确保所有国家都能充分利用生成式人工智能的力量。通过GenAI卓越中心,DCO正在赋予各国权力,通过创造一个弥合技术差距并增进合作的平台,推动创新。DCO及其成员国共同塑造了一个包容未来的人工智能世界,在这个世界里,没有国家会被抛在后面,每个国家都有机会在全球人工智能领域中领先。


注意:Title、Date、Body 三个部分的内容,放入到对应的位置。最后只需要输出为Markdown源文件格式内容。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

召唤100多位学者打分,斯坦福新研究:「AI科学家」创新确实强

文章来源:机器之心
原文链接:https://mp.weixin.qq.com/s/XHrQ2espDn9SdB9LlcOBvw

图片来源:由GPTNB生成

近日,一篇关于自动化 AI 研究的论文引爆了社交网络,原因是该论文得出了一个让很多人都倍感惊讶的结论:LLM 生成的想法比专家级人类研究者给出的想法更加新颖!

我们都知道通过调节 LLM 的温度值确实可以调整它们的随机性和创造性,但在科学研究方面比人类还懂创新?这还是超乎了很多人的想象 —— 至少很多人没想到这会来得这么快。难道 AI 科学家真的要来了?

那么,这项来自斯坦福大学的研究究竟得出了什么样的结论呢?

LLM 能生成新颖的研究思路吗?
为了准确地对比 LLM 与人类在科研思路创新方面的能力,斯坦福大学的这个研究团队招募了 104 位 NLP 研究者,让其中 49 位写下创新研究想法,然后再让 79 位专家对 LLM 和人类给出的思路进行盲测。


请注意,其中有 24 位人类专家既写了想法,也参与了盲测,当然他们并不评估自己写的内容。

模型(或者按该团队的说法:思路生成智能体)方面,该团队使用了 claude-3-5-sonnet-20240620 作为骨干模型。具体来说,给定一个研究主题(比如:可以提升 LLM 事实性并降低其幻觉的提示方法),让 LLM 生成一系列对 Semantic Scholar API 的函数调用。这个论文检索动作空间包括 {KeywordQuery (keywords), PaperQuery (paperId), GetReferences (paperId)} 。每个动作生成都基于之前的动作和已执行的结果。

该研究使用的研究主题有 7 个:偏见、编程、安全性、多语言、事实性、数学和不确定性。下表是各个主题的想法数量:

图片来源:由GPTNB生成

研究过程如下图所示:

图片来源:由GPTNB生成

这里我们不细说其详细的设置和评估过程,详见原论文。总结起来就是比较人类专家与 AI 智能体生成的科研思路的新颖程度。我们直接来看结论。

根据该团队思路评分(Idea Ranking)规则,他们对人类和 AI 提出科研思路进行了打分,见图 2 和表 7:

图片来源:由GPTNB生成

其中 Human Ideas 是指招募的专家研究者提出的思路,而 AI Ideas 则是 LLM 智能体给出的排名第一的思路。AI Ideas + Human Rerank 是指由 AI 生成思路但由本研究一作 Chenglei Si 手动从排名靠前的思路中选择他认为最好的一个。

可以看到,在新颖度方面,不管是 AI Ideas 还是 AI+Rerank,都显著优于 Human Ideas(p < 0.01)。在激动人心(excitement)分数上,AI 生成的思路的优势更是明显(p < 0.05)。并且 AI Ideas + Human Rerank 的整体分数也优于人类(p < 0.05)。不过 AI 生成的思路在另外两方面(可行性和有效性)与人类的…

完整内容请访问原文链接

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

专用于法律的两个开源大模型,最高1410亿参数

法国国家高等教育计算中心、巴黎萨克雷大学的研究人员联合开源了专用于法律领域的大模型——SaulLM。SaulLM一共有540亿、1410亿两种参数,以及基础模型和指令微调两种版本。


SaulLM的最大特色是使用了5400亿token的专业法律数据进行了预训练,包括美国、欧洲、澳大利亚等地的法律文本,输出内容的准确率高于很多同类模型。

开源地址:https://huggingface.co/Equall/SaulLM-54-Base
指令微调:https://huggingface.co/Equall/SaulLM-141B-Instruct

图片来源:由GPTNB生成

SaulLM-54B和SaulLM-141B是基于Mixtral系列模型开发而成,通过引入专家混合(MoE)机制,显著提升了模型处理大量数据的能力。MoE架构的核心思想是将大型模型分解为多个小型专家网络,这些专家可以根据输入数据的不同特点被动态地激活。这种方法不仅提高了模型的计算效率,还增强了模型处理复杂法律文本的能力。

图片来源:由GPTNB生成

SaulLM-54B由32层组成,模型维度为4096,隐藏维度为14336;而SaulLM-141B则由56层构成,模型维度增至6144,隐藏维度达到16384。使得两个模型最多能支持长达32768和65536个token的上下文长度。

研究人员使用了分段策略来训练SaulLM模型,包括持续预训练、专业法律指令遵循协议的实施,以及模型输出与人类偏好的对齐。

第一步使用了超过5400亿token的专业法律语料库对模型进行预训练,盖了来自不同法律体系的广泛文本,包括美国、欧洲、澳大利亚等地的法律文献。

在预训练过程中,研究人员采用了AdamW优化器,并设置了特定的学习速率和梯度累积策略,以优化模型的学习效率和稳定性。此外,为了应对模型在训练过程中可能出现的灾难性遗忘等问题,研究团队还引入了重放策略,重新引入早期训练分布中的数据,以增强模型的记忆能力。

法律领域对大模型输出内容的准确性和专业性要求极高。为了提升模型在法律任务上的表现,研究人员使用了专业法律指令遵循协议,训练模型理解和执行法律场景中的指令。

在这一阶段,模型接受了包括法律分析、案件总结、法规解读等多种法律相关任务的训练。通过这种方式,模型学会了如何根据法律专家的需求,提供准确和相关的信息。

图片来源:由GPTNB生成

为了使模型的输出更加符合法律专业人士的期望和偏好,使用了模型输出与人类偏好的对齐方法。主要使用了合成数据和人类反馈来调整模型的输出。合成数据的生成是基于模型的自我对话,模拟法律专家在分析案件时可能提出的问题和答案。通过这种方式,模型能够学习到法律推理的深层逻辑和结构。

同时,研究人员还引入了人类反馈机制,通过评估模型输出的准确性、相关性和逻辑一致性,进一步优化模型的性能。

研究人员在专业法律基准测试平台LegalBench - Instruct 和多基准平台MMLU上对模型进行了综合评估。

图片来源:由GPTNB生成

实验结果显示, SaulLM – 54B优于 Mixtral - 54B,SaulLM -141B也优于Mixtral - 141B,比GPT-4、Llama-3也更加出色。此外,继续预训练显著增强了模型在法律领域的性能,在 IFT和 DPO阶段都有大约 7% 的显著提升。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

UC伯克利CAIS联手打造「AI预言家」,吊打人类分析师

文章来源:新智元
原文链接:https://mp.weixin.qq.com/s/X0K8IqLsDwqi3l-LR3MnDA

图片来源:由GPTNB生成
LLM的神奇职能,又多了一个。
用更形象的话说,就是中国的「算命签」、欧洲的「水晶球」,可以用「超人」的能力预测未来。


去年12月,Nature就刊登了一篇研究,可以用LLM预测一个人生活中即将发生的事件,就像预测句子中的next token一样。

图片1
实验结果表明,这个模型甚至能预测一个人未来4年内死亡的可能性,准确率高达78.8%。

图片2
最近,AI安全中心总监Dan Hendrycks联合加州大学伯克利分校的研究人员,开发了一个更强大的系统FiveThirtyNine,预测更宏观的社会事件,比如「Trump能否赢得2024年大选」。

图片3
这个AI预测机器人基于GPT-4o构建,用户输入想查询的事件,FiveThirtyNine就能预测出发生的概率,就像天气预报中给出的下雨概率一样。
那么预测的准确度和可信度如何?
知名作家、民意调查师Nate Silver最近在一档节目上表示,AI不会很快取代人类预测分析师的能力。想看到超人的预测能力,起码要等15年。

图片4
Nate Silver最新预测:Trump有64%的获胜几率
但这个项目的作者表示不服,他们表示,539的表现好过经验丰富的人类预报员单打独斗,大致和一群预报员合作的表现相当,甚至更好。

图片5
因此,分析预测市场很快就能通过AI实现自动化!
从项目Demo中也能发现,539能够预测的事件范围也很广泛,比如美国大选是政坛事件,其他领域包括生物安全、AI技术、环境健康、网络安全等也都能预测。

图片6
原文地址:https://www.safe.ai/blog/forecasting
Demo地址:https://forecast.safe.ai/

除了放出博客文章和Demo,研发团队还计划出一篇详细的技术报告,虽然还没完稿,但坑位已经占上了,感兴趣的朋友可以期待下。

图片7
原文地址:https://drive.google.com/file/d/1Tc_xY1NM-US4mZ4OpzxrpTudyo1W4KsE/view

为什么给这个机器人取名叫FiveThirtyNine?
原作者特地发推解释,原来是想致敬著名的民意预测员Nate Silver,但又要表示AI的能力比他强,因此本来…


(剩余内容)

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

大厂卷AI,卷到了小学生身上

文章来源:DT商业观察
原文链接:https://mp.weixin.qq.com/s/SClPnhhMSImXOywrvsq7ow

图片来源:由GPTNB生成

一生要强的中国家长,能扛得住“小天才”手表的入侵,却绕不开AI学习机的诱惑。
家有两娃的Kingbol(化名),是最近刚入手AI学习机的80后爸爸。


…如何凭借优质内容和技术率先获得消费者芳心,是整个AI学习机行业需要继续回答的问题。

图片来源:由GPTNB生成


Source: https://www.aixinzhijie.com/article/6846654
转载请注明文章出处

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

估值飙升到千亿美元!OpenAI拿什么去支撑这惊人身价?

OpenAI又有大动作了。

近期,有消息曝出,OpenAI正在进行新一轮的融资。


此次融资阵仗极大,OpenAI很可能在本轮融资后估值飙升至千亿美元,成为全球范围内的“超级巨头”。千亿估值的身价,让OpenAI把其他的竞争对手远远甩在了身后,与之拉开了一个无法企及的距离。不过,看似是迎来了繁花似锦的盛世,这背后也掩藏着热火烹油的焦灼。随着估值骤增,对OpenAI而言,新的赌局与危机已经摆在了台面上。它需要在短时间内向全行业,全世界证明一个问题:我要凭借什么过人之处,才能撑起这个惊人的价格标签?

为OpenAI豪掷千金的金主,究竟是何方神圣?
根据相关报道,OpenAI本次融资的领头机构是Thrive Capital,称得上是OpenAI的新任金主。
Thrive Capital的创始人Joshua Kushner来头不小,他是一名85后新生代投资人,也是美国“老钱家族”的一员。他还有一声名在外的哥哥Jared Kushner,是美国前总统Donald Trump的女婿,Ivanka Trump的丈夫。
除了家族显赫,Thrive Capital本人也有过高光时刻。2012年,他参与了Instagram的B轮融资,并在Facebook宣布10亿美元收购Instagram后,拿下了100%的回报率。
一直以来,Joshua Kushner和OpenAI CEO Sam Altman都私交甚笃,可以把他看作是OpenAI最著名的支持者之一,一直尝试投资OpenAI。在2023年,Thrive Capital领投了OpenAI的新一轮融资,红杉资本、a16z、K2等机构跟投。该轮融资中,Thrive Capital投资了近1.3亿美元,当时OpenAI估值270亿美元。不仅参与投资,Thrive Capital还深度介入了OpenAI公司的内部问题。特别是在Sam Altman因为公司内斗被董事会解雇之时,Joshua始终是Altman的强有力支持者。
早在今年4月,Thrive Capital就主导过一次OpenAI前员工股权出售。当时Thrive Capital对OpenAI的估值就从270亿美元提升至860亿美元。等到OpenA这次新一轮的融资,Thrive Capital更是为其估值1000亿美元,甚至还在华尔街散布OpenAI估值可能触及1250亿美元高点的传言。看得出来,为了捧高OpenAI,作为金主爸爸的Thrive Capital和Joshua Kushner是相当卖力了。

光速烧钱进行中,OpenAI挣钱的速度远远赶不上它花钱的速度快?
大家都在为OpenAI惊人的融资能力和市场潜在价值所折服,但很可能忽略了一个问题:OpenAI烧钱的速度远比我们想象中更快。
之所以火速开启全新一轮融资,最根本的原因在于OpenAI先前的100亿美元已经花光了。
2015年,刚刚成立的OpenAI就获得了不少资本大佬的青睐,这其中还有如今与OpenAI和Sam Altman决裂的Elon Musk。2015年6月,以马斯克为首的诸多投资人向OpenAI融资…



不可否认,在当下的在科技圈和社交媒体上,OpenAI的权威性已经大不如以前了。很多人甚至开始对OpenAI和它的技术祛魅,怀疑这家刚被估值千亿美金的公司是不是“盛名之下,其实难副”。当然,伴随在质疑声周围的,更多的依旧是期待。
只能说,属于OpenAI的一场新游戏和新赌局又开始了。
图片来源于网络



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

大厂卷AI,卷到了小学生身上

文章来源:DT商业观察
原文链接:https://mp.weixin.qq.com/s/SClPnhhMSImXOywrvsq7ow

图片来源:由GPTNB生成

一生要强的中国家长,能扛得住“小天才”手表的入侵,却绕不开AI学习机的诱惑。

家有两娃的Kingbol(化名),是最近刚入手AI学习机的80后爸爸。


暑假过半,各大品牌的学习机也张灯结彩地以“暑假钜惠”“满4999减200”“附赠升级课程”的折扣,诱惑他去剁手。

假期带孩子到上海旅游的妈妈丁丁(化名),在市中心商圈的线下柜台,花费近1.6万,买下2台AI学习机。原因无他,身边有娃的家庭陆续开始用启蒙学习机,她希望自家孩子也有。同时AI学习机可以作为“拿得出手”的礼物,送给闺蜜。

像Kingbol、丁丁这样的中国爸妈并非少数。

根据洛图科技数据,今年上半年,中国学习平板市场的全渠道销量为257.9万台,同比2023年增长23.4%,而AI功能是这些学习平板的新增“标配”

截至2024年9月5日,在抖音和小红书,“学习机”话题下视频的播放量超38.4亿次,笔记超过53万篇。“怒砸三万元,亲测五款当红学习机”等测评视频,成为播放热门。

和传统学习机相比,AI学习机有什么区别?都有哪些品牌在入局?

啥是AI学习机?

AI学习机并不是一个统一的称呼,行业内或品牌也会称之为智能学习机等。

从小霸王学习机、步步高点读机,到文曲星、好记星……教育硬件起起落落,不断迭代。而AI学习机的最大特点,就是搭载了AI技术,可以灵活调整学习路径、进行个性化教学。

譬如AI批改作业这个功能,可以根据使用者在这一轮作业中的错题情况,识别出学习薄弱点,并在下一轮的作业试卷中,增加这部分知识点的题目。

有点类似于短视频擅长利用大数据对不同的人“投其所好”,AI学习机也会根据使用者的实际情况“因材施教”。相比之下,传统学习机输入的是固定的内容程序,只能按部就班地教学,单向输出。

目前,市面上主流的AI学习机品牌有五家:学而思、小猿、科大讯飞、小度(百度旗下AI业务)和作业帮。

AI学习机功能对比

单从产品详情页来看,各家学习机的功能卖点其实没有太大差异,基本上都包含以下几点——

  • 更智能,可以实现语音交互、定制化教学、AI批改作业等;
  • 内容好,课程题型等新且全;
  • 方便家长陪伴监控(生成学习轨迹、远程陪伴等);
  • 大屏、护眼;
  • 可以多账号切换(适合多娃家庭)。

不太一样的是,从教培企业转型的品牌,如小猿、学而思,都把课程资源当成首要卖点,强调名师讲课、跟紧新课标,不少家长也确实是冲着这些品牌的课程去的。

而科大讯飞、小度这类科技公司,则把AI、大模型等技术相关的关键词放在产品详情页的最前面。

在学习机直播间,常见的话术是:买一台AI学习机,就相当于给孩子配备了一个课外辅导老师。

AI学习机火爆,得从ChatGPT说起

AI学习机火爆,得从ChatGPT说起

任何事物沾上“AI”两个字,身价就飙升。学习机也是如此。

更具体来讲,学习机的AI,是指搭载了大语言模型(以下简称大模型)。无论是科大讯飞、希沃、小度还是网易有道,在搭载大模型之前,其学习机价格均未超过5000元,但冠以“AI”之后,不少品牌学习机的价格逼近万元。

没错,关键要点就在于“大模型”——一种能处理大量复杂数据的高级程序。

它相当于一个超级聪明的人类大脑,能学习并处理许多不同类型的任务——从图像识别、数据分析等底层能力,到做题、对话、写作、知识搜索与整理等实用技能。

一个更有体感的例子是——2023年的现象级产品ChatGPT,就是一种大语言模型。

而AI学习机的诞生和走红,也与ChatGPT息息相关。

2022年年底,Open AI 发布ChatGPT,引爆整个科技圈,国内也在加速大模型的研究并陆续发布相关产品。

2023年2月,上海复旦大学和北京大学率先取得成果,分别推出MOSS和ChatExcel测试版。紧接着,科技派玩家们登场。3月,百度在北京召开新闻发布会;5月,科大讯飞发布星火大模型1.0版本。

大模型可以被应用的场景很多,比如金融、医疗、教育、汽车。OpenAI的创始人奥特曼就曾公开表示,他本人特别看好的应用领域有两个,一个是医学顾问,另一个就是AI个性化教育辅导。

而文心一言和星火大模型,随后就分别被应用在小度和科大讯飞的AI学习机上。

2023年被行业内称为“百模大战”。除了AI公司,阿里、腾讯、字节跳动等互联网大厂,小米、华为、vivo等企业,都纷纷加入战场,推出自家大模型。

值得注意的是,在2023年下半年,学而思、作业帮、网易有道、希沃、优学派,推出了专门应用在教育领域的垂直大模型。

比如好未来(旗下有学而思团队)的九章MathGPT大模型,主要特点是拥有强大的数学解题能力。“九章”这个名字的灵感,就是源自中国古代数学专著《九章算术》。

再比如网易有道的“子曰”教育大模型,覆盖了翻译、作文批改、语法精讲等细分场景,它对应的硬件如网易有道词典笔X6 Pro,具备虚拟人口语教练、英语对话、互动问答、语法精讲的功能。

可以说,AI学习机,本质上是AI在教育领域的一个应用,也是在大模型风口下应运而生的产物。

为什么品牌都在卷AI学习机?

公司卷大模型、品牌推出AI学习机,除了技术变革,当然还是因为有利可图。

对科技公司而言,大模型是不能错过的风口,更是烧钱的“吞金兽”。而AI+C端硬件,可能是大模型快速变现的道路之一。

以科大讯飞为例。

2021年它的净利润为16.1亿元,2022年、2023年的净利润分别跌到了5亿元和6.1亿元,2024年上半年直接亏了4.7亿元,对此,财报中的解释是“烧钱研究大模型”。

按照董事长刘庆峰的说法,星火大模型的商业化路径主要有三条:

  1. 直接应用在C端硬件上,如AI学习机、智能办公本、智能翻译笔等;
  2. B端服务赋能,包含教育、医疗、汽车、金融、能源和运营商赛道;
  3. 讯飞开放平台,向开发者卖API。

科大讯飞没有单独公布这三方面的数据,但在其财报中格外强调了C端硬件带来的增长,比如2023年的半年报就提及:“讯飞星火认知大模型发布后,2023年5-6月,公司C端硬件 GMV 创历史新高,同比翻倍增长。以学习机为例,5月、6 月,大模型加持后学习机 GMV 分别同比增长 136%和 217%。

另一个可以侧面论证的数据是,从2019年到2023年,在科大讯飞的年度财报中,学习机出现的次数明显增加。

如果说,对于科大讯飞这样的科技公司来说,大模型是必争之地、是未来增长的希望。那么对于一些教培出身的公司,AI学习机可能算得上是转型的“救命稻草”。

昔日的教培四巨头新东方、好未来(旗下学而思)、高途和网易有道,在双减政策之后,都在各自寻找新的出路。

其中,新东方靠直播电商业务迅速突围,高途在2024年第一季度仍然亏损。

而剩下两家,好未来和网易有道,重要的增长点都包含了AI学习机,或者说,AI+教育。

好未来的业务主要有两大块:一是学习服务及解决方案,包含素质教育、国际教育、海外业务等,是主要营收来源。二是学习内容解决方案,包含纸质书籍、教育硬件等。

在“双减”之后,学习服务及其他业务的营收“断崖式下跌”,与此同时,内容解决方案的营收占比不断提升,其中,学而思学习机贡献了关键增长。

2023年Q4、2024年Q1,网易有道也靠AI 走出亏损泥潭,连续两个季度实现盈利。

除了学习机、词典笔等硬件,它的AI也应用在了软件上。财报显示,今年第一季度,网易有道的AI订阅服务(包括有道词典、有道翻译、Hi Echo等)销售额接近5000万元,同比增长超过140%。

写在最后

大模型和AI学习机,无疑都是当下的风口,也是不少公司寻求增长的方向。

《2024-2025年中国智能学习机市场趋势研究报告》显示,2023年中国教育智能硬件市场规模达到了807亿元,同比增长29.53%。预计到2025年,这一市场规模将超过1000亿元。

一个对比是,被称为蓝海赛道的中国短剧,2024年市场规模的预计 “才区区”500亿元。

不过,正如文中开头所讲,于消费者而言,各家的AI学习机似乎还没有明显的差异性和技术壁垒。

正如曾经,“9.11和9.9谁更大”的问题,难住了一众AI;在黑猫投诉平台上,有关“AI学习机一点也不智能”的投诉并不在少数。

消费者们反映比较多的问题集中在“虚假宣传”,比如没有AI一对一功能、AI作业诊断功能不好用、数学题讲解不对等。

AI学习机问题

换言之,尽管将AI应用在教育硬件上是大势所趋,但对于购买学习机的家长们来说,目前就算是头部品牌,其产品的智能程度也不尽如人意。

如何凭借优质内容和技术率先获得消费者芳心,是整个AI学习机行业需要继续回答的问题.

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

专用于法律的两个开源大模型,最高1410亿参数

法国国家高等教育计算中心、巴黎萨克雷大学的研究人员联合开源了专用于法律领域的大模型——SaulLM。

SaulLM一共有540亿、1410亿两种参数,以及基础模型和指令微调两种版本。


SaulLM的最大特色是使用了5400亿token的专业法律数据进行了预训练,包括美国、欧洲、澳大利亚等地的法律文本,输出内容的准确率高于很多同类模型。

开源地址:SaulLM-54-Base

指令微调:SaulLM-141B-Instruct

SaulLM-54B和SaulLM-141B是基于Mixtral系列模型开发而成,通过引入专家混合(MoE)机制,显著提升了模型处理大量数据的能力。

MoE架构的核心思想是将大型模型分解为多个小型专家网络,这些专家可以根据输入数据的不同特点被动态地激活。这种方法不仅提高了模型的计算效率,还增强了模型处理复杂法律文本的能力。

SaulLM-54B由32层组成,模型维度为4096,隐藏维度为14336;而SaulLM-141B则由56层构成,模型维度增至6144,隐藏维度达到16384。使得两个模型最多能支持长达32768和65536个token的上下文长度。

研究人员使用了分段策略来训练SaulLM模型,包括持续预训练、专业法律指令遵循协议的实施,以及模型输出与人类偏好的对齐。

第一步使用了超过5400亿token的专业法律语料库对模型进行预训练,盖了来自不同法律体系的广泛文本,包括美国、欧洲、澳大利亚等地的法律文献。

在预训练过程中,研究人员采用了AdamW优化器,并设置了特定的学习速率和梯度累积策略,以优化模型的学习效率和稳定性。此外,为了应对模型在训练过程中可能出现的灾难性遗忘等问题,研究团队还引入了重放策略,重新引入早期训练分布中的数据,以增强模型的记忆能力。

法律领域对大模型输出内容的准确性和专业性要求极高。为了提升模型在法律任务上的表现,研究人员使用了专业法律指令遵循协议,训练模型理解和执行法律场景中的指令。

在这一阶段,模型接受了包括法律分析、案件总结、法规解读等多种法律相关任务的训练。通过这种方式,模型学会了如何根据法律专家的需求,提供准确和相关的信息。

为了使模型的输出更加符合法律专业人士的期望和偏好,使用了模型输出与人类偏好的对齐方法。主要使用了合成数据和人类反馈来调整模型的输出。合成数据的生成是基于模型的自我对话,模拟法律专家在分析案件时可能提出的问题和答案。通过这种方式,模型能够学习到法律推理的深层逻辑和结构。

同时,研究人员还引入了人类反馈机制,通过评估模型输出的准确性、相关性和逻辑一致性,进一步优化模型的性能。

研究人员在专业法律基准测试平台LegalBench - Instruct 和多基准平台MMLU上对模型进行了综合评估。

实验结果显示, SaulLM – 54B优于 Mixtral - 54B,SaulLM -141B也优于Mixtral - 141B,比GPT-4、Llama-3也更加出色。此外,继续预训练显著增强了模型在法律领域的性能,在 IFT和 DPO阶段都有大约 7% 的显著提升。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

看到苹果和华为「互抡大锤」,我不厚道地笑了

机器之能报道

编辑:杨文

怀念乔布斯。
华为和苹果再一次「狭路相逢」。


今日凌晨,一年一度的苹果「挤牙膏」大会如约而至。(查看详情,请移步:刚刚,苹果首款 AI 手机发布!A18 芯片,新增拍照按钮,AirPods 变助听器)
在这场名为「高光时刻」(Glowtime)的发布会上,库克激动地说:
「iPhone 16 系列是我们打造的最先进的 iPhone。」
然而网友和媒体并不买账:
苹果 AI 还是个半成品。
这款手机或成为苹果历史上最具争议的一款。
无聊的发布会。
甚至几个月前,罗永浩就在直播间吐槽,这些年 iPhone 除了摄像头的摆放位置不停更换,没有任何创新之处。
资本更是闻声而动。
在发布会期间,苹果股价一度下跌 1.8%。
尽管发布会结束后股价有所回升,但整体表现平淡,股价依然接近 8 月 12 日以来的低位。

同一天,也就隔了几个小时,华为发布会也开始了,并拿出传闻已久的华为三折叠手机。
更有意思的是,华为三折叠还未开售,就已被炒至近 7 万「天价」。
不少网友调侃称新的「电子茅台」出现了。

-1-
外观:一个多俩按钮,一个看着像奏折
苹果这次发布会,带来了最新一代 iPhone 系列手机,包括 iPhone 16、iPhone 16 Plus、iPhone 16 Pro 和 iPhone 16 Pro Max。
消息一出,苹果立马被骂上热搜。
原因无他,没亮点。
先来看看近 5 年 iPhone 的外观变化:
如你所见,除了此次上新的 iPhone 16 采用双摄像头垂直排列外,总体设计与上代几乎没有变化。
正面顶部依然是「灵动岛」开孔,用于防止前置摄像头和 Face ID 传感器。
屏幕刷新率仍为祖传的 60Hz,并据称配备了 8GB 运行内存。
网友评价:
看起来都一样,没有什么特别的。
16 和 16plus 看起来像个玩具。
期间研发支出总计 1400 亿美元。
Pro 系列机型外观也没啥变化,就是尺寸变大了,边框变窄了。
iPhone 16 Pro 和 iPhone 16 Pro Max 的尺寸分别为 6.3 英寸和 6.9 英寸,而上一代机型为 6.1 英寸和 6.7 英寸。
苹果表示,Pro 系列新机型拥有「所有苹果产品中最窄的边框」,并称其为「迄今为止最好的 iPhone 显示屏」。
网友评价:
做那么大干什么!握 Max 手要起茧子了。
那不是更不好拿,包包都要换大一点了。
这几年牙膏挤的,让我觉得 14pro 买的真值。
15ProMax 好不容易减重了,这次尺寸一大,又重回去了。
哦,对了,iPhone 16 系列侧面还多了俩按钮。
在 iPhone 16 系列新增「相机控制」按钮,可以快速启动相机拍照和录制视频,也可用来调整变焦、曝光、景深等拍摄功能。
网友评价:
苹果是真的觉得一个放在这个位置的按钮会有人竖着用?
很难抓,重心不稳。
华为这次带来的三折叠 Mate XT,是全球首个三折叠屏手机。
它拥有全球最大 10.2 英寸屏幕,也是全球最薄折叠屏手机,展开薄至 3.6 毫米,电池 5600mAh。
Mate XT 采用华为天工铰链和多驱精密调校技术,确保开合过程流畅,铰链核心部件使用火箭钢以提升耐用性。
同时,它支持单屏、双屏和三屏三种形态,实现 92% 屏占比的大屏设计,还传承了「非凡大师」系列的八角形设计,以及岩脉纹与超薄素皮材质。
此外,它还搞了个旋转支架以及折叠触控键盘。
网友评价:

以后买手机可能会这样「先生,你要买的手机是中屏、大屏还是超大屏呢?
迟早从裤兜里掏出个大彩电。
以后的手机不会变成奏折吧?
特别像奏折,大臣每人拿一个上朝的时候打开念,高级牛马专用。
价格:不买立省 100%
再来说说价格。
苹果发布会上,iPhone 16 系列手机价格均已出炉。
iPhone 16 售价 799 美元起,iPhone 16 Plus 售价 899 美元起。
而国行版 iPhone 16 最低 5999 元(128GB),iPhone 16 Plus 128GB 价格售价为 6999 元,与上一代 15 标准版定价相同。
网友评价:
满满的金钱的味道。
我看看就好,不入手。
确实没啥性价比。
当看到华为 Mate XT 的价格时,网友们还是沉默了。
余承东在发布会上宣布,Mate XT 非凡大师 256GB 版本售价 19999 元、512GB 版本售价 21999 元、1TB 版本售价 23999 元。
9 月 20 日 10:08 正式开售。
网友评价:
这价格,老百姓看的抠脑壳。
价格不错,不坑穷人。
19999 交个朋友?
贵一点的屏风确实要 2 万。
非凡大师,果然不是普通人系列。
AI故事讲得溜
这次苹果和华为的发布会,都拿 AI 做文章。
苹果推出的 iPhone 16,搭载了 A18 芯片,专为苹果的人工智能软件「Apple Intelligence」设计。
该软件旨在提供信息总结、邮件撰写和照片整理等服务。
具体来说,AI 撰写邮件、短信和各类文件,或者生成表情包;输入文字,搜索过往照片、视频;可以自动归纳各类邮件和软件,并生成摘要替代原先的推送等。
然而,一篇发表在《华盛顿邮报》上的测评显示,它在某些情况下会制造错误信息。
在测试中,Apple Intelligence 在生成信息摘要时经常出现错误,如错误地总结邮件内容或误解文本含义。
目前,Apple Intelligence 存在准确性问题,并且对电池寿命影响也不乐观,在预览测试中,使用 Apple Intelligence 的 iPhone 电池消耗速度比平时快四小时以上,且完整的 Apple Intelligence 功能尚未完成。
而且,目前国行版暂不支持 AI 功能。
Apple Intelligence 目前仍在进行美国英语版测试,今年 12 月份推出本地化英语版本。
中文、法语、日语和西班牙语版本将于明年正式推出。
华为 Mate XT 非凡大师也讲了 AI 故事,搭载小艺 AI 助手,可提供即时的问答解惑;能够更好对照译文与原文的 AI 翻译;还可以进行 AI 扩图、AI 消除等操作。
苹果 iPhone 16 和华为 Mate XT 非凡大师,你喜欢哪个?评论区聊聊吧。
以后我们会带来更多好玩的AI话题,也欢迎大家进群交流。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB