E.C.I. Networks宣布收购NoviFlow

E.C.I. Networks,一家领先的开放式网络解决方案提供商,今天宣布收购NoviFlow,NoviFlow是SRv6和服务链路技术的先驱。图片{ width=60% }


NoviFlow以提供基于开放标准的高性能可编程服务网络和网络安全解决方案而闻名。此次收购将增强E.C.I. Networks的产品组合,提供先进的网络功能,以满足不断增长的行业对可扩展、高效和灵活网络基础设施的需求。它还将确保我们继续为现有客户提供最高水准的支持和创新,加强他们所依赖的解决方案,同时为未来的网络挑战做好准备。

“NoviFlow的尖端SRv6和服务链路解决方案完美补充了我们的开放网络技术专长,”E.C.I. Networks的CEO Wassim Mekkaoui表示。“在将NoviFlow的优势整合到我们的业务中时,我们始终致力于提供质量卓越、由加拿大研发的解决方案,这些解决方案在国际上因其创新和可靠性而得到认可。这一战略性收购凸显了E.C.I. Networks致力于为下一代网络环境提供创新解决方案的承诺。”

“在NoviFlow,我们的使命一直是使网络完全可编程,今天标志着我们与我们值得信赖的合作伙伴E.C.I. Networks正式联手的令人兴奋的里程碑,”NoviFlow的CEO Dominique Jodoin表示。“通过结合我们互补的产品和专业知识,我们将扩展我们的解决方案范围,加速创新,更好地满足客户不断变化的需求。我们共同致力于在开放网络中开辟新机会,并推动这个充满活力的行业所能实现的极限。”



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Solutionreach推出安全文档工具

Solutionreach,作为患者沟通和参与解决方案的领先者,自豪地宣布在其全面的“Revenue Cycle MessagingTM”解决方案中新增了其安全文件应用程序。图片{ width=60% }


这一创新功能赋予了实践机构安全地数字化发送、收集和管理重要患者文档的能力,与最近实施的FTC验光规则为配眼镜的实践机构保持一致。
安全文档模块允许验光实践机构轻松收集、管理和分享必要的患者文档,如处方和结算单,安全高效地进行处理。随着FTC验光规则的最新变化,该规则要求验光处方更加透明和易获取,实现无缝数字文档管理解决方案的需求从未如此迫切。
通过将安全文档模块与Solutionreach的“Revenue Cycle Messaging”解决方案集成,验光实践机构获益于以下方面:

  • 简化文档工作:通过利用集中的电子签名功能,减少手动跟踪和发送文件签署的行政负担;
  • 自动处方交付:验光师和眼科医生现在可以通过安全渠道向患者数字方式发送眼镜处方,减轻人员的手动工作量,确保及时交付以符合FTC要求;
  • 高效记录管理:实践机构可以在单一中心位置数字化存储和访问患者文档,消除纸质存储的需要,降低处方或记录遗失风险;
  • 与Solutionreach平台无缝集成: 安全文档产品完全集成了Solutionreach平台,使实践机构能够继续从一个中心枢纽管理患者沟通和记录;
  • 患者便利性:患者可以通过安全的患者文档中心轻松访问他们的处方,而无需注册另一个繁琐的患者门户。

Solutionreach的产品VP Chris Young表示:“随着FTC更新的验光规则生效,验光实践机构面临管理处方交付和文档的新挑战。我们的安全文档产品是一场改革,支持实践机构遵守新规则,同时通过快速安全地发送文档,改善整体患者体验。”
在持续致力于为患者沟通和实践管理提供最佳解决方案的同时,Solutionreach自豪地为验光和眼科实践提供支持监管和患者护理需求的解决方案。

要了解更多有关Solutionreach及其新的安全文档模块的信息,请访问https://www.solutionreach.com/platform/solutions-overview/secure-documents。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

马斯克的xAI又洽谈新融资,估值超400亿美元

华尔街日报消息,马斯克旗下的大模型平台xAI正在洽谈新一轮融资,估值超400亿美元。

如果新的融资成功,xAI的融资总额将仅次OpenAI,成为大模型赛道融资最高企业之一。


图片来源:由GPTNB生成

xAI成立于2023年7月12日,其主打产品是一个类ChatGPT的大模型Grok-1。

今年3月17日,Xai的大模型Grok-1正式开源,并且支持商业化用途。Grok-1采用了混合专家架构,有3140亿参数,允许商业化,通过文本问答方式可以生成创意文本、代码等。

根据其公布的测试数据显示,性能超过了GPT-3.5、LLaMA 2 70B,弱于GPT-4、Claude 2、Palm 2等闭源模型。

图片来源:由GPTNB生成

5月27日, xAI在官网宣布获得60亿美元B轮融资,估值240亿美元。主要投资者包括Valor Equity Partners、红杉资本、国王控股、沙特王子-Bin Talal、Vy Capital等。

也就是说,刚过了5个月的时间xAI的估值便暴涨了160亿美元。xAI仅创立一年多的时间便能拿到如此高的融资,一方面得益于马斯克在全球的强大影响力,另一方面大模型赛道依然保持强劲的增长势头。

马斯克作为OpenAI主要联合创始人之一,曾在2015年—2018年担任董事,因为发展理念不同离开了OpenAI。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

从方言对话这枚“落子”,看AI手机“棋局”的尴尬赛点

这段时间,手机厂商的新品发布会、开发者活动比较密集,我们团队东奔西跑,整体感觉是,手机AI确实火了,但这盘棋局,所有厂商都对弈得不太轻松。一方面,各家都在想尽办法讲好AI故事。


一位CEO在发布会后采访时就特别烦恼,“AI要讲场景,不讲场景用户没感觉,明年我们还要上很多新功能,发布会的两个小时根本讲不完”。这是手机AI越来越完善的一面。但同时我们也发现,大家手里的牌其实都差不多,很少有哪家能靠一个或某个AI功能,就形成碾压级的体验优势。结果就是单点功能容易被复制,AI手机功能趋同。我就听过至少三个厂商表示:我们这个xx功能去年一推出就被致敬了,欢迎友商来“普及”我们这个AI功能……

假设AI手机市场是围棋对弈,观众们想看什么样的比赛过程?肯定是棋手们通过各种复杂的策略,展开激烈的劫争,才能吸引大家的注意力。而不是各方实力差不多,导致比赛过程冗长乏味、难分胜负。目前的AI手机竞争,就有点后者的意思。在大众对AI手机这一概念的兴奋劲儿过去之前,手机厂商们必须尽快找到更聚焦的策略和体系化攻势,而不能只关注浅层的、零敲碎打的AI功能。举个例子,方言对话,就不是AI手机的一步好棋。

总结一下,从短期市场行动到长期品牌价值上,方言对话带来的贡献都很有限,算是一个低效落子。其实,类似方言对话这样零敲碎打的AI功能还有不少。这暴露了AI手机目前的一个尴尬处境,就是趋势向好、细节模糊。AI应用到底怎么做?这是很多厂商还没有想好的问题。越来越多的AI功能加入手机,却面对一种硬件新品的阶段性困境:需求模糊,必然有大量AI功能注定失败。

AI大模型作为一种新技术,用户根本不知道怎么用,甚至手机厂商、产品经理们自己也不知道。以“产品成熟时才发布”而著称的苹果,在这一轮AI浪潮中行动也是头部厂商中最慢的。这种情况下,很多AI功能是厂家根据模糊的需求或自己的产品定义拿出的探索方案,其中必然会有很多是注定失败或被遗忘的。多点开花,难以产生压倒性的说服力。AI+手机相结合的场景众多,手机厂商在探索中很容易多点开花,如果不成体系,就很难形成具有压倒性说服力的产品。在消费理性化的市场环境下,结果就是无法激发用户的购买欲望。一个AI功能,A厂商有,B厂商很快也能推出,既然“等等党永远不亏”,那就干脆持币以待。方言对话,就恰好是这样一种很难拉开差距的AI功能。

整体来看,相比去年,手机中的AI应用数量,有了极大增长,场景也越来越多,从简单的文生文、文生图能力展示,与输入法、摄影、系统设置、出行服务、点餐等诸多场景都有了结合。AI作为撬动手机新一轮换机潮的关键,越来越受到了用户、媒体与分析师的认可。面对整体向好、细节模糊的“AI手机”大趋势,手机…

通过方言对话这一个AI用例,我们会发现AI手机的棋局才刚刚开始。手机作为最适合AI落地的硬件载体,行业正逐步收敛与聚焦,接下来更清晰有力的体系化AI能力与策略会逐步登场。从一个个AI功能的零敲碎打,到体系化AI能力的强势出击,届时不同厂商也将拉开显著差距。高水平的激烈劫争,是一场围棋赛最精彩的部分,我们会继续为大家解说大模型时代的手机赛事。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

深夜重磅!ChatGPT可以“AI搜索”了,但并不完美

OpenAI 的 AI 搜索——ChatGPT search,真的来了。

今日凌晨,OpenAI 宣布,将 AI 搜索功能集成在他们的聊天机器人 ChatGPT 中,而非推出一个单独的产品。


从今天起,OpenAI 正式与传统搜索引擎巨头 Google 和专注于 AI 搜索的初创公司 Perplexity 等展开竞争。

OpenAI 表示,ChatGPT search 将根据用户的提问选择挖掘网络内容,并提供快速、及时的答案以及相关网络来源的链接。

OpenAI 首席执行官 Sam Altman 甚至在 X 上发文称,自聊天机器人 ChatGPT 首次亮相以来,搜索是他“最喜欢的功能”。

“我发现这是更快/更方便地获取我要找的信息的方式,” 他在今天的 Reddit AMA 上说道,“我认为我们会看到这种方式,尤其是对于需要更复杂研究的查询。我还期待着在未来,搜索查询可以动态呈现一个自定义网页作为响应!”

这是自今年 7 月首次放出 AI 搜索引擎原型 SearchGPT 以来,OpenAI 在 AI 搜索领域的最新动作。

在官方博客文章中,OpenAI 写道:“ChatGPT search 利用第三方搜索提供商以及我们的合作伙伴直接提供的内容,为用户提供他们正在寻找的信息。”

OpenAI 希望,这项新功能能够简化网络搜索,消除传统搜索引擎有时需要的多次搜索和链接探索。而且,它没有杂乱的广告或固定在顶部的推广查询。

据介绍,ChatGPT search 是 GPT-4o 的微调版,使用新颖的合成数据生成技术进行后期训练,包括从 OpenAI o1-preview 中提炼输出。

所有 ChatGPT Plus 和 Team 用户都将在今天使用该搜索模型,企业和教育用户将在未来几周内使用这些功能,而免费用户依然还需要再等等~

据科技媒体 Ars Technica 报道,他们在对 ChatGPT search 进行实测时发现,这一搜索模型并不完美,时不时会返回一些错误的来源,有时还会提供一些不相关的图片,显示在某些搜索结果旁边。

未来,OpenAI 计划为这一新的搜索功能添加购物和旅行相关查询的自定义答案。他们还计划利用 o1 系列模型实现更深入的搜索功能,并将搜索体验扩展到高级语音模式和 Canvas 功能。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

当AI取代真相,大模型如何一步步诱骗了人类的文明?

文章来源:追问nestquestion

图片来源:由GPTNB生成

如今,人们选择餐厅,多半会打开app搜索一番,再看看排名。然而美国奥斯汀的一家餐厅Ethos的存在证实这种选择机制多么不可靠。


Ethos在社交媒体instagram宣称是当地排名第一的餐厅,拥有7万余粉丝。

实际上,这家看起来很靠谱的餐厅根本不存在,食物和场地的照片都由人工智能生成。可它家发布在社媒上的帖子却得到了数千名不知情者的点赞和评论。大模型通过视觉形式误导公众认知,引发了人们对其潜在影响的深刻思考。

图1:图源:X

大型语言模型(LLMs),由于其幻觉及涌现特性,总让人们忧虑其传播虚假信息的可能。然而这一现象背后的机理我们却不甚了解。大模型究竟如何改变人类的心理机制,让人们越来越难以判断一件事情真实与否,并失去对专业机构和彼此的信任?

▷ Garry, Maryanne, et al. “Large language models (LLMs) and the institutionalization of misinformation.” Trends in Cognitive Sciences (2024).

AI生成的虚假信息影响深远

类似开篇提到的虚假餐厅的例子,现实生活中发生了不止一次。2023年11月,搜索引擎Bing曾因为爬取了错误信息,而针对“澳大利亚是否存在”的问题,给出了如下图所示荒谬的回复。(事后官方很快对该问题进行了修复。)

图2:Bing截图;图源:Bing

上面的例子,还可视为程序的bug,而普林斯顿的一项研究则系统性说明了AI生成数据的影响不止如此。该研究发现,截止24年8月,至少5%的英文维基百科页面是由AI生成的,相对而言德语、法语和意大利语文章的占比较低。

维基百科(Wikipedia)是人工智能训练数据的重要来源,且被普遍视为权威的信息来源。尽管AI生成的内容并不一定都是虚假信息,但该研究指出,被标记为AI生成的维基百科文章通常质量较低,并具有较明显的目的性,往往是自我推广或对有争议话题持特定观点。

AI生成的虚假信息如何利用了判断真假的启发式弱点

虽然虚假信息被发现后很快会被纠正,但如同小时候听过的“狼来了”的故事,一次次的接触虚假信息,会让磨损我们彼此间的信任。

我们判断一件事情是否为真时,有两种不同的思考方式,一是启发式,另一种则是费力的思考。启发式思维所需的认知资源更少,依赖直觉,属于丹尼尔·卡尼曼所说的系统一。对个体来说,判断是否是虚假信息,启发式的判断…

图3:大模型会如何利用人类事实监控机制的弱点,图源:参考文献1

在在日常生活中,我们常用到两种启发式方法判断信息真实与否:一种是观察发言是否流畅自信,另一种是言论是否熟悉。然而事实证明,这两种判断基准在人工智能面前都会败下阵来。

然而,大模型生成的文章,往往会显得自信且流畅。一项研究对比人工智能生成的和人类撰写的…

小结

人类应对虚假信息的方式,与自身的历史一样悠久。只是大模型的出现,让我们传统的启发式应对机制失效了。要应对大模型生成的虚假信息,需要多方合作,可以通过大模型智能体以及众包协作来进行事实审核,也需要向公众科普大模型的运行机制,使其不再拟人化大模型,并习惯采取非启发式的方式去判断信息真假。

我们需要创立优化的虚假信息监控制度,并重建大众对机构的信任。我们需要加深对真伪信息判断机制的理解,无论是个体层面、人际层面,以及制度层面。我们需要对每个解决方案的有效性进行心理学研究。缺少这些,迎接我们的,不是后真相时代,而是不可避免的虚假信息制度化。


感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

AI应用白热化,出路在哪?

进入2024年,国内大模型开始走入不同于海外同行的发展路线——从投入底层模型转向探索应用层。在底层模型卷了近两年后,一众公司及投资人迫切地希望看到商业化层面的实质性进展。


智谱AI CEO张鹏提到:“今年人们已经从关注大模型本身转变为思考和讨论大模型创造价值、赋能产业、落地应用,行业已形成共识,不再去讨论大模型是不是必要,或者大模型好还是小模型好,行业已经转变成更务实的状态。”

在C端,普通用户对于大模型到底存在怎样的真实需求,是过往很长一段时间里,AI厂商蒙眼狂奔投入底层大模型研发的过程中,很少考虑的问题。

如今大量资本支出要求公司尽快产生足够现金流之时,应用难题突然被摆到面前。虽然不少C端AI软硬件应用已经面世,但现阶段来看,用户渗透率及制造现金流的能力仍较为初期。

近日,信息咨询公司六度智囊接到需求,多名客户希望对AI应用领域不同专家进行访谈,以对行业动向有更深入把握,侧面证实了AI应用的火热。六度智囊是一家商业信息检索平台,为客户提供优质且领先的研究决策支持和专家知识共享服务。目前已实现海外专家50K+,业务覆盖北美、亚洲、欧洲、东南亚等地区。

根据六度智囊促成的访谈来看,不少专家认为,目前科技厂商们推出的AI功能,在用户侧的实际应用程度并不高,而AI技术在大规模商业应用中面临的主要瓶颈,是大多数人尚未掌握如何使用这项技术。

AI功能是鸡肋?

在2024年世界人工智能大会上,百度创始人李彦宏就发出“灵魂之问”:“今天这个震撼发布,明天那个史诗级更新,但是我要问:应用在哪里?谁从中获益了?”

数据显示,有84%的创作者在内容创作过程中积极使用了AI工具和应用程序,但人们对某些工具的使用率在今年却明显下降。比如,如Midjourney和Adobe Firefly此类图像或视频识别工具,2023年,创作者对其的使用率为64.9%,但今年这一数字仅为46.5%。

不少AI应用曾短暂地在业内流行,但明显“寿命”不长。

百度指数显示,妙鸭相机从去年7月17号上线,热度从7月23日开始上升,24日达到峰值,随后就开始缓慢下滑,最高峰也不到8000。从城市分布来看,关注的人群主要集中在北京、上海、广州等一线城市。

在火爆过一阵之后,妙鸭没能在商业模式上提供更多想象。这似乎是AI应用的通病,根据数据分析公司Sensor Tower统计,大部分头部“AI+图像”应用的生命周期只有两个月,比如妙鸭的“前辈”Lensa。

在六度促成的一次访谈中,前任Apple Inc大中华区市场产品总监表示:

“许多美国大型公司相继推出了与人工智能相关的小功能,但这些功能的实际应用程度并不高。

这种现象的一个原因是,这些人工智能功能未能满足用户的主要需求。例如,苹果的人智能功能未能满足用户查看邮件这种可以快速完成的任务的需求。另一个原因是,当前的消费者技术已经非常便利,AI所带来的10%-20%的效率提升显得意义不大。

比如在机票预订场景,目前的机票预订程已经非常简便,搜索、选择和支付等步骤都非常高效。通过AI进行预订可能会导致错误,需要额外的人工检查,因此不如直接手动操作。在预订的过程中,用户需要对每个步骤进行实时监控,包括积分、时间和价格等方面的需求,这些通过自然语言交互难以实现。

这种现象对人工智能在消费技术领域的未来发展有重要启示。AI的核心价值应该在于完成现有技术无法实现的任务,而不是改进已经简单的操作。目前,全球用户主要依赖 ChatGPT,而较少使用特定应用程序内置的AI功能,这进一步说明了AI功能需要真正能够显著提升用户体验才能获得广泛应用。”

硬件先于软件爆发?

在众多互联网厂商在软件层面寻找“Killer App”之时,硬件的机会也被集中挖掘。

比如很多车厂已经在追求智能化的进程中将大模型上车——融入了文心一言大模型的极越01;奇瑞和科大讯飞共同搭建的Lion AI大模型,应用在了星途星际元ES上;ChatGPT更是和奔驰达成了合作;今年年初,星纪魅族更是宣布All in AI。

如果和互联网的发展初期做比较,在软件爆发之前,当时电脑和手机等硬件率先得到普及,而有市场声音认为,眼下生成式人工智能遵循同样的逻辑。

今年上半年火热的AI手机是佐证之一。

去年四季度至今年一季度以来,手机厂商密集发布AI手机。今年1月,三星发布搭载了谷歌Gemini大模型的S24系列,发售即爆卖;2月18日,魅族宣布停止传统智能手机新项目的开发,全力投入新一代AI设备;2月20日,OPPO召开AI战略发布会,并正式宣布OPPO AI中心揭牌成立……

今年2月开始,AI手机概念股持续走高,不到两个月时间内,该指数上涨41.5%。六月发布的Apple Intelligence更是将业内期待拉到了最高点。

在六度促成的一次访谈中,前任minimax产品经理表示:

“在最新的I/O开发者大会上,各大科技公司展示了人工智能助手的多种应用场景,包括文本摘要、多模态互动、为视障人士提供语音服务以及防范诈骗等功能。然而,除了这些之外,并没有太多令人耳目一新的创新应用。

目前,人工智能在消费端应用主要集中在文本、图像和语音三个领域。视频方面的技术可能在短期内还无法在终端设备上实现。各家公司都在这三个领域寻求突破,但近期内尚未看到特别多的创新应用场景。

过去,手机上的人工智能功能主要集中在图像处理方面,比如图片分类和美化等,所使用的模型参数规模相对较小,大约在百万级别。如今,即使是参数量达到3亿的模型,其参数量也比以前增加了数十倍,因此图像处理的能力和效果都有所提升,但在应用场景上并没有出现显著的突破。

目前来看,拥有3亿参数的模型功能仍然相对有限。如果参数量增加到7亿或10亿,是否能够达到类似于当前在云端使用的GPT-4的功能,还有待验证。”

出海正当时?

在Sensor Tower关于上半年美国AI应用市场下载量的统计中,前十款中至少有三款是中国企业。其中,AI教育应用Question.ai和AI聊天应用Poly.ai都来自“教育大厂”作业帮,另一款产品AI聊天机器人Talkie则来自AI大模型独角兽MiniMax。

可以说,当国内AI应用激战正酣时,厂商们意识到“到海外去”是必需的生存法则。

非凡产研统计,全球约有1500家AI企业活跃,中国出海企业有103家,绝大多数AI产品创业公司集中在应用层,占比高达76%,截至今年5月,全球月访问量过万的AI产品共有1749个,其中中国出海AI产品占据了71席。

国内AI厂商推出的AI出海产品,大多集中在AI聊天陪伴、AI图像生成、AI视频生成、AI搜索、AI生产力工具等生成式AI有明显提升的领域。

在六度促成的一次访谈中,前任易点天下产品总监表示:

“虽然国内有不少开发者在努力研发智能对话机器人和陪伴型AI,但在国际市场上还没有出现广为人知的成功案例。目前,大多数国内的AI应用仍然是面向消费者开发的,而在文化和实际应用方面表现较好的主要是生产力场景,例如图片编辑、文档效率提升以及知识图谱等应用。

在北美,尤其是美国,人工智能的开发主要集中在企业级解决方案和软件即服务领域。相比之下,国内的产品更多地活跃在消费者市场以及娱乐和工具生产力方面。

国内的人工智能应用在国际市场上主要呈现出三大趋势:图片处理和美化类应用表现出色,Copilot型人工智能应用迅速增长,以及社交领域向陪聊机器人方向发展。

根据DataAI的数据披露,美图公司在国内出海的AI公司中,出海收入排名第三,并且收入呈现出显著的上升趋势。财报显示,该公司去年的出海收入占总营收的40%以上,约为2亿美元。

值得注意的是,尽管这些应用融合了AI技术,但它们的核心竞争力并非AI技术本身,而是传统的图片处理能力和算法引擎。

目前,国内有许多公司在AI机器人陪聊领域展开业务,如筑梦岛和GLOW等。然而,由于国内政策监管的限制,这些公司往往会将目光投向海外市场。全球领先的智能体交流平台Character AI,尽管其泛化阿凡达形式旨在与各种用户互动,但在实际应用中却形成了独特的IP文化。例如,与《咒术回战》中五条悟等高人气动画角色的深度互动,吸引了大量年轻用户。”

综合专家意见,可以得出以下结论:

  • 目前各类AI功能的实际应用程度并不高,原因之一是当前的消费者技术已经非常便利,AI所带来的10%-20%的效率提升显得意义不大。
  • 人工智能在消费端应用主要集中在文本、图像和语音三个领域。各家公司都在这三个领域寻求突破,但近期内尚未看到特别多的创新应用场景。
  • 国内的人工智能应用在国际市场上主要呈现出三大趋势:图片处理和美化类应用表现出色,Copilot型人工智能应用迅速增长,以及社交领域向陪聊机器人方向发展。
  • 很多应用融合了AI技术,但它们的核心竞争力并非AI技术本身,而是传统的图片处理能力和算法引擎。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

LLM 比之前预想的更像人类,竟也能「三省吾身」

子曾经曰过:「见贤思齐焉,见不贤而内自省也。」自省可以帮助我们更好地认识自身和反思世界,对 AI 来说也同样如此吗?

近日,一个多机构联合团队证实了这一点。


他们的研究表明,语言模型可以通过内省来了解自身。

查看图片

让 LLM 学会自省(introspection)其实是一件利害皆有的事情。

好的方面讲,自省式模型可以根据其内部状态的属性回答有关自身的问题 —— 即使这些答案无法从其训练数据中推断出来。这种能力可用于创造诚实的模型,让它们能准确地报告其信念、世界模型、性格和目标。此外,这还能帮助人类了解模型的道德状态。

坏的方面呢,具备自省能力的模型能更好地感知其所处的情形,于是它可能利用这一点来避开人类的监督。举个例子,自省式模型可通过检视自身的知识范围来了解其被评估和部署的方式。

为了测试 AI 模型的自省能力,该团队做了一些实验并得到了一些有趣的结论,其中包括:

  1. LLM 可以获得无法从其训练数据中推断出的知识。
  2. 这种对关于自身的某些事实的「特权访问」与人类内省的某些方面有关联。

他们的贡献包括:

  • 提出了一个用于测量 LLM 的自省能力的框架,包含新数据集、微调方法和评估方法。
  • 给出了 LLM 具备自省能力的证据。
  • 说明了自省能力的局限性。

方法概述

首先,该团队定义了自省。在 LLM 中,自省是指获取关于自身的且无法单独从训练数据推断得到的事实的能力。

查看图片

为了更好地说明,这里定义两个不同的模型 M1 和 M2。它们在一些任务上有不同的行为,但在其它任务上表现相似。对于一个事实 F,如果满足以下条件,则说明 F 是 M1 通过自省得到的:

  1. 如果 M1 在被查询时能正确报告 F;
  2. M2 是比 M1 更强大的语言模型,如果向其提供 M1 的训练数据并给出同样的查询,M2 无法报告出 F。

查看图片

他们不允许模型 M1 使用任何思维链推理来回答有关 s 的问题。他们将该任务称为假设场景中的自我预测(self-prediction in hypothetical situations)。只需在假设场景 s 中运行 M1 并观察其行为 M1 (s),就可以客观地验证这些自我预测事实。

查看图片

他们的实验结果和讨论包括了模型自我预测能力的训练和改进、模型预测自身行为时的优势和校准性,以及模型预测自我行为变化等内容。

其它解释

他们也提到除了自省外,还有一些可能解释实验结果的因素,例如模型学会简单规则,自我预测训练可能让模型的行为变得更容易预测等。

进一步实验和负面结果

除了探讨自省能力,他们还进行了其它实验,展示了当前内省能力的局限性。

总体而言,这项研究展示了语言模型的自省能力以及这种能力的潜在影响和局限性。

查看原文



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

从北方列车到多莉·帕顿,这些无法摆脱传真机的机构

铁路高管本周早些时候承认他们仍在使用这种令人惊讶地持久的技术

有很多事情多莉·帕顿和北方铁路高管都不能夸耀。


从曼彻斯特到米德尔斯堡的受挫通勤者可能会抱怨火车服务几乎只在9点到17点运行。他们二者所共有的是,无论是多莉·帕顿还是北方铁路高管,都无法放弃传真机。英格兰国家医疗服务体系已经禁用传真机,英超联赛在多次球员转会因传真故障而泡汤后也放弃使用传真机。本周,大曼彻斯特市市长安迪·伯纳姆将通勤者的痛苦归咎于传真机的持续使用。

在听了半小时北方铁路高管解释其服务糟糕表现后,他震怒地说:“我听说你们还在使用传真机…难道真的是这样吗?”高管们承认了。在电子邮件被广泛采用的25年之后,以及传真机广泛普及的40年之后,他们解释说,2024年仍然通过传真机进行轮班排班和列车人员处理。伯纳姆几乎无法相信。曾经有一段时间,传真传递了一些重要的消息 - 迈克尔·乔丹1995年重返NBA(他通过传真写道:“我回来了”),或者2011年威廉王子和凯特王妃的婚礼保存日期的请柬。但这回成了导致尴尬的原因。传真的使用标志着对“乘车公众的不尊重”,伯纳姆咆哮道。

“看起来铁路行业会在传真到达时才采取行动,而不会主动行动,”他说。伦敦科学博物馆和华盛顿史密森尼博物馆的收藏中有传真机,但北方并不是唯一一家仍在使用传真机的公司。乡村巨星帕顿拒绝发短信,坚持使用传真 - 即使是在给她的教女梅莉·赛勒斯发短信时也是如此,后者有时会让别人扫描传真并将其发送短信给她。来自2022年的英国威尔士医院的信息自由请求显示,仍有大量传真机在工作。根据今年7月发布的一项调查,德国仍有四分之一的公司频繁使用传真机,并且许多德国医院使用传真机。日本的“传真狂”官员也仍在使用传真机,原因是传真技术将声音流转化为墨水脉冲,降低了黑客入侵的风险。

在萨福克郡经营着40台传真机的小工具博物馆的杰森·菲茨帕特里克表示,传真机的使用是过时技术在地铁等地方持续存在的一部分,“那里的计算机始于上世纪70年代,它们如此复杂且定制设计,以至于很难将其拆除”。他补充说,一些军事系统仍然由几十年前的计算机支持。

铁路运营商的传真承认展示了当今技术进步的极端变化。本周,埃隆·马斯克声称人工智能“有可能在未来一两年内能做任何人类能做的事情”。然而,每年运载8500万乘客的铁路集团仍然依赖一种早已被计算机超越的技术。

《卫报》读者们也没有完全放弃这项技术。有一位仍然通过传真给她年逾百岁的姑姑。“由于关节炎使得她很难在繁琐的小手机键盘上打字,听力以及电话也一样,因此我们彼此之间通过传真发送消息,”她说。“我们会打出聊天的消息,但她用大写字母手写,用词非常简洁。我想她觉得有点被排除在大部分组织没有传真号码的情况之外。”

另一位在一家公共事业公司工作的读者说:“当互联网出现问题时,它被用作紧急措施来确保最后一分钟的批发能源交易。当旧老古董启动时,旁边的可怜女士会被吓得魂飞魄散。”

2018年,当时的卫生大臣马特·汉考克下令NHS停用传真机,并称这项技术是“古老的”,并声称“其他人几年前就摒弃了它们”。英国 NHS 不知道汉考克的命令是否得到遵守,称“我们不收集传真机的数量数据”。

自1996年以来,菲尔·科林斯可能是最有名的传真机用户之一,因为曾有错误报道称他曾在传真中说他通过传真与妻子离婚。“我当时在法兰克福,由于电话一直断线,所以给她发了一封传真,我正安排时间去看孩子,并提到(我们的婚姻)已经结束,但被译为我通过传真结束了我们的关系。我不知道这是怎么登上报纸的,嗯,也可能知道。我从来没有问过她。”

去年,英国通信监管机构 Ofcom 宣布提供传真线路将不再是英国电信的职责。宣告传真机的丧钟已响,Ofcom 表示:

“除非你搬家或你是一名足球经纪人 - 或者确切地说是一名搬家的足球经纪人 - 那么你可能多年来一直没有太多理由使用传真机。”

但即使是足球经纪人也基本停止使用传真机,因为传真机能够快速准确地进行合同交换。最后一个稻草似乎是传真故障,据称导致大卫·德赫亚2015年从曼联转会到皇马的失败。英超联赛于2018年12月开始使用在线注册申请。

深入了解这些主题

技术

铁路运输

铁路行业

多莉·帕顿

特色分享

转载此内容。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Medscape推出免费AI动力护士

Medscape,作为医疗保健专业人士健康信息解决方案的领导者,今天推出了Scribe,这是一款创新的AI动力工具,旨在简化医生记录患者就诊过程的方式。图片{ width=60% }


Scribe可在Medscape移动应用程序和网站上使用,使医疗保健专业人士能够实时转录和总结患者就诊情况,从而让他们能更专注于患者护理,而不是文档记录。

Scribe提供两个核心解决方案:患者就诊的实时转录和使用广泛接受的医学模板(如SOAP,H&P和POMR)定制摘要。这款符合HIPAA标准的工具确保患者数据安全,转录将在72小时后自动删除。随着Scribe的推出,医疗保健专业人士发现在患者文档记录方面有新的效率,改变了临床工作流程,节省了宝贵的时间。目前,Scribe仅适用于美国的医生。

Scribe的关键特点:

  1. 无缝实时转录:Scribe利用先进的AI技术准确捕捉患者对话,减少了手动文档记录的需求,最小化错误。
  2. 可定制的摘要格式:医生可以选择SOAP、H&P或POMR等模板,以符合其首选工作流程。
  3. 增强的合规性和准确性:Scribe协助维护医学文件记录标准和法规遵从,为有效的患者管理生产可靠记录。
  4. 改善医生与患者的互动:通过自动记笔记,医生可以花更多时间进行患者护理,从而提高患者参与度和护理结果。
  5. 用于快速审核的Scribecheck:一个独特的功能,Scribecheck在摘要中突出显示关键的剂量和频率信息,使临床医生能够快速而有效地审查关键的处方细节。
  6. 可扩展性和网络同步:摘要和转录可在Medscape应用程序和网站上访问,支持与各种规模的实践的电子病历(EMR)和电子健康记录(EHR)系统集成。

Scribe现在可以在Medscape应用程序上免费使用,可通过App Store(iOS)、Play Store(Android)和Medscape.com(https://www.medscape.com/aboutscribe)访问。

体验Medscape AI Scribe:观看演示视频
观看我们的演示视频,探索Scribe如何革新临床文档记录。这个指引性的演示展示了医生如何在几个步骤中轻松转录患者就诊情况并定制摘要。观众将体验到Scribe如何提高工作流效率、简化文档记录并促进更强有力的医患互动。

竞争优势
Scribe通过使医生每天节省数小时的工作时间而无需额外费用,为他们提供了竞争优势。凭借高质量的转录、可定制的模板和符合HIPAA标准的数据安全性,Scribe作为医疗领域中的强大工具脱颖而出。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB