AI 的「phone use」竟是这样练成的,清华、智谱团队发布 AutoGLM 技术报告

在 CNCC2024 大会上,智谱推出了 GLM 第一个产品化的智能体(Agent)——AutoGLM,只需接收简单的文字/语音指令,它就可以模拟人类操作手机,进而帮你:

  • 在微信上「给老板的朋友圈点赞并写评论」,
  • 在淘宝上「购买某一款历史订单产品」,
  • 在携程上预订酒店,
  • 在 12306 上购买火车票,
  • 在美团上点个外卖,
  • ……

另外,AutoGLM 也可以对网页进行操作,比如“检索知识图谱最新的学术期刊发表内容且只看北大核心”。

AutoGLM 的出现,让 AI「phone use」与网页操作不再是设想。


日前,智谱和清华团队在预印本网站 arXiv 上发布了 AutoGLM 的技术报告。

论文链接:

https://arxiv.org/abs/2411.00820

项目地址:

https://xiao9905.github.io/AutoGLM/

技术报告主要内容如下

  • AutoGLM 是 ChatGLM 系列中的一个新产品,旨在作为基础智能体,通过图形用户界面(GUI)自主控制数字设备,实现更进一步的 AI「phone use」。
  • 研究主要贡献包括:设计了一个「基础智能体解耦合中间界面」,有效解耦规划和执行行为;开发了一种「自进化在线课程强化学习框架」,实现了鲁棒的错误恢复和性能提升。
  • 在安卓设备控制方面,AutoGLM 在 AndroidLab(VAB-Mobile)上的成功率为 36.2%,在流行 APP 的常见任务上的成功率为 89.7%。揭示了基础智能体技术在未来人机交互中的广泛潜力。
  • 在网页浏览方面,AutoGLM 在 VAB-WebArena-Lite 上取得了 55.2% 的成功率(第二次尝试后成功率提高到 59.1%),在 OpenTable 评估任务中取得了 96.2% 的成功率。

AutoGLM 是如何炼成的?

在开发过程中,AutoGLM 团队采用了多项先进技术,以克服基础模型在真实环境中执行任务的挑战。

  • 预训练:通常,互联网上的文本语料库中缺乏智能体相关的数据,使得 LLM 难以有效充当智能体。
  • 多模态大模型:LMM 对于理解和操控 GUI 至关重要。
  • 行为克隆(监督微调):行为克隆是从头开始使用高质量专家轨迹数据训练智能体的关键策略。
  • 课程学习:智能体任务通常难度差异显著,因此通过课程计划逐步增加训练难度非常关键。
  • 奖励建模(RM):为了让基础智能体能够通过在线强化学习(RL)获得监督,适当的奖励建模至关重要。
  • 强化学习:相比于行为克隆,狭义的 RL 能更好地从失败中学习。

在开发过程中,研究团队发现中间接口设计对于在基础智能体中解耦规划和执行(grounding)行为至关重要。

通过这种方式,可以分别提高智能体的规划和执行的能力。

评估结果

安卓端评估

他们在 AndroidLab(即 VAB-Mobile)和常见的安卓 APP 上的高频任务中评估了 AutoGLM 的能力。

结果表明,AutoGLM 在 AndroidLab 上的成功率为 36.2%,在所有对比的智能体中表现最佳。

网页端评估

他们使用 VAB-WebArena-Lite 和在线人类评估数据集 OpenTable 进行了交互式基准测试,在这些环境中优化训练 AutoGLM。

实验结果显示,AutoGLM 在该基准测试上显著提升了表现,缩小了自主智能体与人类之间的性能差距。

未来,AutoGLM 将进一步完善其模型和应用场景,加速智能助手在数字化生活中的普及。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

快手上线“可灵AI”APP,抖音“即梦AI”最大对手来了?

Tech星球独家获悉,快手已先行在App Store上线了“可灵AI”独立APP,加码在移动端的AI创作布局。产品侧方面,快手“可灵AI”已形成了网页版、APP、小程序、海外版等多端跨平台的产品矩阵。


据官方描述,“可灵AI” APP是新一代创意生产力平台,基于快手自研的可灵大模型和可图大模型,提供视频、图片生成与编辑能力。

进入“可灵AI”APP后,可以看到AI视频、AI图片等内容创作区,以及其他用户创作好的AI短片和素材。

Tech星球体验发现,AI图片或AI视频的创作流程并不复杂。点击底部导航栏的“+”号后,可进入AI视频或AI图片的创作过程中。

以AI视频为例,用户可以选择图生视频或文生视频,两者的区别就是一个以文字描述来生成相应的视频内容,一个则是则能将静态的图片转化为动态的视频。

在文生视频中,用户需要描述一段幻想的画面和动作,例如,输入“魅力的油画少女,柔光落在她脸上”后,选择画面质量、视频时长、视频比例后,即可生成与提示词相匹配的AI视频。

“可灵AI”APP内生成的视频时长有5秒和10秒两个方案,最长可达10秒,与主流的同类型产品差不多。不过,作为对比,如抖音的“即梦AI”在生成时长上会细分出3秒、6秒、9秒、12秒等,而且加入了运镜模式,有了较多的创作空间。

可灵AI内容的创作过程中需要消耗灵感值,用户每次登录都能免费获得一定数量的灵感值,用于图片和视频的生成。灵感值消耗完后,需要开通会员获取灵感值,还能享受高清画质、内容无水印等特权,价格为66元/月。会员付费也是当前“可灵AI”APP的主要商业变现方式。

总体上,“可灵AI”APP能够满足用户日常的创作需求,但相比于功能上更加完善的可灵网页版,仍有部分实用的功能,如运镜、创意想象力参数等并未实装,不排除后期版本中会同步网页版的这些功能。

去年以来,AIGC(人工智能生成内容)市场呈现爆发式增长。根据量子位智库数据显示,2023年中国AIGC市场规模约为170亿元,预计2025年之前,中国AIGC市场规模增长率都将维持在25%左右,2025年市场规模将达到257亿元。

市场规模的扩大,吸引了来自百度、阿里、抖音、腾讯、快手等互联网大厂的投资布局。

譬如,快手的可灵AI已成为快手当前主推的AI产品,产品自诞生以来,就受到了来自公司高层的重视,并获得了内部大量的流量和资源倾斜。在10月举行的2024中国计算机大会上,快手副总裁、大模型团队负责人张迪介绍,自今年6月发布以来,可灵AI已有超过360万用户,累计生成3700万个视频和超过一亿张图片。

同为短视频平台的抖音,也发布了同类型的“即梦AI ”APP,这款产品被外界视为快手可灵AI的最大竞争对手,作为国内两大短视频巨头,在AI创作领域,谁能率先拔得头筹呢?



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

第一批AI明星公司,开始被大厂收购

继Google收购Character.AI两个多月后,中国AI大模型领域也进入并购整合的加速期。最近的例证是,一家由95后博士创办的AI垂直领域大模型公司波形智能,已被智能手机厂商OPPO收购。


与此同时,包括CEO、CTO在内的多位波形智能团队核心成员已经集体入职OPPO。

波形智能成立于2023年,由95后博士姜昱辰创立。姜昱辰本科毕业于浙江大学竺可桢学院,之后获得苏黎世联邦理工大学博士学位,师从国际著名学者Ryan Cotterell,专攻自然语言生成方向(包括LLM、长内容生成、机器翻译),曾在微软亚研院从事大语言模型的训练与推理。

2024年9月15日,姜昱辰在即刻上转发一篇关于创始人模式思考的文章,并重点标注了其中的一段话:“事实上,CEO在做每个决策的时候都至少会产生两个影响:第一,决策本身的后果。第二,一个能够做出更好决策或更差决策的新组织。”

波形智能成立时间不长,但是因赶上2023年AI大模型的创业热潮,加之其创始团队的精英背景,使得波形智能快速拿到两轮融资,也吸引了多家投资机构的关注。2024年1月,波形智能刚完成千万元级Pre-A轮融资,由蓝驰创投领投,西湖科创投、老股东藕舫天使跟投,以及蚂蚁集团董事长兼CEO井贤栋等个人投资者也参与投资。据波形智能官方披露,公司旗下的AI生成式产品蛙蛙写作上线一年,注册用户就超过30万,生成将近200亿字数的文本,付费用户平均每天使用时长超过6小时。

而加入OPPO公司这个决定,对姜昱辰和团队来说算不上悲壮。相比于前微软(亚洲)互联网工程院副院长简仁贤创办的AI公司竹间智能,因为面临巨大的现金流压力而倒闭,姜昱辰和波形智能进入OPPO,相当于有了一个结实的后盾——对她而言,这意味着能减轻融资和现金流的财务压力。波形智能在后续的声明中表示,“产品和公司仍在正常运营,均不受影响。”

更重要的是,智能手机借助AI大模型的能力正在迎来新的增长空间。OPPO首席产品官刘作虎告诉《中国企业家》:“在AI人才上,我们希望吸引全球的高端人才进来,因为我们认为智能手机是AI应用体验最好的载体。况且,OPPO一直在深耕全球市场,在全球有6亿多的用户。”

波形智能被OPPO收购,也侧面反映了国内AI大模型领域已发展到了新阶段。

今年8月,创新工场联合CEO汪华在接受《中国企业家》采访时就曾表示,“现在大家投超级模型公司和超级Infra公司的已经变少了,本质上那一波的投资已经开始做收敛了。有一些小的模型公司,可能会被收购,或者互相合并,大家整个聚焦到落地和应用了。”

此外,汪华强调:“每隔一段时间,行业就会快进到下一阶段,上一阶段会发生一些整合。并不是说上一阶段的公司就不是好公司,只是上一阶段已经投了足够多,市场上已经有足够多的玩家。接下来,可能并不需要新的玩家,而是在现有的玩家里面决出胜者。”

精英创业团队

波形智能之所以能吸引众多投资机构和外界的注意力,核心之一在于其精英的创始团队背景。创办波形智能之前,姜昱辰…

(OP continues…)



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

副业做的应用获25万用户, 全职创业却失败,AI创业这么难吗?

我开发的 AI 应用有 25 万用户,我感觉要起飞了,于是辞掉工作,准备大干一番。
结果没想到开局即巅峰,突然就完蛋了。


这几天,一个悲催的程序员创业故事在社交网络上流传,引发了人们的深思。
故事的主人公,Reddit 用户 mmoustafa 去年开始以搞副业的方式开发了一个可通过 iMessage 和 SMS 使用的通用 AI 个人助理「olly.bot」。它基于 OpenAI 的大模型,此外还有一系列方便有用的功能,如网络搜索和提醒。
olly.bot 精准击中用户们的痛点,应用集成在 iMessage 和 WhatsApp 中,这意味着你可以在 iOS、macOS、Android 和 Windows 上本地使用它。具体来说,它可以查看图片、阅读 PDF、收听语音备忘录、生成图片、浏览网页等,随着开发的持续,能力还在不断增多。
不用注册,几乎不受 ChatGPT 的地区限制,又可以联网还免费,看起来很吸引人。
为了宣传自己的项目,作者不断把它发布到 product hunt 和很多 Reddit 的板块上,它的用户量很快开始疯狂增长。当有一些 AI 领域大 V 开始在 上分享它时,该应用曾经在一个月内增加了 3.5 万新用户。
一个大模型工具,在吸引用户的过程中一直免费的,这给制作人员带来了压力。作者一直通过微软初创公司使用 Azure 积分来支付 OpenAI API 的成本,并构建了自己的消息服务(这是最难的部分),所以服务器成本每月不到 500 美元。
终于,作者对 50% 的月度增长感到信心十足,应该会持续增长,然后开始赚钱了吧。
4 个月前,此人辞去了工作,开始了创业之路。明星 AI 应用应该如何变现呢?他选择了一条「再正常不过的路」:缩减免费版的服务,要求用户买会员付费才能体验完整版。
于是,他的每周活跃用户从 7 万瞬间下降到 9 千,每月 4 美元的付费用户只有 400 人左右。面对惨淡的经营,他不得不不断降价才能获得看起来像样的转化率。开始收费之后,olly.bot 的增长速度还不到免费时的 1/10,潜在的用户显然被吓跑了。
现在怎么办?辞职也辞职了,App 也凉了,还欠着抵押贷款,有什么起死回生的秘诀吗?求大佬指点迷津。
网友:你策略有问题
好好的热门 App,一开始付费就暴死,这段经历实在是让很多立志创业的人感到背后一凉。
社交网络上,大家在感叹之余也在献计献策。
有网友说:「永远不要让免费产品付费。一开始就应该推出付费产品,或者进行试用,让人们知道试用期结束后必须付费。」作者表示十分赞同,并说道:「产品符合市场需求(Product / Market Fit,PMF)实际上应该是产品价格(Price)符合市场需求。」
但问题是「如果从一开始就全额付费,也许永远都无法获得 1000 名用户」。的确,一个应用程序付费的前提是用户认为该应用有使用价值,应用一推出就全额付费,用户可能连使用机会都没有。
当然,有一些策略可以选择,例如,免费付费套餐,提供试用期;提供永久免费套餐,并在付费套餐中提供实用功能;针对企业提供更高级别的套餐。
总的来说,产品付费需要找到一个平衡点。如果设置了太多付费功能,人们会生气,并给应用打差评,或者干脆去寻找可以免费满足其需求的应用。当你达到让免费用户满意并实现增长的最佳点时,就可以尝试添加人们愿意付费的功能。
这些建议都很有道理,olly.bot 的作者 mmoustafa 也一一回复并表示了感谢。不过如你们所见,对于目前的情况来说,很多都已是事后诸葛亮了,能够破局的方法似乎不多。
一位网友指出:「作者的应用程序每周活跃用户 7 万,每月 4 美元的付费用户只有 400 人左右,400/70k ≈ 0.57%,对于免费增值业务模式来说,这个百分比都非常低。这意味着人们使用该产品是因为它是免费的…… 我的个人建议是重新找一份工作,并在业余时间从事该项目。」
爱好可以有,但总之先重新进厂打工吧。
写应用创业,比想象得要难
去年 3 月,OpenAI 推出了 ChatGPT API,并按照使用量收费,单次调用价格比前一代下降了 90%,这让很多个人开发者发现了新技术商业化的途径。
在人们的愿景中,在先进大模型技术的周围,未来或许会出现一系列提供各类服务的应用。调用大模型 API 的开发者无需关注昂贵的大模型技术,大模型厂商也无需关注所有细分的场景。
然而到目前为止,虽然各家大模型公司提供的 API 已经降价了几轮,但还鲜有出现靠大模型应用来致富的例子出现。
更为让人关注的是,上周四 OpenAI 的 ChatGPT search 已正式发布。除了会员和 SearchGPT 候补名单上的用户,未来免费版的用户也会获得使用权限。
大厂的收割来得猝不及防,但仔细一想也在预料之中。
如果你是一个硬核技术人员,正在基于自己的兴趣构建产品,对于搞副业转正这件事,你有什么建议?

参考内容:
https://www.reddit.com/r/SideProject/comments/1gds937/i_got_250000_users_quit_my_job_and_then_growth/



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

ChatGPT新域名曝光,史上最贵顶级域名之一!

图片来源:由GPTNB生成

HubSpot联合创始人兼首席技术官Dharmesh Shah宣布,早些年购买的顶级域名chat .com,已经卖给了OpenAI,现在可以跳转到ChatGPT。

OpenAI首席执行官Sam Altman公开确认购买了该域名,没有说收购价格。


但肯定比之前1100万美元收购的AI.com(也是跳转到ChatGPT)贵很多。

Dharmesh也没有直接说,不过技术出身的他想玩个字谜游戏让大家猜一猜,或者直接放在推理很强的o1模型中推测一下。

图片来源:由GPTNB生成

谜题: Dharmesh以 1550 万美元购买了 “chat.com”。他购买这个域名是为了一个项目。他通常不出售域名,但当他出售一个域名时,几乎从不亏本。

OpenAI是这个域名的完美归宿,所以决定把它卖给OpenAI。他在OpenAI成立之前就认识Sam十多年了,Dharmesh不喜欢从他朋友的人身上获利。

他多次宣称自己非常喜爱 OpenAI这家公司,并且一直想拥有OpenAI的股份。他今年早些时候曾不谦虚地自夸说他现在是 OpenAI 的投资者。他目前生活非常富足,不需要出售域名所得的现金。

你认为他以多少钱出售chat .com域名?其中OpenAI股票的百分比是多少?

我们将这段谜题放在大模型中让它推理,并给出详细的流程和结果:

  1. Dharmesh的购买成本和出售习惯:Dharmesh以1550万美元购买了chat.com,并且他通常不会亏本出售域名。这意味着出售价格至少要高于1550万美元。
  2. 与OpenAI的关系和价值:Dharmesh已经认识Sam超过十年,对OpenAI表达了强烈的认可,并已经是OpenAI的投资人。这种关系和他对OpenAI的喜爱可能会影响到他对出售价格的考虑。考虑到他不希望从朋友中获利,他可能会提供一个相对合理而非最大化利益的价格。
  3. 财务状况和动机:Dharmesh不需要现金,所以现金支付的压力较小。由于他希望获得OpenAI的股份且已经是投资者,很可能他会更倾向于通过股份的形式获得部分或全部的支付。
  4. 合理的价格范围:如果我们假设chat.com对于OpenAI的重要性和潜在价值(特别是在AI和聊天相关的领域),出售价格可能会在2000万至3000万美元之间。一方面,这个范围超过了原始购买价格,确保不亏本;另一方面,这也是一个合理的市场估值范围。
  5. 股份的比例:由于Dharmesh希望获得OpenAI的股份,且不急需现金,可能很大一部分支付会以股票形式进行。假设总价格为2500万美元,其中可能有一半即1250万美元是以现金支付,另一半1250万美元通过OpenAI的股份支付。这种比例允许Dharmesh继续参与OpenAI的增长,同时保有一定的流动性。

所以,AI推测Dharmesh可能以2000万—3000万美元区间的价格出售了chat.com,其中约一半的价值是以OpenAI股票形式支付

其实就算Dharmesh的出售价格是保底1550万美元,这都是全球互联网史上最贵的顶级域名之一。

其他超贵的顶级域名包括,360.com 域名卖了1700万美元;NFTs.com域名为1500万美元;AI.com为1100万美元;Tesla.com为1100万美元;Connect.com为1000万美元;Hotels.com为1100万美元;Fund.com为999万美元。

至于OpenAI为什么花费巨额资金买这么一个域名,主要出于提升品牌形象、巩固领导地位和知识产权保护三个目的。

通过拥有这样一个简洁且高度相关的域名,OpenAI能够更加有效地构建起一个易于记忆的品牌形象,尤其是针对其聊天机器人产品和服务。Chat.com这样的顶级域名不仅有助于提高用户对OpenAI产品的认知度,还能加强品牌的专业感和权威性。

此外,通过这样的域名投资,OpenAI还可以加强对自身知识产权的保护。持有Chat.com意味着OpenAI可以在一定程度上控制与“chat”相关的在线身份,减少混淆并强化其在AI聊天技术领域的独特地位。

从长远来看,OpenAI购买域名可能为探索新的商业模式铺平道路。例如,基于Chat.com平台,OpenAI可以考虑推出更多面向消费者的聊天应用或是为企业客户提供定制化聊天解决方案的服务。这不仅有助于增加收入来源,还能促进OpenAI技术的应用多样化,使其能够触及更广泛的受众群体。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

快手上线“可灵AI”APP,抖音“即梦AI”最大对手来了?

Tech星球独家获悉,快手已先行在App Store上线了“可灵AI”独立APP,加码在移动端的AI创作布局。产品侧方面,快手“可灵AI”已形成了网页版、APP、小程序、海外版等多端跨平台的产品矩阵。


据官方描述,“可灵AI” APP是新一代创意生产力平台,基于快手自研的可灵大模型和可图大模型,提供视频、图片生成与编辑能力。

进入“可灵AI”APP后,可以看到AI视频、AI图片等内容创作区,以及其他用户创作好的AI短片和素材。

Tech星球体验发现,AI图片或AI视频的创作流程并不复杂。点击底部导航栏的“+”号后,可进入AI视频或AI图片的创作过程中。

以AI视频为例,用户可以选择图生视频或文生视频,两者的区别就是一个以文字描述来生成相应的视频内容,一个则是则能将静态的图片转化为动态的视频。

在文生视频中,用户需要描述一段幻想的画面和动作,例如,输入“魅力的油画少女,柔光落在她脸上”后,选择画面质量、视频时长、视频比例后,即可生成与提示词相匹配的AI视频。

“可灵AI”APP内生成的视频时长有5秒和10秒两个方案,最长可达10秒,与主流的同类型产品差不多。不过,作为对比,如抖音的“即梦AI”在生成时长上会细分出3秒、6秒、9秒、12秒等,而且加入了运镜模式,有了较多的创作空间。

可灵AI内容的创作过程中需要消耗灵感值,用户每次登录都能免费获得一定数量的灵感值,用于图片和视频的生成。灵感值消耗完后,需要开通会员获取灵感值,还能享受高清画质、内容无水印等特权,价格为66元/月。会员付费也是当前“可灵AI”APP的主要商业变现方式。

总体上,“可灵AI”APP能够满足用户日常的创作需求,但相比于功能上更加完善的可灵网页版,仍有部分实用的功能,如运镜、创意想象力参数等并未实装,不排除后期版本中会同步网页版的这些功能。

去年以来,AIGC(人工智能生成内容)市场呈现爆发式增长。根据量子位智库数据显示,2023年中国AIGC市场规模约为170亿元,预计2025年之前,中国AIGC市场规模增长率都将维持在25%左右,2025年市场规模将达到257亿元。

市场规模的扩大,吸引了来自百度、阿里、抖音、腾讯、快手等互联网大厂的投资布局。

譬如,快手的可灵AI已成为快手当前主推的AI产品,产品自诞生以来,就受到了来自公司高层的重视,并获得了内部大量的流量和资源倾斜。在10月举行的2024中国计算机大会上,快手副总裁、大模型团队负责人张迪介绍,自今年6月发布以来,可灵AI已有超过360万用户,累计生成3700万个视频和超过一亿张图片。

同为短视频平台的抖音,也发布了同类型的“即梦AI ”APP,这款产品被外界视为快手可灵AI的最大竞争对手,作为国内两大短视频巨头,在AI创作领域,谁能率先拔得头筹呢?



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

ChatGPT新域名曝光,史上最贵顶级域名之一!

HubSpot联合创始人兼首席技术官Dharmesh Shah宣布,早些年购买的顶级域名chat .com,已经卖给了OpenAI,现在可以跳转到ChatGPT。

OpenAI首席执行官Sam Altman公开确认购买了该域名,没有说收购价格。


但肯定比之前1100万美元收购的AI.com(也是跳转到ChatGPT)贵很多。

Dharmesh也没有直接说,不过技术出身的他想玩个字谜游戏让大家猜一猜,或者直接放在推理很强的o1模型中推测一下。

谜题:Dharmesh以 1550 万美元购买了 “chat.com”。他购买这个域名是为了一个项目。他通常不出售域名,但当他出售一个域名时,几乎从不亏本。

OpenAI是这个域名的完美归宿,所以决定把它卖给OpenAI。他在OpenAI成立之前就认识Sam十多年了,Dharmesh不喜欢从他朋友的人身上获利。

他多次宣称自己非常喜爱 OpenAI这家公司,并且一直想拥有OpenAI的股份。他今年早些时候曾不谦虚地自夸说他现在是 OpenAI 的投资者。他目前生活非常富足,不需要出售域名所得的现金。

你认为他以多少钱出售chat .com域名?其中OpenAI股票的百分比是多少?

我们将这段谜题放在大模型中让它推理,并给出详细的流程和结果:

  1. Dharmesh的购买成本和出售习惯:Dharmesh以1550万美元购买了chat.com,并且他通常不会亏本出售域名。这意味着出售价格至少要高于1550万美元。

  2. 与OpenAI的关系和价值:Dharmesh已经认识Sam超过十年,对OpenAI表达了强烈的认可,并已经是OpenAI的投资人。这种关系和他对OpenAI的喜爱可能会影响到他对出售价格的考虑。考虑到他不希望从朋友中获利,他可能会提供一个相对合理而非最大化利益的价格。

  3. 财务状况和动机:Dharmesh不需要现金,所以现金支付的压力较小。由于他希望获得OpenAI的股份且已经是投资者,很可能他会更倾向于通过股份的形式获得部分或全部的支付。

  4. 合理的价格范围:如果我们假设chat.com对于OpenAI的重要性和潜在价值(特别是在AI和聊天相关的领域),出售价格可能会在2000万至3000万美元之间。一方面,这个范围超过了原始购买价格,确保不亏本;另一方面,这也是一个合理的市场估值范围。

  5. 股份的比例:由于Dharmesh希望获得OpenAI的股份,且不急需现金,可能很大一部分支付会以股票形式进行。假设总价格为2500万美元,其中可能有一半即1250万美元是以现金支付,另一半1250万美元通过OpenAI的股份支付。这种比例允许Dharmesh继续参与OpenAI的增长,同时保有一定的流动性。

所以, AI推测Dharmesh可能以2000万—3000万美元区间的价格出售了chat.com,其中约一半的价值是以OpenAI股票形式支付

其实就算Dharmesh的出售价格是保底1550万美元,这都是全球互联网史上最贵的顶级域名之一。

其他超贵的顶级域名包括,360.com 域名卖了1700万美元;NFTs.com域名为1500万美元;AI.com为1100万美元;

Tesla.com为1100万美元;Connect.com为1000万美元;Hotels.com为1100万美元;Fund.com为999万美元。

至于OpenAI为什么花费巨额资金买这么一个域名,主要出于提升品牌形象、巩固领导地位和知识产权保护三个目的。

通过拥有这样一个简洁且高度相关的域名,OpenAI能够更加有效地构建起一个易于记忆的品牌形象,尤其是针对其聊天机器人产品和服务。Chat.com这样的顶级域名不仅有助于提高用户对OpenAI产品的认知度,还能加强品牌的专业感和权威性。

此外,通过这样的域名投资,OpenAI还可以加强对自身知识产权的保护。持有Chat.com意味着OpenAI可以在一定程度上控制与“chat”相关的在线身份,减少混淆并强化其在AI聊天技术领域的独特地位。

从长远来看,OpenAI购买域名可能为探索新的商业模式铺平道路。例如,基于Chat.com平台,OpenAI可以考虑推出更多面向消费者的聊天应用或是为企业客户提供定制化聊天解决方案的服务。这不仅有助于增加收入来源,还能促进OpenAI技术的应用多样化,使其能够触及更广泛的受众群体。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

AI时代的BBA来了!小鹏P7+18.68万元起售

“全球首款AI汽车”小鹏P7+正式上市发售。新车共发布三个版本,包括小鹏P7+长续航Max、超长续航Max以及限定版Max,官方指导售价分别为18.68万元、19.88万元以及21.88万元。


其中,小鹏P7+限定版Max提供星阙哑光灰车身配色、扶摇绿限定内饰色、limited edition标识等专属设计,并采用Alcantara定制座椅面料,首批限量发售500台。

image

至2025年1月31日24点前支付5000元定金用户,除8大基础权益外,全系车型还可享10000小鹏商城积分、至高5000元的置换补贴、赠送每年1500度充电卡(6年)的复购权益、低至0首付长至5年期的限时优惠金融方案,以及免费赠送天幕遮阳帘、簇绒脚垫、随车U盘的交付礼等购车福利。用户可通过小鹏汽车官方APP、官网、微信小程序以及全国销售网点进行车辆订购。

image

作为小鹏汽车未来十年成为面向全球的AI汽车公司的开山之作,小鹏P7+肩负着让更多人享受到“豪华行政级轿车”的空间与舒适、让更多燃油车用户享受到“高阶智能”乐趣两大使命。为此,新车充分考虑家庭用户的出行需求,开创性地将轿跑的姿态、SUV的空间、MPV的舒适巧妙融合,打破了传统汽车品类的界限,为用户带来全新的未来出行体验。

image

标配图灵AI高阶智驾,四大准则缔造能耗之王

发布会上,小鹏汽车董事长CEO何小鹏表示,传统汽车的豪华仅停留在外观和内饰配置上,而智能汽车时代,汽车豪华离不开智能科技。小鹏汽车依托对用户需求的深刻洞察,致力打造以智能、标配为核心的“科技豪华”,全面提升用户的出行体验。

image

基于此,小鹏P7+成为全球首款全系标配AI高阶智驾的汽车。新车首发搭载小鹏自研的AI天玑5.4.0、端到端大模型以及AI鹰眼智驾方案。其中,AI鹰眼智驾方案应用了行业首个单像素Lofic架构、双Orin-X智驾芯片以及26个感知硬件,感知距离提升125%,识别速度提升40%。AI天玑5.4.0对比5.3.0版本,整体拟人感提升4倍以上,变道成功率提升53%,绕行成功率提升155%。小鹏P7+图灵AI高阶智驾不用选装以及订阅、付费,做到全国都能开,全国都好用,基于2天迭代一次的端到端大模型,能实现月月OTA,让用户常用常新。

image

在智能座舱方面,小鹏P7+全面接入自研的X-GPT大模型,标配高通8295P座舱芯片,整体性能提升50%,让AI智能小P不仅能听得懂人话,做到“理解得更深、想得更全、行动得更准”,更能一句话完成座舱功能设定。座舱内标配15.6英寸中控大屏、10.25英寸全液晶仪表以及8英寸后排娱乐屏,可实现三屏互联,并打通了HUAWEI Hi-Car/Car Link跨设备的车控以及车机手机互联,让出行更加便捷、智能。

image

除了智能化,小鹏P7+的能耗管理同样处于行业领先水平。新车围绕系统化能耗解决方案,依托领先的车身设计及制造工艺、高效的三电管理策略、自研的X-HP 3.0智能热管理系统、精准的驾驶控制四大技术准则,最终实现每度电能跑10公里、每公里电费仅需4分钱的行业顶级水平。在媒体光电实测中,小鹏P7+的最高续航达成率为116.89%,成为名副其实的“纯电能耗管理之王”。发布会上,何小鹏表示,未来小鹏P7+的续航里程以及能耗管理还能通过OTA提升,进一步优化用户的纯电出行体验!

image

突破思维打造“空间怪物”,把“科技豪华”做成标配

作为SUV版轿跑,小鹏P7+在设计上做到了高颜值以及实用空间的完美兼容,为用户带来了超越“56E”豪华行政级的超大空间。新车在5056mm车身长度、3000mm轴距的基础上,将A柱前移、C柱隐藏并后移,使用了全球最薄的电池包——厚度仅109mm,最终做到同级第一的88%“得房率”,以及前、后排“双1米”的超大乘坐空间,可实现前后排同时跷二郎腿,二排头部空间达973mm,真正做到C级车D级空间的越级乘坐体验。后备厢开启后长、宽、纵深可达1.04×1.1×1.14m,带来同级最大的725L容积。在二排放倒的情况下,能够装下33个20寸行李箱,是名副其实的“空间怪物”。出色的乘坐空间和装载能力,使小鹏P7+进一步拓宽了用户的用车场景。

image

在追求大空间的同时,小鹏P7+的座舱运用了“云上空间”设计理念,还有多项豪华标配,带来舒适感的全面提升。新车全系标配同级最大的2.1㎡全景天幕,提升视野通透感并能隔绝99.9%的紫外线;全系标配Nappa打孔真皮“云感”舒适座椅,前后四座标配加热、吸风式通风以及按摩功能,后排标配“靠背、坐垫”双通风以及10°的电动无级调节,打造零压乘坐质感;全系标配的20扬声器高保真音响,采用7.1.4全景声场布置,带来媲美柏林之声的听觉享受;全系标配二排小桌板、8个手机槽、3个多功能挂钩、2个磁吸面板等实用配置,让便捷、体贴融入用户日常。此外,全车系配备了星瀑式氛围灯,支持迎宾模式、呼吸模式、音乐律动、开门预警四种特殊模式,能够根据不同的场景和氛围需求,为用户带来丰富多彩的视觉感受。小鹏P7+以全系豪华标配,打破行业的“选配”惯例,为用户奉上至臻的越级舒适体验。

image

细致打磨高级行车质感,高标准缔造全域安全

除了车内舒适性的“精雕细琢”,小鹏P7+研发团队还经过长时间打磨,为用户带来超越豪华行政级的高级驾乘体验。小鹏P7+使用了前双叉臂+后五连杆悬架设计,结合自研的动力学仿真模型,对比传统豪华标杆车型,做到减速带的冲击减少50%、坑洼路的震动能量整体减少24%、车身起伏减少1/3以及俯仰减少1/2的优秀效果。小鹏P7+的动力同样领先,百公里加速仅需5.9秒,百公里制动距离仅为35米,做到了提速快、减振好、不点头、不晕车。全车还经过36处隔音棉的优化,静音效果出色,全面超越传统豪华行政级标杆车型。

image

安全是一切豪华的底气。围绕这一理念,小鹏P7+整车开发全面基于最严苛的安全标准设计,符合中汽研C-NCAP(2024版)五星安全标准,并在制造工艺上使用全球量产最大的16000T一体化压铸机,打造出同级唯一的前后一体式铝压铸车身,护航全家出行。此外,小鹏P7+还拥有2000MPa超强度笼式安全车身,电池安全通过700J底盘球击测试,是行业均值的2.3倍。加上全系标配的7个安全气囊以及14项主动安全功能,形成全方位、多层次的主被动安全防护,全面保障行车人员的安全。

image

科技改变世界,小鹏P7+预定爆款

最后,何小鹏说道:“在科技创新的路上,总要有人敢为人先!”小鹏汽车历时3年精心打造的小鹏P7+,拥有6项行业首发配置、9项同级唯一标配、超过150项全系标配的科技、舒适性配置,重新定义了科技豪华,为用户做到了智能平权、舒适平权!

image

AI定义汽车时代,小鹏汽车将以小鹏P7+为起点,继续坚定不移地走科技创新之路,为消费者带来更智能、安全、舒适的出行体验,成为面向全球的AI汽车领军企业。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。


如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.comzhaoyunfeng@jiqizhixin.com

AFLOW 作者团队来自于 MetaGPT 开源社区。AFLOW 论文共同第一作者为香港科技大学(广州)的博士生张佳钇和 DeepWisdom 研究员向劲宇,共同通讯作者为 DeepWisdom 创始人兼 CEO 吴承霖(MetaGPT 代码作者、论文通讯作者)和香港科技大学(广州)的助理教授骆昱宇。作者还包括中国人民大学的于兆洋、滕枫蔚和程信,南京大学 LAMDA 实验室博士生陈雄辉,复旦大学的陈家祺和郑炳南,阿卜杜拉国王科技大学的博士生诸葛鸣晨(MetaGPT 论文共同一作),DeepWisdom 研究员洪思睿(MetaGPT 论文共同一作)和王金淋,蒙特利尔大学与 MILA 实验室的助理教授刘邦.

对于 LLM 从业者来说,让 LLM 落地应用并发挥作用需要手动构建并反复调试 Agentic Workflow,这无疑是个繁琐过程,一遍遍修改相似的代码,调试 prompt,手动执行测试并观察效果,并且换个 LLM 可能就会失效,有高昂的人力成本。许多公司甚至专职招聘 Prompt Engineer 来完成这一工作。

现在,Agentic Workflow 也有自己的自动优化工具了。

MetaGPT 开源了 AFLOW,它使用 MCTS 进行 Agentic Workflow 的自动搜索,可以完全自动地构建与优化 Agentic Workflow 问题,让我们不再需要手写代码、调试提示词。

这是对提示词自动优化的进一步探索,通过蒙特卡洛树搜索,完全接管了 Agentic Workflow 的生成与优化过程,表现远超其他工作流自动优化工作,甚至超越了对比的所有手工工作流基线。

什么是自动工作流优化问题?
现有的 Agentic Workflow 自动生成工作难以生成有效的工作流,它们往往需要人工介入初始设置,且无法全面捕捉到完成任务所需的工作流多样性。为了克服这些挑战,研究人员提出了 AFLOW 框架。利用蒙特卡洛树搜索(MCTS)技术来系统地探索和优化 LLM 的工作流。AFLOW 通过将工作流定义为代码可表示的节点和边,从而有效地捕捉 LLMs 调用之间的复杂交互。通过引入操作符的概念,AFLOW 进一步简化了搜索空间,提高了搜索效率。在多个基准数据集上的实验结果表明,AFLOW 能够自动发现和优化工作流,显著提高了任务执行的性能,同时减少了对人工干预的依赖。

示例

AFLOW 如何自动优化工作流?
AFLOW 利用蒙特卡洛树搜索(MCTS)来自动化地生成和优化 Agentic Workflow。在 AFLOW 框架中,Operator 扮演着至关重要的角色,它们是预定义的、可重用的节点组合,代表常见的智能体操作(比如审查,投票,生成)。这些 Operator 作为构建工作流的基础构件,被集成到搜索空间中,确保探索过程可以利用已知的有效智能体操作模式。引入 Operator 能够显著提升 AFLOW 框架的搜索效率和工作流的优化效果,减少在庞大搜索空间中的盲目探索。

AFLOW 提出了一种有效生成 Agentic Workflow 的方法,并全面展示了其在降低人力与推理成本上的惊人能力。这一研究成果有望加速 Agent 在各个领域落地的速度,将 Agentic Workflow 的构建过程从专家手工构建转变为小白自动构建。

Source: Article Link



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

权威中文大模型10月榜单出炉,商汤“日日新”金牌!

模型表现好,金牌少不了。
刚刚,中文大模型测评基准SuperCLUE发布《中文大模型基准测评2024年10月报告》
商汤日日新·商量大模型(SenseChat5.5)凭借出色的能力表现,总得分位列国内大模型第一梯队,获得金牌。


企业微信截图_17310468501961(1)
本次SuperCLUE10月报告覆盖23个国内模型,聚焦语言大模型的通用能力评估,分为三大维度:除了考察“文科”“理科”基础能力外,还有考察模型更高阶能力的“Hard”附加任务,总共2900+道题:
【理科任务】分为计算、逻辑推理、代码、工具使用测评集;
【文科任务】分为知识百科、语言理解、长文本、角色扮演、生成与创作、安全六大测评集;
【Hard任务】分为精确指令遵循测评集,复杂任务高阶推理测评集。
IMG_256
商汤SenseChat5.5在多项评测任务中均位列第一梯队,文科中语言理解、安全等维度表现突出,也是理科中逻辑推理、代码学科的“尖子生”。
值得注意的是,在【Hard】的两项任务——精准指令遵循和高阶推理中,商汤SenseChat5.5是唯一两项任务均位于国内第一梯队的大模型,体现了模型优秀的复杂推理智能。
SuperCLUE本次报告显示,国内大模型的能力与ChatGPT-4o-latest表现接近,o1-preview则在复杂任务中更为突出。未来,商汤将继续坚持基础大模型的持续研发与投入,不断提升真正高阶推理及“慢思考”能力。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB