互联网已经被 AI 污染的差不多了

文章来源:硅星人
原文链接:原文链接

图片来源:由GPTNB生成

最近一张用AI批量做号的微信截图流传在各个群里,有人自爆用AI在小红书做了一个庞大的虚假账号矩阵,通过售卖账号进行变现。

图片

这并非个例,你有没有一种感觉,现在刷手机的时候越来越分不清真实和虚拟了?当你浏览社交媒体、搜索信息或阅读文章和观看视频时,你真的能分辨出哪些内容来自人类,哪些又是AI的产物?更令人不安的是,你如何确定你所看到的“事实”不是AI的幻觉?

AIGC是一场互联网革命,不幸的是,它的兴起也伴随着内容滥用。


大量低质量、AI生成的关键词堆砌的内容倾泻到网络上,充斥在搜索引擎的结果当中,互联网上很大一部分内容已沦为垃圾信息。

小红书上的“细糠”可能是AI生成的,音乐平台则充斥着AI生成的歌曲,Spotify上的AI翻唱乐队,把流行歌曲的翻唱添加到正常歌单当中,与真实艺术家演唱的歌曲一起播放,获得了数百万的播放量并获得版税。最近,美国北卡罗来纳州一名男子被捕,他用AI制作了数十万首歌曲,并通过AI机器人刷播放量,获利超过1000万美元。

连你在亚马逊上买的电子书可能也是AI写的。一本使用ChatGPT撰写的关于野生蘑菇烹饪的电子书,甚至建议读者用舌头去尝一尝的方式来识别蘑菇种类。

图片

内容农场从未如此容易

“内容农场”是指为了牟取广告费等商业利益或出于控制舆论、带风向等特殊目的,快速生产大量网络文章来吸引流量。让用户在寻找有用信息时不得不耗费更多时间和精力。为了吸引眼球,一些账号甚至故意发布虚假信息或夸大事实,诱导用户点击。

发布“西安突发爆炸”虚假新闻的账号所属机构,最高峰一天能生成4000至7000篇假新闻,每天收入在1万元以上,而公司实际控制人王某某经营着5家这样的机构,运营账号达842个。

以前的内容农场借助廉价劳动力,批量产出文章,比如此前的山东“新媒体村”以及北马其顿共和国的假新闻影响美国大选等案例。现在,内容农场也正式从手工作坊进入了AI时代。

AI工具使得内容生成成本大大降低,单次浏览的收入即可覆盖成本。根据IT技术博主阮一峰的计算,使用某国产AI模型生成一篇文章仅需0.00138元,而单次浏览的广告收入约为0.00145元,这种模式使得内容农场比以往更容易盈利。…

完整内容

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

狮门影业片库卖去炼 AI ,潘多拉魔盒就此打开?

AI初创公司Runway近日与狮门娱乐(Lions Gate Entertainment)签订了一项合作协议,旨在将生成式人工智能技术引入电影和电视制作领域。
根据该协议,Runway将利用狮门娱乐的电影和电视剧内容库,开发定制的AI模型,以协助编辑和制作过程。


这些环节往往涉及复杂、重复的人工操作,带来各方面的高成本,尤其是在《疾速追杀》等动作片中体现得更明显。
中国观众比较熟悉的,来自狮门娱乐的代表作包括《饥饿游戏》、《暮光之城》、《敢死队》、《疾速追杀》以及《惊天魔盗团》等。

狮门娱乐寄希望于利用AI帮助简化制作流程。副董事长迈克尔·伯恩斯(Michael Burns)表示,预计此次合作将为公司节省大量成本,并为电影制作人、导演和其他创意人才提供更高的工作效率。“狮门拥有一支出色的创意团队,对 AI 如何帮助他们的工作有着清晰的愿景,我们很高兴能帮助他们将想法变为现实。”
正如《好莱坞报道》所指出的,与其他娱乐公司相比,狮门娱乐以坚持较低的预算而闻名。因此,狮门娱乐选择各种能降低制作成本的手段也是顺理成章的。
狮门娱乐安然度过了好莱坞罢工的影响,其 2024 财年第二季度的业绩超出华尔街预期,收入达 10 亿美元,增长 14%,净亏损较去年同期减少一半以上,至 8.862 亿美元。该公司表示,季度亏损主要与分拆一个有线电视频道 STARZ 的费用有关。
高管表示,狮门的电影业务表现更好,而电视业务受到大罢工的影响更大。2023年9月上映的《电锯惊魂10》获得了公司连拍 19 年的系列恐怖片中的全季最佳评价,并且以 1300 万美元的预算,获得了超过 1 亿美元的全球票房,体现了公司低成本制作的特点。

在狮门与 Runway 达成交易的前一天,美国加州州长加文·纽瑟姆(Gavin Newsom)签署了两项旨在保护表演者数字形象的法案,限制在电影和电视项目中使用 AI 数字复制品,要求表演者由律师或工会代表参与合同谈判,且已故表演者的数字复制品必须经遗产管理人同意使用。
这是SAG-AFTRA等表演者工会去年发起的好莱坞罢工的其中一个谈判成果的延申。工会支持该法案,但反对者认为,获取同意的过程将导致拍摄周期拖延和制作成本增加。
狮门坚称这项合作已经获得了公司内专业人才的首肯。伯恩斯说,“我们的几位电影制片人已经对其在前期制作和后期制作过程中的潜在应用感到兴奋。”目前关于该交易的具体细节还很少,比如当之前和新拍摄的影片被用作模型的训练材料时,制作人员是否会得到补偿。
2023年持续半年的好莱坞大罢工,对于AI技术的应用来说是一个“自证预言”式的影响过程,演员工会出于对AI滥用的担心,以及多次点播收入分成等其他问题而发动罢工;但制片厂又因为受到罢工损失,看到了进一步使用AI的重要性,因此都对AI技术应用持开放态度,充其量也是因为怕惹恼演员工会而投鼠忌器。
狮门财报显示,罢工预计在 2024 年和 2025 年给该公司造成约 1500 万美元的利润影响,另外也累积了 3000 万美元的额外成本损失。但该工作室乐观地认为,可以尽快重启节目制作。
至截稿时,美国演员工会(SAG-AFTRA)尚未对这一合作发表自己的看法。
值得注意的是,Runway 当前仍然面临一场侵权官司。该公司与 Stability AI 和 Midjourney 等其他 AI 公司一起被一群视觉艺术家起诉,因为这些公司在训练时使用了大型数据集如 LAION,该数据集包含数十亿张从互联网上抓取的图片。原告方认为他们的艺术作品未经同意被包含在这些数据集中。该诉讼最初于 2023 年初提交。2024 年 8 月,一位加州联邦法官允许该案件继续审理,目前此案还在审理中。
本案的结果有可能会对这些AI公司的产品商业化,和目前正在进行的合作产生影响。即使是正在规划中的基于狮门片库生成的模型,也将难以脱离基于大型数据集训练的基底模型。最坏的情况下,可能需要将很多工作推倒重来,而现有的视频生成效果也可能会被影响。
在国内,影视制作版权方大多都在财报或公开信息中引入了AIGC概念。但他们采取的主要方式,都是自己去做模型研发,而不是将自己的内容授权给外部合作伙伴。
也有少数例外,比如上海电影牵头成立研发共同体,训练中国动画学派大模型体系。上美影拥有的国风动画电影资产对外授权,一定意义上带有公益性质。
光线传媒、万达电影、华策影视、腾讯视频等的公开信息显示,AI已经植入动画或剧集的制作流程,或者成立AI研究团队。这些提到的AI技术都是在公司内部研究和开发的,例如腾讯在剧集上映的同时,推出角色IP授权的对话机器人,用的也是公司内部的元宝。
另一方面,拥有技术的快手、抖音、智谱、生数科技等,一直在尝试能获得著名IP或内容库的授权,但目前为止没有对外公布的合作消息。他们也只能采用自己请人制片的方式,来反向切入自有IP和内容领域,例如《三星堆:未来启示录》《山海奇镜之劈波斩浪》等。
9月初,快手启动「可灵AI」导演共创计划,汇聚李少红、贾樟柯、叶锦添、薛晓路、俞白眉、董润年、张吃鱼、王子川、王卯卯等9位电影导演,制作九部AIGC电影短片。
如果每一个AI视频制作的参与者,都必须同时在自研技术和自研内容方面“两条腿走路”,那么相对来说,IP和内容的壁垒仍然高于技术的壁垒。
Sora及其类似文生视频工具,今年初看起来确实高不可攀,令人焦虑。但是在大半年之后,它的发展轨迹被证明越来越接近文生图的经验,意味着开源模型总会有时间赶上。而且,现在处于领先地位的可灵、Runway等视频生成模型,效果也并没有原先演示的那样惊艳和“开箱即用”。
因此,版权方的耐心似乎比较充足,不急于现在切入。即使是狮门娱乐的这次合作,用例也不是以前被讨论的直接成片,而是故事板等初级工序,利用文生图做故事板等已经被写在了影视公司财报当中的自研AIGC技术部分里面。相对来说,模型技术研发者通过自制影片或IP来做能力展示,推销产品的心情可能更急切一点。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

狮门影业片库卖去炼 AI ,潘多拉魔盒就此打开?

AI初创公司Runway近日与狮门娱乐(Lions Gate Entertainment)签订了一项合作协议,旨在将生成式人工智能技术引入电影和电视制作领域。

根据该协议,Runway将利用狮门娱乐的电影和电视剧内容库,开发定制的AI模型,以协助编辑和制作过程。


这些环节往往涉及复杂、重复的人工操作,带来各方面的高成本,尤其是在《疾速追杀》等动作片中体现得更明显。

中国观众比较熟悉的,来自狮门娱乐的代表作包括《饥饿游戏》、《暮光之城》、《敢死队》、《疾速追杀》以及《惊天魔盗团》等。

狮门娱乐寄希望于利用AI帮助简化制作流程。副董事长迈克尔·伯恩斯(Michael Burns)表示,预计此次合作将为公司节省大量成本,并为电影制作人、导演和其他创意人才提供更高的工作效率。“狮门拥有一支出色的创意团队,对 AI 如何帮助他们的工作有着清晰的愿景,我们很高兴能帮助他们将想法变为现实。”

正如《好莱坞报道》所指出的,与其他娱乐公司相比,狮门娱乐以坚持较低的预算而闻名。因此,狮门娱乐选择各种能降低制作成本的手段也是顺理成章的。

狮门娱乐安然度过了好莱坞罢工的影响,其 2024 财年第二季度的业绩超出华尔街预期,收入达 10 亿美元,增长 14%,净亏损较去年同期减少一半以上,至 8.862 亿美元。该公司表示,季度亏损主要与分拆一个有线电视频道 STARZ 的费用有关。

高管表示,狮门的电影业务表现更好,而电视业务受到大罢工的影响更大。2023年9月上映的《电锯惊魂10》获得了公司连拍 19 年的系列恐怖片中的全季最佳评价,并且以 1300 万美元的预算,获得了超过 1 亿美元的全球票房,体现了公司低成本制作的特点。

在狮门与 Runway 达成交易的前一天,美国加州州长加文·纽瑟姆(Gavin Newsom)签署了两项旨在保护表演者数字形象的法案,限制在电影和电视项目中使用 AI 数字复制品,要求表演者由律师或工会代表参与合同谈判,且已故表演者的数字复制品必须经遗产管理人同意使用。

这是SAG-AFTRA等表演者工会去年发起的好莱坞罢工的其中一个谈判成果的延申。工会支持该法案,但反对者认为,获取同意的过程将导致拍摄周期拖延和制作成本增加。

狮门坚称这项合作已经获得了公司内专业人才的首肯。伯恩斯说,“我们的几位电影制片人已经对其在前期制作和后期制作过程中的潜在应用感到兴奋。”目前关于该交易的具体细节还很少,比如当之前和新拍摄的影片被用作模型的训练材料时,制作人员是否会得到补偿。

2023年持续半年的好莱坞大罢工,对于AI技术的应用来说是一个“自证预言”式的影响过程,演员工会出于对AI滥用的担心,以及多次点播收入分成等其他问题而发动罢工;但制片厂又因为受到罢工损失,看到了进一步使用AI的重要性,因此都对AI技术应用持开放态度,充其量也是因为怕惹恼演员工会而投鼠忌器。

狮门财报显示,罢工预计在 2024 年和 2025 年给该公司造成约 1500 万美元的利润影响,另外也累积了 3000 万美元的额外成本损失。但该工作室乐观地认为,可以尽快重启节目制作。

至截稿时,美国演员工会(SAG-AFTRA)尚未对这一合作发表自己的看法。

值得注意的是,Runway 当前仍然面临一场侵权官司。该公司与 Stability AI 和 Midjourney 等其他 AI 公司一起被一群视觉艺术家起诉,因为这些公司在训练时使用了大型数据集如 LAION,该数据集包含数十亿张从互联网上抓取的图片。原告方认为他们的艺术作品未经同意被包含在这些数据集中。该诉讼最初于 2023 年初提交。2024 年 8 月,一位加州联邦法官允许该案件继续审理,目前此案还在审理中。

本案的结果有可能会对这些AI公司的产品商业化,和目前正在进行的合作产生影响。即使是正在规划中的基于狮门片库生成的模型,也将难以脱离基于大型数据集训练的基底模型。最坏的情况下,可能需要将很多工作推倒重来,而现有的视频生成效果也可能会被影响。

在国内,影视制作版权方大多都在财报或公开信息中引入了AIGC概念。但他们采取的主要方式,都是自己去做模型研发,而不是将自己的内容授权给外部合作伙伴。

也有少数例外,比如上海电影牵头成立研发共同体,训练中国动画学派大模型体系。上美影拥有的国风动画电影资产对外授权,一定意义上带有公益性质。

光线传媒、万达电影、华策影视、腾讯视频等的公开信息显示,AI已经植入动画或剧集的制作流程,或者成立AI研究团队。这些提到的AI技术都是在公司内部研究和开发的,例如腾讯在剧集上映的同时,推出角色IP授权的对话机器人,用的也是公司内部的元宝。

另一方面,拥有技术的快手、抖音、智谱、生数科技等,一直在尝试能获得著名IP或内容库的授权,但目前为止没有对外公布的合作消息。他们也只能采用自己请人制片的方式,来反向切入自有IP和内容领域,例如《三星堆:未来启示录》《山海奇镜之劈波斩浪》等。

9月初,快手启动「可灵AI」导演共创计划,汇聚李少红、贾樟柯、叶锦添、薛晓路、俞白眉、董润年、张吃鱼、王子川、王卯卯等9位电影导演,制作九部AIGC电影短片。

如果每一个AI视频制作的参与者,都必须同时在自研技术和自研内容方面“两条腿走路”,那么相对来说,IP和内容的壁垒仍然高于技术的壁垒。

Sora及其类似文生视频工具,今年初看起来确实高不可攀,令人焦虑。但是在大半年之后,它的发展轨迹被证明越来越接近文生图的经验,意味着开源模型总会有时间赶上。而且,现在处于领先地位的可灵、Runway等视频生成模型,效果也并没有原先演示的那样惊艳和“开箱即用”。

因此,版权方的耐心似乎比较充足,不急于现在切入。即使是狮门娱乐的这次合作,用例也不是以前被讨论的直接成片,而是故事板等初级工序,利用文生图做故事板等已经被写在了影视公司财报当中的自研AIGC技术部分里面。相对来说,模型技术研发者通过自制影片或IP来做能力展示,推销产品的心情可能更急切一点。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

使神经网络更容易理解,促进科学发现,MIT刘子鸣团队新架构

神经网络是目前人工智能领域最强大的工具。Perimeter Institute for Theoretical Physics 的研究员 Sebastian Wetzel 表示,「当我们将它们扩展到更大的数据集时,没有什么可以与之竞争。


然而,一直以来,神经网络都存在一个缺点。当今许多成功网络的基本构建模块被称为多层感知器(MLP)。但尽管取得了一系列成功,人类仍然无法理解基于这些 MLP 构建的网络是如何得出结论的,或者是否存在一些基本原理可以解释这些结果。神经网络所表现出的能力就像魔术师一样,都是秘密,隐藏在「黑匣子」里。

人工智能研究人员长期以来一直想知道不同类型的网络是否有可能以更透明的方式提供同样可靠的结果。

2024 年 4 月的一项研究提出了一种替代神经网络设计,称为 Kolmogorov-Arnold 网络(KAN),它更加透明,但对于某一类问题,它几乎可以完成常规神经网络可以完成的所有事情。它基于 20 世纪中叶的一个数学思想,该思想在深度学习时代被研究人员重新认识。

「实现不可能」

典型的神经网络的工作原理如下:人工神经元(或节点)的各层通过人工突触(或边)相互连接。信息通过每一层,在那里被处理并传输到下一层,直到最终成为输出。边是有权重的,因此权重较大的边比其他边具有更大的影响力。在一段称为训练的时间内,这些权重会不断调整,以使网络的输出越来越接近正确答案。

神经网络的一个常见目标是找到一个数学函数或曲线,以最佳方式连接某些数据点。网络越接近该函数,其预测就越好,结果就越准确。如果您的神经网络模拟某些物理过程,则输出函数将理想地表示描述物理学的方程 - 相当于物理定律。

对于 MLP,有一个数学定理可以告诉你网络可以多接近最佳函数。这个定理的一个结果是 MLP 无法完美地表示该函数。

但在适当的情况下,KAN 可以。

KAN 进行函数拟合(连接网络输出的点)的方式…

完整内容请查看原文链接:https://www.quantamagazine.org/novel-architecture-makes-neural-networks-more-understandable-20240911/



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

售价高达 100 万的 AI 产品,有钱人排队求买,为什么?

文章来源:极客公园
原文链接:https://mp.weixin.qq.com/s/-xbHUC6a6uCQB6s-p6G0mw
图片来源:由GPTNB生成

从帝王将相到亿万富豪,永生一直是掌握权力和财富的人类金字塔尖阶层的执念。过去他们把财富投入到虚无缥缈的寻仙问道,以及延年益寿的生物科技,而随着 AI 的出现,赛博永生引起了富豪们的兴趣。


近日,笔者接触了石榴科技创始人 Frank,他做了一款未来有望实现「数字永生」的产品——从记忆承载-思想复刻-意识上传-最后到数字永生,高达 100 万的售价,却已有 10 多位 70 岁以上的香港富豪为之买单。

这款名为「意识永藏」的产品,通过定制个人化小模型,可以将一个人的记忆、经历和生活故事转化为数字化的个人记忆博物馆。这个博物馆不仅仅是一个静态的展示,而是一个动态的、互动的、并且能够随着时间不断更新和扩展的个人历史档案。

在具体的产品交付上,「意识永藏」有三方面的内容,包括个人的记忆库、基于个人记忆数据训练得出的个人分身小模型以及一个数字形象或者个人传记的外化效果呈现;在交付形式上,项目采用本地部署方式,将交互系统集成到用户的电脑中(系统包含一个数据库和一个小型 AI 模型),形成一个网页形态的个人化产品。

就是这个看起来并不复杂的产品,为什么能让精明的香港富豪豪掷百万?Frank 给我们讲了讲背后的故事。

图片来源:豆包

对于对高端定制服务有着强烈需求的他们来说,「意识永藏」正是为他们提供个性化记忆复刻的独特选择。对他们而言,再花一两百万来给记忆上一道保险并不昂贵。

但一两百万毕竟也是 7 位数的消费,一个仅仅只有五人左右的 95 后团队,到底是怎么打动这群富豪的?

关键还是在于情感需求的满足。

Frank 讲述了一个客户的故事。一位已经进入耄耋之年的老教授,退休多年,之前已经进过 ICU 病房,子女又因为他的身后事纠纷不少。

想到身体每况愈下,时间所剩无几,老教授想尽可能地在生前多留下一些东西,一来满足对子女的一些心理亏欠,二来也想好好回看自己过去这一生的路。

在进行完前期的信息采集和初步的模型调试后,团队用可灵大模型给老教授生成了一些和儿女相处的温馨的视频片段,看完之后老人忍不住掉泪,往日时光已不可追,但 AI 竟然可以如此逼真地还原过往,带他回去看了一眼。

笔者最初注意到这个产品,是被客单价百万的 AI 产品这个名号所吸引。毕竟现在市面上似乎很少有做到这么高客单价的 AI 产品?

但与 Frank 交流下来发现,AI 在这款产品中发挥的功能可能只占比 10%-20%,「我们现在对 AI 的利用还比较初期,集中在利用模型将将用户的语音转换成文本,以及通过文本到语音(TTS)技术来训练和模仿用户的声线和语调。」Frank 告诉极客公园。

在模型调试定制环节,「意识永藏」底层模型使用的是被称为「价格屠夫」的 DeepSeek,后者是幻方量化旗下深度求索推出的开源大模型。

在众多大模型中选择 DeepSeek,价格原因之外,也是因为项目是围绕个人记忆检索与反馈构建的,对于基础模型能力的要求并不苛刻,DeepSeek 能够通过提示词引导,准确检索信息并进行相关性反馈,已经足以完全满足需求。

要求比较高的环节在于对心理、情感表达的识别与反馈,毕竟每个人的情感与人生经历迥异,使得这使得模型在表达个体独特的情绪和情感时,面临更高的挑战。

为了精准捕捉这些微妙差异,团队一方面把 Prompt 优化得足够具体,使模型能够更好地理解和回应用户的个性化需求,另一方面,团队对模型进行了细致的微调,例如,通过设定特定情感的触发临界值,使系统能识别并模仿用户的情绪反应。

此外,团队还对个人的口头禅、语言习惯等细节进行了调校,确保模型在交互中更加贴合用户的语言风格与情感表达。

除了高昂费用的噱头,这个项目更长远的意义在于:AI 的出现,对于个人信息的记录带来了新的可能性。

相比于过去单调的信息存储式的记录形式,如自传式书籍、电影等,AI 实现了互动的重塑,它让记忆不再只是静态的片段,而是可以对话、追问的对象。

即使某些记忆开始模糊,AI 也能帮助检索并给予反馈,带来一种情感化的互动体验,这正是传统记录手段所无法比拟的。

并且,多模态技术还能让记忆变得更为生动:声音可以被复刻,影像和视频也能被重现。

借助 AI 技术,回忆变得更加立体和鲜活,让那些过去的瞬间仿佛历历在目。但这些看起来似乎并不是属于 Frank 团队难以复刻的差异化优势,可能换一家公司采用类似的思路,也能做出大差不差的产品。

那「意识永藏」的壁垒是什么?

答案可能是渠道。Frank 没有去卷大多数人正在争夺的主战场,而是选择了一个小范围的需要高度定制化服务的细分领域,后者获客非常艰难,毕竟高净值人群对服务的选择会更挑剔,Frank 现有的客户也基本来自客户小圈子里互相介绍而来,这种渠道壁垒,决定了其模式短时间内难以被取代。

现阶段,能让用户心甘情愿买单的 AI 产品并不多,何况是百万级客单价的 AI 产品。但 Frank 通过精准定位以及满足特定人群的个性化需求,借助 AI 在内的技术手段,成功让客户买单百万级产品。

这可能是一个相对极端的 AI 商业化案例,但也可以看出,在当下,AI 要产生价值,就是要对齐到有支付能力的明确需求。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

广告烧钱过亿,70%用户靠投流,大模型算不过成本账?

一个兽医博主在记录父亲深夜抢救母牛的过程中,使用Kimi查找“母牛传染病”的相关医学内容;一个生活博主在告诉大家如何用AI实现人生第一个13万的过程中,向用户展示如何用豆包生产内容;打工人上班途中在北京地铁1号线永安里站出口,看到智谱清言应用的大屏广告;好学的年轻人睡前在自己常听的播客节目里,听到MiniMax的植入……

广告投放,是当下大模型白热化竞争中的一个切面。大模型厂商们希望获得足够多的用户,讲一个大模型原生应用的故事。


但现实是,高额的成本、千万级的用户,都不足以支撑故事继续。绕了一圈,大模型厂商们还是需要回到现实:一个关于技术与商业化的永恒命题。


烧钱换增长,一个月广告投放过亿

谁也没有想到,B站成了AI时代商业化赢麻了的平台。

财报显示,今年第二季度,B站AI行业今年一季度广告收入同比增长超5倍,二季度金额环比一季度继续大幅上涨。一位科技UP主声称,自己与同行的商业投放合作档期基本都被大模型企业填满,3个月接了20单商业合作的UP主不在少数,甚至出现了不同大模型企业为了一个档期抢单“大打出手”的情况。

大模型创业公司最激进的是月之暗面,这家公司旗下的AI智能助手Kimi因长对话能力出圈,是时下最火热的大模型产品之一。Tech星球通过AppGrowning查询发现,今年3月开始,Kimi每个月的广告投放都高达上千万元。3月份,Kimi的广告投放还只有近1500万元,到了7月和8月,高达近5000万元。

广告为Kimi带来了海量的用户。今年3月20日,因为流量超过了规划,Kimi一度宕机。App Growing的数据显示,从3月到8月,短短6个月,Kimi的广告投入已经将近1.4亿元。

对于第三方平台的监测数据,月之暗面对Tech星球表示,以上数据不实。

一家成立不到2年的公司,月活用户400万,估值200亿元,商业化前景不明朗的企业,单月的广告投放高达上千万元,这放在过去几乎是匪夷所思的。可以作为参照对比的是,2020年,风头正盛的元气森林已经有了超级大单品气泡水,创造了27亿的营收,其中广告费有9亿,相当于每个月7500万元。

Kimi的广告投放几乎覆盖了除去抖音外的所有渠道,他们的逻辑是通过更多的用户来训练大模型。一位小红书的博主称,几乎每周都会有三四个Kimi的人过来询问合作意向。

另一个广告投放大户是豆包。一位曾在豆包负责用户增长的员工告诉Tech星球,仅仅在抖音上,豆包高峰期每天的投放就有60万。

Tech星球通过AppGrowning查询发现,今年6月豆包的投放达到了1.4亿元,相当于每天光投放就要花掉467万元,一个月的投放费用比Kimi半年都要多。

一开始豆包的投放渠道,基本上是巨量引擎、小米、腾讯广告三个平台,后来不断拓展,不过基本上巨量引擎为主。

今年6月,Tech星球此前曾披露过,目前聊天对话类大模型投放的CPA(Cost per Action,获取一个用户的费用)是十块多钱。

如果按照10元计算,根据七麦数据显示,仅在iPhone,过去三月Kimi累计下载量为148万,豆包累计下载量为2223万。据此计算,仅在iPhone渠道,Kimi每天的投放金额接近20万,豆包则为248万。

“所有目前不明朗的行业月投入上亿都很大,单月买量上亿运营费用应该是买量的1.5到2.5倍”,一位广告代理商告诉Tech星球。

除去线上渠道,你甚至能在地铁口和机场看到大模型的广告。比如在地铁1号线的AI助手智谱清言,在机场出现的豆包。

图注:智谱清言在北京地铁投放广告。(Tech星球拍摄)
不过,相比于豆包和Kimi,其他类对话式大模型产品的投放金额并不多。App Growing的数据显示,智谱清言和星辉的投放规模仅在几百万。


算不过来的成本账

投放带来的结果显而易见。据Similarweb统计,年初至今AI五小龙(智谱AI、MiniMax、百川智能、零一万物、月之暗面)产品的总访问量,在6个月内暴涨了963%。获客只是第一步,更重要的是留存和转化。一位国内对话类大模型产品的员工告诉Tech星球,他所负责的产品有超过85%的新增用户是靠投流获得。据他所知,业内的另外一款知名产品,付费获得用户的比例也超过70%。一些投资人因此开始质疑,如果没有广告投放,大模型产品自然增长的用户到底有多少。一位负责直播投流的人员告诉Tech星球,直播带货的投流占比也有70%以上。但问题的关键是,直播带货的商业模式已经成熟,而大模型产品则不然。Tech星球获得的一份数据显示,国内头部大模型产品次日留存为30%,这样的数据和消费品差不多,但关键是30日后的留存。另一个值得关注的数据,QuestMobile数据显示,当前主流AIGC类APP的月人均使用天数基本低于5天(仅有星野达到7.7天),导致活跃率普遍低于15%(星野、文心一言、天工、豆包分别为25.7%、16.8%、15.2%、15.1%)。活跃度低于15%对于大模型厂商来说,喜忧参半。这些大模型产品还未能像微信、抖音一样成为许多人生活的必需品。根据QuestMobile数据,2024年6月,在中国大语言模型应用中,豆包APP月活用户达到2750万,排名第一,这和日活动辄过亿的移动互联网产品还有一个数量级的差距。大模型厂商们希望更多的用户来训练“调教”产品,用户有限的使用次数显然无法让他们来实现这个目标,好处是,厂商成本也不太多。不同于互联网产品,可以通过规模效应拉低成本。大模型产品用户每调用一次就会增加显卡成本。一位在国内两家大厂都工作过的大模型研发人员告诉Tech星球,如果不对用户收费,100万用户需要的显卡,一个月百万量级。“但大模型不止显卡成本,如果都算上,一年的成本有几个亿”,他补充道。一位在字节跳动做C端大模型产品的员工告诉Tech星球,C端产品付费率太低了,推广很难。但如果不收费,用的越多,亏的越多。一位云服务厂商中层也证实了上述研发人员的观点。他告诉Tech星球,按照现在的用户量,加上算力,Kimi一年的成本可能就需要10亿美元了。新浪科技曾报道,月之暗面近期获得的10亿美元融资中,其中第一期交割的8亿美元融资中,阿里领投了7.9亿美元融资,其中有6亿美元是必须放在共管账号中,消耗阿里云相关服务的。…


小模型成救命稻草?

疯狂投广告的背后,是厂商们极大的用户焦虑。因为没有用户,意味着故事没办法继续讲下去。几乎所有的创业公司都面临的挑战是,一旦投资人热情不再,企业的生存都面临极大的风险。对于大厂而言,意味着增长天花板有限。

现在来看,2022年年底,Open  AI推出大模型后,从一开始的对话类产品,到后来的Agent、多模态、视频处理等,AI原生态应用看起来越多越多,也越成熟。

但在用户真正的体验中,他们能发挥的作用有限。猎豹移动董事长兼 CEO、猎户星空董事长傅盛在8月30日表示,行业没有出现关键性App,并没有哪家真正哪家用了大模型后提效特别明显。哪怕对用户,一个月要交几十块钱才能用的那种闭源大模型也是智商税。

The Information根据内部财务数据和相关人士的分析预测,OpenAI今年的亏损可能高达50亿美元,尽管当前的年收入已经超过20亿美元,ChatGPT每周用户数已达到两亿,OpenAI仍不可避免地面临着巨大的资金压力。Open AI尚且如此,其他厂商的经营压力不言而喻。

今年,从业者们开始抛弃了对“越大越好”的执念。被认为是行业风向标的OpenAI发布了“ o1”以及更小更便宜的“mini”新一代大模型,不止Open AI,微软、英伟达、苹果等头部公司已经相继发布了最新的小型语言模型——Phi-3.5-mini-instruct和 Mistral- NeMo- Minitron8B、OpenELM。

相比于大模型,小模型需要的参数数量和计算复杂度更少,这意味着成本更低、速度更快、更好用,适配的设备更多,缺点是在复杂计算时明显不如大模型。

今年3月,百度发布了3个轻量模型,最小的一款每1000tokens输入成本为0.001元,而文心大模型4.0版每1000tokens(文本处理过程中的最小单位)输入成本为0.12元。

这让越来越多的大模型厂商看到了希望。360创始人周鸿祎曾表示,在企业内部够用的时候,小模型能把成本从原来的千万美金降到部署成本是千万元人民币甚至百万元人民币的级别。

更低的价格,让模型的商业化有了更多可行性。也只有价格的降低,才能让技术真正落地。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

留子们用火星文写避雷帖,AI竟看懂了?我们实测:几乎全军覆没

留子们在写一种很新的差评。
由于全球点评打卡平台,都有个自动翻译的功能,为了防止被店家骚扰,也为了给同胞避雷,身在海外的国人们,想出各种奇招优雅给差评。


例如,打 5 分忽悠老板,再用中文加密:
图片
用中文谐音写了一堆差评,然后在结尾给个虚假好评,商家拿翻译器一翻,只看到一个早餐不错。
图片
还有人费老大劲儿,用米粒摆出「报吃」的汉字,中国人一看就懂:
图片
更有甚者,重启上古火星文,直接干翻各类翻译器。
图片
但是,最近有网友发现,这段如同计算机乱码的火星文差评,AI 竟然也能读懂啦。


I’m analyzing an encrypted hotel review with a mix of Chinese, Russian, phonetic symbols, and Japanese hiragana. The text might be in “Martian language” using homophones and similar characters. Let’s break it down.

OK, let’s break down the title “卟崾莱住” into “不要来住” by matching similar characters. This tells me it’s about avoiding a stay, which seems interesting.

I’m matching transliterated Chinese characters to Cyrillic ones, tweaking only the vowel sounds. Each line translates smoothly, confirming the title’s meaning.

I’m translating and interpreting Chinese text, thinking through the use of homophones and characters to form meaningful sentences, like identifying the meaning of “笩洃姑娘” as “灰姑娘”.

标题:“不要来住”
正文:“中国人不骗中国人!墙壁和纸一样薄,这么贵的价格房间竟然在阁楼,难道我是当灰姑娘?洗澡水又少,厕所的灯光也昏暗,哈利波特都比我住的呢。避雷!都不许来住!!!”

I’m analyzing an encrypted hotel review with a mix of Chinese, Russian, phonetic symbols, and Japanese hiragana. The text might be in “Martian language” using homophones and similar characters. Let’s break it down.

I went to eat at an old-fashioned Beijing cuisine restaurant during the New Year, and the plaque was shining and the restaurant was covered with Guo Moruo’s inscription. After eating, I was extremely disappointed, and my childhood happy memories were all shattered… A friend described it as the kind of taste that even Guo Moruo would jump out of his coffin when he knew how bad it was.

(Friendly reminder: Using Tencent’s “Martian Text Translator” from “Help with a Little” app)

Link:

https://tool.browser.qq.com/toMars.html

Except for Byte Dough Pack’s accurate translation of Martian text, other domestic and foreign large models all failed.

Taking out “Book Boon,” the translation methods of other large models for “豪华若” are all over the place.


These are technical analysis and translation results on how various AI models interpret encrypted text written in Martian language. Despite challenges, these endeavors underline the evolving capabilities and limitations of AI-powered language processing tools.

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

别Cursor了,集成o1的GitHub Copilot让网友直呼要回归

草莓大模型又来了。

昨天,GitHub CEO Thomas Dohmke 预告了一则关于草莓模型的推文,一时间勾起了很多人的好奇心。


很多人猜测 GitHub Copilot 要集成 OpenAI 最新的 o1 系列模型了,毕竟再不升级就可能要被最近势头很猛的 Cursor 抢走更多用户了。

果不其然,今天一大早,GitHub 便官宣了在 VSCode 中为 GitHub Copilot Chat 开放 o1-preview 和 o1-mini 的早期访问权。同时,用户也可以在 Github Models 模型托管平台选择使用 o1-preview 和 o1-mini。

有网友表示自己已经适应了 Cursor,不过 GitHub Copilot Chat 既然集成了 o1 系列模型,还是值得回归 VSCode 去尝试一下的。

o1 是 OpenAI 上周最新发布的最新大模型,具备先进的推理能力、编程能力,经过训练可以「思考」复杂的任务。

从 OpenAI 官方发布的示例,我们可以看到 o1-preview 的编程能力已经非常强大:一段提示词就让其写出了一个完整可运行的游戏。

OpenAI 的人类偏好评估结果表明:在数据分析、编程和数学等推理能力较强的类别中,o1-preview 的受欢迎程度远远高于 GPT-4o。

在将 o1-preview 与 GitHub Copilot 结合使用的过程中,GitHub 团队发现该模型的推理功能可以更深入地理解代码约束,并且能够产生更高效、更高质量的结果。o1-preview 可以帮助 GitHub Copilot 用户轻松查明编程问题并快速实施解决方案。

现在,用户可以在 VS Code 中选择使用 o1-preview 或 o1-mini 支持 Copilot Chat,以代替当前的默认模型 GPT-4o。在对话期间在模型之间切换,从快速解释 API 或生成样板代码到设计复杂算法或分析逻辑错误。通过将 o1-preview 或 o1-mini 与 Copilot 结合使用,用户可以亲身了解新模型应对复杂编码挑战的能力。

加入 waitlist:GitHub O1 Waitlist Signup

博客地址:GitHub Blog - Try out OpenAI O1 in GitHub Copilot and Models



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

型号齐全,智元发布全系列灵巧手,挑战高自由度

8月18日智元年度新品发布会上,智元机器人发布了19自由度(12主动)视触觉灵巧手,至此智元机器人已经形成全系列灵巧手产品,包含12自由度五指灵巧手、6自由度五指灵巧手、二指夹爪、OmniPicker。下面我们来回顾一下这一系列产品。


1. 视触觉五指灵巧手,挑战高自由度

高自由度五指灵巧手始终是学术界和工业界的关注焦点,结构和功能上与人手相仿,为通用任务而生。智元机器人此次发布的视触觉灵巧手包含19个自由度,其中主动自由度12个,集成基于MEMS原理的触觉感知和视触觉感知技术,升级后的灵巧手在物体操作和感知上都展现出前所未有的灵活与精准。

1.1 高自由度

灵巧手由 4 个模块化的多关节手指和 1 个具有主动对掌功能的拇指组成,整手外观上略小于正常成年男性手,具有拟人的外观和功能。五个手指均具有仿人型的运动轨迹,得益于拇指的对掌性,五指灵巧手可以复现多种人手的抓取类型。

1.2 视触觉感知

灵巧手集成了高精度的MEMS触觉感知和视触觉感知技术。触觉感知系统能够实时反馈手指与物体接触的压力、形状、纹理等信息,这一技术突破不仅提升了机器人在抓取、操作等任务中的精度和效率,更为其在复杂环境中的自主决策和适应性提供了有力支持。

1.3 强操作性

灵巧手内置了高精度驱控算法,结合视觉和触觉多模态感知技术,结合先进的力位混合…

1.4 高负载能力

尤为值得一提的是,该灵巧手在负载能力上也实现了重大突破。新一代产品的指尖抓握力显著提升,整手抓握5kg,自锁提拉30kg,这一突破性的提升,使得灵巧手能够轻松应对工业级的大负载工况,如搬运重物、使用工具等。高负载能力的加持,让灵巧手在更多复杂和恶劣的工业环境中发挥出重要作用,为人形机器人的广泛应用提供了有力支持。

在人形机器人技术迅猛发展的今天,一款集高自由度、强操作性及高负载能力于一体的灵巧手产品的亮相,标志着机器人灵巧手技术迈上了新的台阶。

2. 6自由度五指灵巧手

6自由度灵巧手专为交互场景打造,具备以下两个特点

  1. 拟人手势:具备6个主动自由度和5个被动自由度,模拟真实人手的形态尺寸和关节位置,能流畅表现20余种常用拟人交互手势,为您带来前所未有的自然交互体验.

  2. 轻任务作业:单手负载1kg, 可轻松应对交互场景中常见用品的抓取、放置,让机器人服务更贴心.

3. 二指夹爪

二指夹爪专为工业场景设计,适配智元柔性智造通用机器人,具备以下特点:

  • 手指可更换,确保灵活应对不同操作需求;
  • 拥有高达20,000小时的超长寿命,可靠耐用;
  • 120N峰值夹持力,提供强大的操作支持;
  • 防水等级达到IP54,适应工厂复杂环境;
  • 手指表面采用软性材质包裹,确保被抓物品不受损伤;
  • 完美匹配手臂视觉传感器视野,实现精确协作.

4. OmniPicker

OmniPicker是智元设计的一款自适应的通用夹爪 ,用途很多,融合了不同模态的夹爪设计的优点,只用一个主动自由度就可以实现各种不同形状物体的抓取,而且非常轻便,重量只有300多克.

OmniPicker非常适合用于机器人和各种机械臂的抓取,除了人形机器人,工业臂,协作臂都能用,还提供完整的SDK和硬件的二次开发接口。夹爪还带主动力控,不论是用于数据采集,还是任务作业都效果很好.

智元提供的全系列灵巧手解决方案,可以为各类场景提供多样化的解决方案.



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

真·AI程序员来了,阿里云「通义灵码」全面进化,全流程开发仅用几分钟

5 分钟就能完成真人程序员一天的工作量。
太轻松了。


在 AI 程序员的帮助下,一个几乎没有专业编程经验的初中生,在人头攒动的展台上从零开始,两分钟就做出了一个倒计时网页。
他需要做的,只是输入包含几句话的提示词。数秒钟后,大模型就生成了代码,还列出了环境需求,复制完代码就可以使用了。
这不是程序员父亲带自家小孩做的网红项目,而是人人都可以尝试的事。在大模型的帮助下,代码正在成为低门槛的设计工具。
昨天,阿里云完成了「可能是历史上最大规模的模型开源发布」,开源了通义千问 Qwen2.5 系列模型,又在云栖大会的年度重磅发布中实现了阿里云通义大模型「全尺寸、全模态、多场景」的升级。
与此同时,阿里云「通义灵码」也完成了进化,给人们期待已久的 AI 程序员打了个样。
通义灵码的「AI 程序员」已经正式和大家见面。相比于以往 IDE 上的「AI 编程助手」,「AI 程序员」不需要你去启动 IDE 软件,直接在 web 端就可以完成需求分析、开发、测试等一系列工作,全面接手了复杂的开发任务。
AI 程序员,表现超出预料
还不到一岁的通义灵码,在通义大模型的加持下,现在能够自主执行任务拆解、代码编写、缺陷修复、测试等开发全过程任务,而且生成的速度最快可达分钟级,开发效率一下提升了数十倍。
在阿里云的定义中,「AI 程序员」是能独立自主完成研发任务的 AI 智能体,可承接人类指派的软件研发生命周期中的各类任务。它目前预置了三个使用场景:缺陷修复、需求 0-1 实现、研发问答。

AI 程序员的加入,正在颠覆科技公司的工作方式。它不仅能显著缩短工程师们的日常开发时间,提高效率,优化工程资源的分配,使人们能够专注于更具战略性的创新任务。
对于那些鲜少接触编程的普通人来说,AI 程序员也将很快使复杂的开发流程变得触手可及。无需深入的编程知识或繁琐的环境配置,只需依靠 AI 的力量,人们便能轻松完成从规划、开发到部署和优化的全流程操作,一站式构建新应用,实现以前无法想象的创新。

展望未来,我们或许可以见证黄仁勋的预言,技术正在进入正反馈的循环,用AI自动写AI的方式,我们将会以「摩尔定律平方」的速度前进。
以AI程序员为起点,技术发展的速度只会愈加惊人。我们正站在一个前所未有的拐点上,科技的进步不再仅仅依赖于人类的智慧,而是通过AI的赋能,实现新的技术进化与革新。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB