互联网已经被 AI 污染的差不多了

文章来源:硅星人
原文链接:https://mp.weixin.qq.com/s/oM9R0lgE09mnHrnXJHCT5w

图片来源:由GPTNB生成

最近一张用AI批量做号的微信截图流传在各个群里,有人自爆用AI在小红书做了一个庞大的虚假账号矩阵,通过售卖账号进行变现。

图片来源:由GPTNB生成

这并非个例,你有没有一种感觉,现在刷手机的时候越来越分不清真实和虚拟了?当你浏览社交媒体、搜索信息或阅读文章和观看视频时,你真的能分辨出哪些内容来自人类,哪些又是AI的产物?更令人不安的是,你如何确定你所看到的“事实”不是AI的幻觉?

AIGC 是一场互联网革命,不幸的是,它的兴起也伴随着内容滥用。


大量低质量、AI 生成的关键词堆砌的内容倾泻到网络上,充斥在搜索引擎的结果当中,互联网上很大一部分内容已沦为垃圾信息。

小红书上的“细糠”可能是 AI 生成的,音乐平台则充斥着 AI 生成的歌曲,Spotify 上的 AI 翻唱乐队,把流行歌曲的翻唱添加到正常歌单当中,与真实艺术家演唱的歌曲一起播放,获得了数百万的播放量并获得版税。最近,美国北卡罗来纳州一名男子被捕,他用 AI 制作了数十万首歌曲,并通过 AI 机器人刷播放量,获利超过 1000 万美元。

连你在亚马逊上买的电子书可能也是 AI 写的。一本使用 ChatGPT 撰写的关于野生蘑菇烹饪的电子书,甚至建议读者用舌头去尝一尝的方式来识别蘑菇种类。

最悲哀的是,这些垃圾书实际上也赚不了多少钱,赚钱的是教学生制作垃圾电子书的教程,这完全是一场骗局和垃圾的闭环,而受害者是热爱阅读和写作的读者与作者。

亚马逊上出现了大量 AI 生成的垃圾书籍

1、内容农场从未如此容易

“内容农场”是指为了牟取广告费等商业利益或出于控制舆论、带风向等特殊目的,快速生产大量网络文章来吸引流量。让用户在寻找有用信息时不得不耗费更多时间和精力。为了吸引眼球,一些账号甚至故意发布虚假信息或夸大事实,诱导用户点击。

发布“西安突发爆炸”虚假新闻的账号所属机构,最高峰一天能生成 4000 至 7000 篇假新闻,每天收入在 1 万元以上,而公司实际控制人王某某经营着 5 家这样的机构,运营账号达 842 个。

以前的内容农场借助廉价劳动力,批量产出文章,比如此前的山东“新媒体村”以及北马其顿共和国的假新闻影响美国大选等案例。现在,内容农场也正式从手工作坊进入了 AI 时代。

AI 工具使得内容生成成本大大降低,单次浏览的收入即可覆盖成本。根据 IT 技术博主阮一峰的计算,使用某国产 AI 模型生成一篇文章仅需 0.00138 元,而单次浏览的广告收入约为 0.00145 元,这种模式使得内容农场比以往更容易盈利。

“内容农场从来没有这么容易过,我先买一个热搜数据库,然后花费 100 多元,就能生成 10 万篇文章,最后加入广告,做好 SEO,网站上线,等着用户点进来就行了。不难想象,资讯类网站未来大概都是这个模式。真人生产内容,成本太高,无法与 AI 内容抗衡,注定只能是小众网站。”

除了内容农场,一些平台也在利用 AI 进行 SEO,把自己打造成为“内容农场”。

豆包此前为了在搜索引擎里权重更高,将用户和 AI 的聊天页面生成静态网页,然后被搜索引擎抓取,给自己引流。开发者社区稀土掘金也同样通过 AI 批量生成大量内容被谷歌抓取,这些内容缺乏实质价值,引发用户广泛批评。

虽然目前豆包和稀土掘金都已经移除相关内容,但中文云计算网站和开发者社区仍然是内容农场的重灾区。

AI 搜索引擎 Perplexity 通过对搜索结果添加脚注,链接到互联网的实时信息源来确保结果的准确性,Perplexity CEO 也对外声称“引用来源是我们的通行证”。

但根据 AI 内容检测平台 GPTZero 在今年 6 月进行的一项研究,Perplexity 用户平均搜索三个关键词,就会遇到 AI 生成的内容。像“日本京都的文化节庆”、“人工智能对医疗行业的影响”、“泰国曼谷必尝街头美食”以及“值得关注的年轻网球选手”等搜索,返回的结果中包含了引用 AI 生成材料的答案。

这项研究揭示了 Perplexity 这样的 AI 搜索产品在提供优质来源方面的一个缺陷,也反映出互联网正日益充斥着 AI 生成的内容。

关键词“日本京都的文化节庆”,唯一引用来源是一篇完全由 AI 生成的文章

Perplexity 还推出了 Pages 的功能,使用者可以把搜索与生成的内容制作成公开页面,而且搜寻引擎也能收录。后续也传出一些神奇用法,例如假装询问 AI 关于自家产品的内容,然后利用 Perplexity Page 帮自己的产品做一个页面,最后被搜索引擎收录,达到引流的目的。根据 aHrefs 的数据,Perplexity 每月有 240 万访客来自谷歌。

360AI 搜索也曾经透露,在晚上会借助算力资源使用 AI 生成答案,每天产生数百万的网页供应给搜索引擎。

2、从“内容社区”到“内容坟场”

内容社区也是 AI 入侵的“重灾区”,Quora 曾经是社区氛围良好的问答社区,有评论形容其为“更有条理的Yahoo Answers,更古典的Reddit,更主观的维基百科”。而如今的 Quora 却成为了一个信息垃圾场,充斥着无意义的 AI 生成的内容,以及一大堆答非所问的内容。

一开始一些用户使用 ChatGPT 生成答案,然后秒成 Quora 的“专家”,后来 Quora 直接在页面上集成了 ChatGPT 生成的答案,而这些错误的答案又传播到了谷歌的搜索结果中。

“鸡蛋可以被融化,常见的方法是用炉子或微波炉加热”

一位 2013 年就开始使用 Quora 的用户评论道:“最终,Quora 将充斥着机器的提问、机器的回答,别无其他。”

开发者也在借助 AI SEO 获取流量,Eightify.app 和 Glarity.app 是两个 Youtube 视频总结插件,通过 AI 技术批量生成图文并茂的文章,在短时间内获得了巨大的流量增长。Eightify.app 自 2022 年 8 月开始运营,其月访问量从几十万迅速攀升,于 2023 年 1 月达到峰值 600 多万。紧随其后的 Glarity.app 也在 2023 年 2 月采用类似策略,月访问量从 1 月份的 10 万激增至 3 月份的 1200 多万。

SEO 行业从业者哥飞告诉硅星人,搜索引擎也好,内容平台也好,他们不是要干掉 AI 生成的内容,而是要干掉低质量内容。这些 AI 生成内容能通过谷歌算法审核,表明其质量达到了一定水准,但由于流量增长过快,Eightify.app 和 Glarity.app 引起了全球 SEO 从业者的关注。“如果不干掉,那么就可以认为谷歌默许这样做,大家就会跟风这样做。”

谷歌最终采取了人工干预措施。要求这两家网站停止批量生成内容的行为,并删除此前生成的相关内容。最新数据显示,干预措施生效后,Eightify.app 的月访问量已降至 60 万,而 Glarity.app 更是锐减至 20 多万。

SEO 污染这样的事情其实一直存在,以前没有 AI,也有各种小偷爬虫、伪原创工具,只不过随着 AI 的发展,这场“猫鼠游戏”似乎对于平台来说越来越难了。

一个有趣的例子是 IsaacJinyu 在知乎的一次 AI 卧底实验,他通过知乎问答数据反向生成 AI 数据,然后微调 Qwen2-7B,去除文字中的 AI 味。这个实验从 7 月 5 日开始,到 8 月 3 日整整一个月,没有任何人发现账号 AI 的身份。

AI 生成的《Nothing, Forever》在一个无人观看的 Twitch 直播间 24 小时不间断地播放着。

3、学术圈也被 AI 攻陷

日益增多的 AI 生成内容其影响远不止于屏幕,这种潜移默化的侵入正悄然影响学术领域。

进年初,西安交大一篇论文因为使用 AI 生成的配图而被撤稿,相关图片中,大鼠长出了诡异的器官,细胞信号传导图像电路板。

AI 图片污染互联网图片库

在另一篇论文的一张配图中,小腿和手臂的骨骼数量出现了明显的错误。

这只是 AI 渗透学术领域的冰山一角,在谷歌学术上搜索“截至我上次知识更新”(as of my last knowledge update)或“我没有访问实时数据的权限”(I don’t have access to real time data),会出现大量借助 AI 生成的论文。

学者们在压力之下需在期刊上发表论文,选择了使用 AI,而学生在 AI 的帮助下完成作业和论文已经成为一种常态,“人工代写”论文变成了“人工智能”代写。

AI 训练的恶性循环

AI 模型的准确性在很大程度上取决于其训练数据的质量。“垃圾进,垃圾出”这一短语起源于计算机科学的早期。尤其对于数据分析和 AI 而言,这一原则强调了一个基本观念:输出质量与输入质量紧密相关。

AI 生成的内容激增,但这些内容并非凭空而来,而是基于大量人类创造数据的训练。但在这个过程中存在一个潜在的缺陷,随着这些 AI 生成的内容重新流入互联网,最终又成为训练未来 AI 模型的一部分数据。正如用牛喂养牛导致了疯牛病一样,用大量由 AI 创建的数据来训练 AI 同样具有破坏性。这是一个自我消耗的过程,导致输出质量越来越低。

谷歌在 Google I/O 2024 大会上演示了 AI 简要概括某人未

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

研究发现,在X上将特朗普的谎言标记为“有争议”使支持者更容易相信

研究发现,将特朗普关于选举舞弊的虚假声明标记为“有争议”对于改变特朗普支持者的先前信念几乎没有作用,反而可能使他们更容易相信这些谎言。


这项由明尼苏达州德卢斯大学助理教授约翰·布兰查德(John Blanchard)和斯沃斯莫尔学院副教授凯瑟琳·诺里斯(Catherine Norris)撰写的研究调查了2020年12月对1072名美国人进行的抽样调查数据。研究人员本月在哈佛肯尼迪学院的《虚假信息评论》上发表了论文。

“这些‘有争议’标签旨在提醒读者有关谎言/虚假信息,因此发现它们可能产生相反的效果真是令人震惊,”诺里斯表示。

参与者被展示了四条特朗普推文,其中包含关于选举舞弊的虚假声明,并被要求根据其真实性对其进行评分,范围从一到七。对照组看到的推文没有“有争议”标签;实验组则看到带有标签的推文。在看到这些推文之前和之后,被试也被要求对整体选举舞弊的看法进行评分。

研究发现,最初对普遍存在的舞弊指控持怀疑态度的特朗普支持者在特朗普的推文旁边出现“有争议”标签时更可能将谎言评为真实。与此同时,发现显示拜登支持者的信念基本不受“有争议”标签的影响。第三方选民或不投票的选民在阅读带有标签的四条推文后略微不太可能相信虚假声明。布兰查德和诺里斯在研究中原本预计,“有争议”的标签在政治知识水平高的特朗普支持者中产生的影响会很小,因为以前的研究表明,政治上的参与者可以忽略更正工作,而倾向于坚持自己的反驳观点。研究人员没有预测到相反的可能性:更正工作成为确认的情况。接受调查的知识渊博的特朗普支持者对更正措施如此抵抗,以至于事实核查标签实际上加强了他们对谣言的信仰。

布兰查德表示:“令人惊讶的是,在接受带有‘有争议’标签的推文的政治知识水平较高的特朗普支持者中,实际上加强了他们对选举虚假信息的信念,与没有标签的对照条件相比。”“标签似乎具有反作用,加强了这个群体对虚假信息的信念。”

之前的研究和来自虚假信息专家的研究认为,直接挑战阴谋论者的信仰可能是适得其反的,导致他们撤退或坚定信念。尽管布兰查德和诺里斯在研究中声明他们的发现并不一定证明这种逆向效应是普遍的 - 因为研究中特朗普支持者的样本规模相对较小 - 但他们更加确定,随着特朗普支持者的政治知识水平提高,“有争议”标签的效果越来越不明显。

多年来,社交媒体平台一直在努力创建各种种类的标签系统,向用户发出包含虚假、误导或未经证实声明的内容的信号。Twitter/X曾经将一些带有虚假信息的推文标记为“有争议”,这一做法近年来已被其更换为“社区笔记”同行评审功能和对内容管理的更宽松态度。

虚假信息研究人员一直在寻求回答的更大问题是,试图揭穿虚假信息的标签和事实检查是否真正有效,一些研究发现这些警告实际上会逆向效果。这一研究领域对社交媒体平台、新闻机构和旨在防止虚假信息的倡议具有重要意义,特别是在当下政治极化严重且选举舞弊的虚假声明普遍存在的时候。

作者通过提出10个问题为参与者测试对美国政治的一般理解来评估政治知识,例如:“约翰·罗伯茨目前担任的是哪个政治职位?”

研究的一个局限性是其进行时的特殊时间框架 - 即2020年选举的高峰期,当时保守派对Twitter持有更加敌对的观点。自研究进行以来,Twitter不仅取消了“有争议”标签,还经历了更广泛的所有权变更、内容管理政策和用户态度变化。特斯拉首席执行官埃隆·马斯克在2022年以440亿美元的价格购买了Twitter,并将其更名为X,该平台重新让极右声音回到平台上,包括特朗普本人,并采取了导致保守派对其持更积极看法的右倾转向。

布兰查德表示:“我们无法确定为什么在特朗普支持者中‘有争议’标签产生了逆效果,但对平台的不信任可能起到一定作用。”“考虑到当时保守派对Twitter的不信任,特朗普的支持者可能认为这些标签是限制他们自主权的明显尝试,促使他们对虚假信息加倍坚信。”

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Ginkgo Bioworks推出Ginkgo Datapoints

今天,致力于构建细胞编程和生物安全领先平台的Ginkgo Bioworks(纽交所代码:DNA)自豪地宣布推出Ginkgo Datapoints,以便通过更轻松、更高效地训练AI模型开启生物科技的下一个时代。图片{ width=60% }


Ginkgo Datapoints专门生产大型、高质量的生物数据集,交付速度快,每个数据点的价格具有竞争力,并且拥有简化的交易结构。 Ginkgo Datapoints将于今年秋季推出多种数据生成产品,包括蛋白质表征和功能基因组学。

作为Ginkgo Datapoints旗舰产品,功能基因组学产品已经上市,提供大规模扰动数据集,为合作伙伴的细胞和疾病生物学AI模型提供动力,用于目标识别和验证以及药物发现。 Ginkgo Datapoints解决了AI模型训练中一些最重要的挑战:数据可用性、质量和一致性。

Ginkgo Bioworks首席执行官杰森·凯利(Jason Kelly)表示:“Ginkgo Datapoints的推出标志着我们使生物工程更易于实施的重要步骤。通过Ginkgo Datapoints,我们通过以使生物基础模型训练变得可行的每个数据集价格生成大型、高质量的数据集,将我们的规模经济效益传递给客户。 Ginkgo Datapoints不仅仅是一项服务,更是对推动创新的承诺,加速生物技术行业新疗法和解决方案的开发。”

Ginkgo Datapoints总经理约翰·安德罗萨维奇(John Androsavich)表示:“有着庞大需求的药物和产品开发者市场希望利用AI,他们的模型对数据需求巨大。通过Ginkgo Datapoints,我们回应了这个新生命科学时代如何生成数据的呼声。我们利用Ginkgo庞大的基础设施进行生物数据生成,以AI规模为规模,使我们Datapoints客户能够在模型训练中做出大胆的赌注,将显著影响目标ID或领域如抗体治疗等药物发现的AI规模推进生物学方面进展的数据瓶颈。 我对我们为此聚集的团队和技术感到兴奋。”

Ginkgo Datapoints产品是Ginkgo先前推出的实验室数据即服务产品的下一个演进阶段。 这些产品将为建立用于生物学AI的客户提供关键功能,从生物制药公司到技术生物公司到大型技术公司。 Ginkgo Datapoints的功能基因组学产品适用于:
灵活性和可定制性:客户提供他们的序列或库输入,并选择适合他们的数据集设计,从多个现成的产品参数中进行选择。变量包括数据集大小、所选的细胞系或原代细胞、分析结果、以及数据格式和标记偏好。 客户还可以与Ginkgo的AI专家协商,以获得定制建议,根据数据集将用于训练基础模型还是特定任务模型,验证现有模型,或追求其他结果,如命中发现而定制。可伸缩性和速度:利用Ginkgo的最先进的自动化和后端数据管理基础设施,Ginkgo Datapoints可以通过筛选客户库定期提供数百万数据点,以在最多三周内生成丰富、高质量、整齐编制的高通量转录组、细胞涂抹或其他组学分析数据。数据质量和成本效率:由于Ginkgo高度自动化实验室的规模经济效益,Ginkgo Datapoints随数据集规模的增长可以提供大宗折扣,使饥饿AI模型获取数据变得可行。优惠交易条款:客户拥有由Ginkgo Datapoints生成的数据,通过按服务费定价进行获取。

Ginkgo Datapoints体现了Ginkgo使生物工程更易于实施的使命,通过生成行业需要的数据,Ginkgo Datapoints为利用AI和机器学习进行药物发现等领域的研究人员和公司提供了一个重要资源。

解锁AI。解锁生物学。了解更多关于Ginkgo Datapoints以及如何利用我们的尖端数据服务加速您的AI工作的信息。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Imubit推出Optimizing Brain™解决方案

Imubit推出Optimizing Brain™解决方案:工业首个闭环AI优化解决方案,由强化学习驱动
美国得克萨斯州休斯敦 – [2024年9月18日] – 全球闭环人工智能(AI)优化领导者Imubit推出了其Optimizing Brain™解决方案和工业AI平台。图片{ width=60% }


这是ARC咨询集团认可的第一款基于强化学习的AI工艺优化技术,该机构是领先的行业研究公司,在他们新设立的闭环AI优化(AIO)类别中予以认可。
Optimizing Brain™解决方案的核心是其Foundation Process Model™,结合强化学习。这些功能采用数据优先方法,将复杂的工业挑战安全地转化为高效的工艺。通过提高利润率、减少排放量,并促进AI熟练技术人员队伍的发展,Imubit使工厂能够在迅速发展的工业环境中实现运营卓越。
Imubit得到了美国前十大炼油商中的7家的信任,其技术在全球一些最大的工业加工厂部署了超过90个闭环AI应用。Imubit的技术正在取得实际成果 – 提升炼油厂利润率每桶0.30至0.50美元,将旋转窑操作中的天然气消耗降低长达30%。
Imubit的CEO和联合创始人Gil Cohen强调了其技术的变革性影响:“ChatGPT等基础模型正通过其广泛的适用性改变产业。在Imubit,我们已经运用这一方法对工艺制造进行了优化处理,推出了我们的Optimizing Brain解决方案。它让客户可以在运营、规划和工程领域使用基于数据的模型,打破工厂内的壁垒,让所有技术人员在AI驱动的未来中蓬勃发展。
“我们看到Imubit将强化学习用于实时工艺优化是独特的,是市场上强大的区别化因素,”ARC咨询集团业界分析师Peter Reynolds表示。“这一方法促使我们在ARC重新思考了如何对工艺优化和控制中的AI进行分类。Imubit属于一个新的类别,不同于传统的APC和优化解决方案,我们称之为闭环AI优化,AIO。”
Optimizing Brain™解决方案是在Imubit的休斯顿Transcend AI峰会和培训活动上推出的,吸引了工艺行业一些最具前瞻性的领导者。像马拉松石油公司、HF辛克莱、Citgo和Oxbow Calcining这样的运营商分享了Imubit如何帮助他们加速数字转型之旅。
“一旦您解决了最初的商业案例,开始看到房间里围绕着可能性的兴奋,那时你就真正可以使AI民主化。那时您的运营团队、P&E团队、工程团队、IT团队就可以探索所有这些您甚至可能从未考虑过的其他问题,他们将开始找到新的方式,利用Imubit的平台最大化公司的价值。”德雷克美国业务转型高级总监Kyle Kuchta说。
Cohen补充说:“工业部门正在迅速发展。如果您不使用AI来优化工艺操作,您的竞争对手正在做。”



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Cybord融资870万美元A轮

利用人工智能和大数据,Cybord分析组装线上的100%电子元件,验证它们的可靠性、真实性和可追溯性,以支持所有使用电子电路板的行业,从汽车到数据中心。图片{ width=60% }


Cybord是一种视觉人工智能解决方案,确保电子元件的质量、真实性和可追溯性,今天宣布已经获得了由Capri Ventures领投、Ocean Azul Partners和现有的IL Ventures和NextLeap Ventures等新老投资者参与的870万美元A轮融资。与Flex和西门子等领先制造商合作,Cybord已经整合到全球60条以上生产线中,每天检查数百万个电子元件。这笔最新的融资将用于加速公司的增长,并进一步全球分销其变革性解决方案。
通过深度学习和人工智能算法,Cybord分析并检查PCBA上所有电子元件的100%,为从电动车到数据中心的所有设备提供动力。Cybord解决了该行业面临的重大需要,即面对电子元件质量,以防止损害产品状况、消费者信任和制造商的底线。直到现在,电子元件的质量和安全性在很大程度上被忽视,导致缺陷的发生增多和昂贵的召回,这在2023年达到了七年来的最高水平。这种不可靠的电子元件质量状态导致了耗时且昂贵的电路板和产品的重做和报废,为预防保修索赔而分配宝贵资金,并导致价值数百万到数十亿美元的召回损失。
Cybord拥有超过40亿个元件的数据库,并且其机器学习模型代表了电子制造领域人工智能的前沿。在组装线上进行放置时,该视觉人工智能解决方案以99.9%的准确性,实时防止缺陷、损坏和伪劣元件被组装到PCBA上。通过这样做,Cybord确保在元件级别提供无与伦比的可靠性和可见性,以为EMS和OEM提供组件质量、真实性和法证可追溯性,从而实现更高质量的电子产品、改善制造效率、降低成本以及减少召回。
“我们很荣幸能够从那些理解Cybord使命的信任合作伙伴和投资者那里获得这一轮融资,”Cybord首席执行官Oshri Cohen表示:“随着越来越多的行业依赖电子元件,确保它们的质量尤为重要。Cybord解决方案一次又一次得到我们全球领先合作伙伴的验证,而这些资金将使我们能够更快地扩大规模,并将我们全面的人工智能解决方案带给更多全球公司,实现我们的使命,确保仅有最好的电子产品。”
“投资Cybord符合我们支持推动创新和创造持久影响公司的承诺,”Capri Ventures合伙人Adalio Sanchez表示:“Cybord是唯一能确保电子元件质量的解决方案,使其成为这个迅速发展市场中的革命性领导者。我们很荣幸与他们合作,并目睹他们在从汽车和航空航天到健康等各行业的利益相关者中持续获得的好评。”
“从一开始,Cybord就展示了一种破坏性方法来解决当今全球供应链中电子元件质量、安全性和可追溯性的紧迫挑战,”ILVP的管理合伙人Elad Frenkel表示,“Cybord的解决方案正在加速电子行业的发展,我们很高兴能够在他们从种子阶段迈向这一里程碑的旅程中扮演一个角色,并期待继续支持他们的增长。”
“在制造供应链中,无论是质量还是效率上都拥有竞争优势至关重要。Cybord不仅提供这些优势,还提供增强的安全性和可见性,”联想前首席运营官和首席供应链官Renée Ure表示:“通过整合Cybord的视觉人工智能解决方案,制造商确保了卓越的电子元件质量、真实性和可追溯性,这对于保持高标准并减少昂贵召回至关重要。”。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Datorios发布Apache Flink®的Lineage分析器

Datorios是一家领先的实时业务运营数据可观察性和数据质量技术开发商,推出了适用于Apache Flink®的Datorios Lineage分析器。图片{ width=60% }


在位于德克萨斯州奥斯汀市举行的Current 2024会议上宣布,Lineage分析器为流数据基础设施运营商提供了更深入、更完整的洞察力,用于驱动实时业务运营和实时人工智能的数据处理管道性能。

数据血统指的是信息从其起点经过各种管道而移动时的生命周期和路径。随着企业对基于数据驱动的实时自动化和人工智能的依赖增加,并使用Apache Flink创建这些系统,Lineage分析器为Apache Flink提供的洞察力对确保准确性和可用性至关重要。它加速了Apache Flink开发人员和运营商的开发、故障排除和优化。

数据血统还在确保数据处理符合政府标准的许多行业中发挥着至关重要的作用。通过保持如何在Flink作业内部传输和转换数据的清晰记录,企业可以向审计员和监管机构提供必要的透明度。这对于证明实时数据处理工作流程的完整性和准确性至关重要。

Lineage分析器提供了一套全面的功能,旨在帮助开发人员跟踪他们的管道中的数据,监控转换,并确定数据更改发生的位置。与其他数据血统工具不同,其他数据血统工具仅显示对数据进行操作的进程列表,Lineage分析器提供了对进程内步骤的洞察力,这使得数据更改的原因变得清晰。这使组织能够进行更彻底的审计和轻松故障排除。

Lineage Analyzer的主要功能包括:

  • 数据血统可视化 - 查看交互式作业图,这是提供实时处理管道构成概览的有向无环图(DAGs)。
  • 数据流细节 - 深入研究作业图,探索数据流操作符的详细视图。
  • 数据跟踪 - 浏览随着操作符流动的实际数据记录,并实时观察数据转换。
  • 低性能开销 - 与其他血统工具不同,Linear Analyzer在Flink作业外部运行,为您提供所需的可见性,而不会影响您的实时系统性能。

“今天的业务创新者正在超越使用AI聊天机器人回答问题;他们正在创建使用AI采取行动的自主代理。”Datorios的首席执行官兼联合创始人Ronen Korman说。“在这些系统的成功上承载着如此重大的任务,企业无法承受停机时间或错误;Lineage分析器帮助他们避免这些问题,并充满信心前行。”

要了解更多信息,请访问Datorios的博客,或加入该公司的Slack频道。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

B-FY密码无需生物识别解决方案:打击网络犯罪的颠覆者

B-FY推出了一种无需密码的去中心化生物识别认证解决方案,消除了被盗凭证的风险,改变了在线身份安全保护方式。图片{ width=60% }


ATIO集团在墨西哥的燃油行业成功部署了B-FY的生物识别协议,显著减少了欺诈行为,并增强了交易安全性。在阿姆斯特丹成功全球推出后,B-FY正式向美国市场推介其创新的无需密码的身份验证即服务(AaaS)工具。该发布活动在沃尔特·E·华盛顿会议中心举办的9月11日至12日的Identity Week大会上引起了轰动。

在会议期间,B-FY的前沿网络安全方法备受关注,吸引了行业领袖和网络安全专家的广泛关注。公司创始人兼首席创新官克拉斯·兹瓦特先生强调了超越传统身份验证方式,拥抱更安全身份验证实践的迫切性。他强调了B-FY技术在重塑全球网络安全格局方面的变革潜力。

盗取凭证带来的威胁不断升级

在当今数字世界,身份盗窃和安全漏洞已经达到前所未有的水平,据2023年谷歌云威胁视野报告显示,86%的安全漏洞事件中都涉及到盗取凭证。对密码作为主要验证方式的持续依赖使得无数组织容易受到攻击。凭证很容易被获取,进而导致严重的财务和声誉损失。

B-FY通过完全取消密码的方式为日益增长的这种脆弱性提供了一个强大的解决方案。它引入了一个去中心化的生物识别认证系统,旨在保护用户的数据安全和隐私。

解决在线匿名性:网络身份欺诈的根源

在打击网络犯罪的基本挑战之一是在线匿名性问题。网络犯罪往往由匿名的个体实施,这些个体隐藏在凭证后面,例如身份证、密码、PIN码、指纹、面部扫描或两因素验证(2FA)组合之后。这些凭证只是验证访问权限,而不能识别交易背后的个人。这种匿名性让网络犯罪分子可以不受追踪、识别或追究责任地进行活动。

因此,匿名用户可以是任何人,可以位于世界上的任何地方,使得网络交易本质上不安全。结果就是网络犯罪激增,全球损失在仅今年就达到惊人的14.58万亿美元。

B-FY:网络安全的新时代

B-FY的AaaS解决方案是打击网络犯罪的颠覆者。它基于一种离线的去中心化生物识别协议,仅在用户的移动设备上存储用户的生物识别数据。这确保了敏感数据始终受用户控制,大幅降低了未经授权访问或数据泄露的风险。通过消除密码,B-FY还解决了与钓鱼攻击、恶意软件和弱密码或共享密码相关的漏洞。

B-FY的独特之处在于它能够从在线交易中消除匿名性。当与现有的2FA系统集成时,B-FY将这些系统从匿名访问升级为标识操作者访问。通过离线的生物识别身份匹配,B-FY通用识别平台只授予经过验证的个人访问权限。这几乎让在线身份欺诈变得不可能,标志着网络安全方面的重大进步。

成功案例:B-FY的实战

B-FY的技术已经在全球各个行业中证明了其有效性。例如,在墨西哥的燃料行业,B-FY与燃料供应自动化和控制技术领先提供商ATIO集团合作。B-FY的生物识别认证系统被用于保护燃料装载过程。在一个涉及45个加油站的试点项目中,B-FY的解决方案通过确保只有授权人员能够进行交易,大大降低了欺诈行为。该项目被认为是成功的,导致ATIO集团计划将B-FY的技术扩展到该国其他加油站。


注意:Title、Date、Body 三个部分的内容,放入到对应的位置。最后只需要输出为Markdown源文件格式内容。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Cybord完成870万美元A轮融资

利用人工智能和大数据,Cybord分析装配线上100%的电子元件,验证它们的可靠性、真实性和可追溯性,以支持从汽车到数据中心等所有使用电子电路板的行业。图片{ width=60% }


Cybord是一种视觉人工智能解决方案,确保电子元件的质量、真实性和可追溯性,今天宣布已获得由Capri Ventures领投,Ocean Azul Partners和现有投资者IL Ventures和NextLeap Ventures等新旧投资者参与的870万美元A轮融资。与领先制造商Flex和西门子合作,Cybord已整合进全球60多条生产线,每天检查数百万个电子元件。这笔最新的资金将用于加速公司的增长,并进一步全球分发其变革性解决方案。

利用深度学习和人工智能算法,Cybord分析和检查PCBA上100%的电子元件,为从电动汽车到数据中心驱动一切的产品提供动力源。Cybord解决了行业面临的关键需求,即对抗电子元件质量以预防破坏产品状态、消费者信任和制造商底线的情况。到目前为止,电子元件的质量和安全性在很大程度上被忽视,导致缺陷频繁发生,并且成本高昂的召回达到了2023年的七年来最高水平。电子元件质量的不可靠状态导致电子板和产品的重复工作和报废,为预防保修索赔而分配宝贵的资本,以及价值数百万至数十亿美元的昂贵召回造成损失利润。

拥有超过40亿个组件且不断增加的数据库,Cybord的机器学习模型代表了电子制造业人工智能的最前沿。在放置到装配线上时,这种视觉人工智能解决方案以99.9%的准确性实时阻止有缺陷、损坏和伪劣元件被组装到PCBA上。通过这样做,Cybord确保在组件级别提供无与伦比的可靠性和可见性,实现EMS和OEM的组件质量、真实性和法证可追溯性,从而实现更高质量的电子产品、改进的制造效率、降低成本和减少召回。

“我们很荣幸能从理解Cybord使命必要性的信任伙伴和投资者那里获得这轮融资,”Cybord首席执行官奥什里·科恩(Oshri Cohen)表示。“随着各行业对电子元件的依赖日益增加,确保它们具有最高质量从未如此重要。 Cybord解决方案一次又一次地得到我们全球领先合作伙伴的验证,这些资金将使我们能够更快地扩展规模,并将我们全面的人工智能解决方案带给更多全球公司,实现我们的使命,确保仅有最好的电子产品。”

“投资Cybord符合我们支持推动创新并产生持久影响的公司的承诺,”Capri Ventures合伙人阿达里奥·桑切斯(Adalio Sanchez)表示。“Cybord是唯一能够确保电子元件质量的解决方案,这让他们成为这个快速发展市场的革命性领导者。我们很自豪能与他们合作,并见证他们在从汽车和航空航天到卫生等各行业中各利益相关方之间不断增加的推动力。”

“从一开始,Cybord就展示了解决当今敏感全球供应链中部件质量、安全性和可追溯性紧迫挑战的颠覆性方法,”ILVP管理合伙人埃拉德·弗伦克尔(Elad Frenkel)表示。“Cybord的解决方案正在加速电子行业的发展,我们很高兴能在从种子阶段到这一里程碑的旅程中发挥作用,并期待继续支持他们的增长。”

“在制造业供应链中,无论在质量还是效率方面都具有竞争优势至关重要。Cybord不仅提供这些优势,还提供增强的安全性和可见性,”联想前COO兼CSCO雷妮·尤尔(Renée Ure)表示。“通过整合Cybord的视觉人工智能解决方案,制造商确保了卓越的电子元件质量、真实性和可追溯性,这对于保持高标准并减少昂贵的召回至关重要。”



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

疯狂星期四Qwen2.5开源,通义成了最Open的AI?

来源:硅星AGI
原文链接:https://mp.weixin.qq.com/s/HZT2_9DbDrKPgBNDpI3cqw

图片来源:由GPTNB生成

对国外开发者们来说,今天是一个特殊的“疯狂星期四”!

周四还没来,就有开发者在社交媒体平台上翘首以盼;

image

已经要睡觉的日本网友,半夜爬起来测试竞技场;

image

甚至有人直呼今天是“疯狂星期四”!

image

没错,一切都是因为,Qwen2.5开源了,而且一口气上架了100多个模型!

左边o1,右边Qwen2.5-Math

在此之上,Qwen 系列也在逐渐释放多模态能力,视觉语言模型Qwen2-VL-72B正式开源,该模型能够识别不同分辨率和长宽比的图片,理解20分钟以上长视频,具备自主操作手机和机器人的视觉智能体能力。

此前权威测评LMSYS Chatbot Arena Leaderboard发布最新一期的视觉模型性能测评结果,Qwen2-VL-72B成为全球得分最高的开源模型。


image

种类多得像逛集市?
来总结一下:基模层面,Qwen2.5大幅度提高了模型性能,囊括了多尺寸、多语言、多种类、多专项模型,还增加了多模态的视觉能力,不得不说,Qwen2.5还是太全面了!

#02、将开源开放进行到底

开源了这么多,真的被开发者用起来了吗?
这不止是对Qwen,更是对所有开源模型提出的灵魂拷问。
在现场,周靖人也公布了一组数据:截至2024年9月中旬,Qwen系列的下载量已经超过4000万,海内外开源社区中Qwen系列衍生模型数量已经超过5万个,成为了仅次于Llama的世界级模型群。

image

而做到这个使用量级,不是简单地把模型丢到开源社区就可以的,这背后还需要下“苦功夫”。
首先就是要对开发者的真实需求“点对点”地突破,通过生态融合让开发者更简单、更直接地使用Qwen系列。
自Qwen1.5发布以来,通义团队就与HuggingFace合作,把模型代码合并到HuggingFace Transformers代码库,方便开发者直接使用Transformers原生代码,并拓展各类开源框架、开源工具对Qwen系列的兼容和支持,包括vLLM、SGLang、AutoAWQ、AutoGPTQ、Axolotl、LLaMA-Factory、llama.cpp、Ollama、LMStudio等等。

image

通义团队介绍,“在model card(准备模型文档)中,除了主流的英文文档,还会准备中文甚至其他语种的文档;优化文档质量,让开发者一眼读懂模型的亮点、效果、demo;准备代码片段,帮助开发者快速部署和使用模型。”

“发这么多种模型,是想把更多的选择留给开发者,他们会基于自己的业务场景做权衡,比如,让模型能力更强或者推理效率更高。”周靖人讲道,“同时我们也为企业客户提供闭源的API调用。开源助力的是生态的发展,闭源更好地满足企业级用户的需求,阿里云也提供更极致的性价比,要做的就是把模型使用的门槛降低。”

除了开源模型的全面升级,通义千问也升级了旗舰模型Qwen-Max。目前,通义官网和通义APP的后台模型均已切换为Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用Qwen-Max的API。

image

相比2023年4月的初代通义千问大模型,Qwen-Max的理解能力提升46%、数学能力提升75%、代码能力提升102%、幻觉抵御能力提升35%、指令遵循能力提升105%,模型与人类偏好的对齐水平更是有了质的飞跃,提升了700%以上。

相比于其他模型厂商对开源闭源的选择泾渭分明,如OpenAI坚持闭源、Llama坚持开源,阿里云具有一定的特殊性,既在开源社区生态中投入建设,又通过云服务向企业客户提供服务。

周靖人也介绍道,开源还是闭源,不应该由大模型厂商来选择,而是由市场需求而定。阿里云此前打造的完整的技术生态,能够辅助大模型在企业中更好地落地,如阿里云百炼平台提供的完整工具链,能够更好地辅助开发;魔搭社区也成为了中国最受欢迎的AI社区。阿里云的选择不是为了短暂的市场竞争,而是抱着开放的心态,与整个行业长期共建的过程。

不停的迭代基模能力以及与合作伙伴共建生态,“先进”和“开放”,是周靖人给出的两个关键词。

开源闭源之争已久,即便我们无法判断最终究竟会是怎样的技术路线,但可以确定的是,以开放为核心的阿里云通义,会一直留在牌桌上。


感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

广告烧钱过亿,70%用户靠投流,大模型算不过成本账?

一个兽医博主在记录父亲深夜抢救母牛的过程中,使用Kimi查找“母牛传染病”的相关医学内容;一个生活博主在告诉大家如何用AI实现人生第一个13万的过程中,向用户展示如何用豆包生产内容;打工人上班途中在北京地铁1号线永安里站出口,看到智谱清言应用的大屏广告;好学的年轻人睡前在自己常听的播客节目里,听到MiniMax的植入……

广告投放,是当下大模型白热化竞争中的一个切面。大模型厂商们希望获得足够多的用户,讲一个大模型原生应用的故事。


但现实是,高额的成本、千万级的用户,都不足以支撑故事继续。绕了一圈,大模型厂商们还是需要回到现实:一个关于技术与商业化的永恒命题。

烧钱换增长,一个月广告投放过亿

谁也没有想到,B站成了AI时代商业化赢麻了的平台。

财报显示,今年第二季度,B站AI行业今年一季度广告收入同比增长超5倍,二季度金额环比一季度继续大幅上涨。一位科技UP主声称,自己与同行的商业投放合作档期基本都被大模型企业填满,3个月接了20单商业合作的UP主不在少数,甚至出现了不同大模型企业为了一个档期抢单“大打出手”的情况。

大模型创业公司最激进的是月之暗面,这家公司旗下的AI智能助手Kimi因长对话能力出圈,是时下最火热的大模型产品之一。Tech星球通过AppGrowning查询发现,今年3月开始,Kimi每个月的广告投放都高达上千万元。3月份,Kimi的广告投放还只有近1500万元,到了7月和8月,高达近5000万元。

广告为Kimi带来了海量的用户。今年3月20日,因为流量超过了规划,Kimi一度宕机。App Growing的数据显示,从3月到8月,短短6个月,Kimi的广告投入…

一位在字节跳动做C端大模型产品的员工告诉Tech星球,C端产品付费率太低了,推广很难。但如果不收费,用的越多,亏的越多。一位云服务厂商中层也证实了上述研发人员的观点。他告诉Tech星球,按照现在的用户量,加上算力,Kimi一年的成本可能就需要10亿美元了。新浪科技曾报道,月之暗面近期获得的10亿美元融资中,其中第一期交割的8亿美元融资中,阿里领投了7.9亿美元融资,其中有6亿美元是必须放在共管账号中,消耗阿里云相关服务的。这意味着,短期内Kimi的算力是充足的。成本过高导致产品无法大规模商用,几乎是所有先进科技都面临的挑战,自动驾驶如此,大模型亦如此。

小模型成救命稻草?

疯狂投广告的背后,是厂商们极大的用户焦虑。因为没有用户,意味着故事没办法继续讲下去。几乎所有的创业公司都面临的挑战是,一旦投资人热情不再,企业的生存都面临极大的风险。对于大厂而言,意味着增长天花板有限。

现在来看,2022年年底,Open  AI推出大模型后,从一开始的对话类产品,到后来的Agent、多模态、视频处理等,AI原生态应用看起来越多越多,也越成熟。

但在用户真正的体验中,他们能发挥的作用有限。猎豹移动董事长兼 CEO、猎户星空董事长傅盛在8月30日表示,行业没有出现关键性App,并没有哪家真正哪家用了大模型后提效特别明显。哪怕对用户,一个月要交几十块钱才能用的那种闭源大模型也是智商税。

The Information根据内部财务数据和相关人士的分析预测,OpenAI今年的亏损可能高达50亿美元,尽管当前的年收入已经超过20亿美元,ChatGPT每周用户数已达到两亿,OpenAI仍不可避免地面临着巨大的资金压力。Open AI尚且如此,其他厂商的经营压力不言而喻。

今年,从业者们开始抛弃了对“越大越好”的执念。被认为是行业风向标的OpenAI发布了“ o1”以及更小更便宜的“mini”新一代大模型,不止Open AI,微软、英伟达、苹果等头部公司已经相继发布了最新的小型语言模型——Phi-3.5-mini-instruct和 Mistral- NeMo- Minitron8B、OpenELM。

相比于大模型,小模型需要的参数数量和计算复杂度更少,这意味着成本更低、速度更快、更好用,适配的设备更多,缺点是在复杂计算时明显不如大模型。

今年3月,百度发布了3个轻量模型,最小的一款每1000tokens输入成本为0.001元,而文心大模型4.0版每1000tokens(文本处理过程中的最小单位)输入成本为0.12元。

这让越来越多的大模型厂商看到了希望。360创始人周鸿祎曾表示,在企业内部够用的时候,小模型能把成本从原来的千万美金降到部署成本是千万元人民币甚至百万元…

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB