GPTNB · AI资讯与技术分享站

2024-07-20发表2025-03-21更新 ByteAILab 11 分钟读完 (大约1606个字)

「你好，我在咱们公司刚入职。业务上有什么事儿，就请您多多指教啦！」

什么，这些同事竟然都是大模型驱动的 “数字人”？

只需 30 秒画面，10 秒音频，10 分钟就能极速定制一个这样和真人无异的 “数字同事”。

它可以直接和你实时交互，并且有着通信运营商级别的高质量低延迟的音画传输。

就像这样：

像这样：

这是小冰公司最新上线的 “零样本” 数字人（Zero-shot Xiaoice Neural Rendering，Zero-XNR）技术，依托超千亿大模型基座，新技术不仅将数字人所需的训练数据压缩至 “秒级”、使定制时间达到 “立等可取”，而且生成的数字人能够直接应用于实时交互。据业内人士介绍，这在全球尚属首次。

同时，新技术仍旧保持了超高清标准，栩栩如生：

基于这项全新的 Z-XNR 技术和 TTS 语音大模型的融合框架，小冰数字人实现了秒级数据高质量形象声音复刻。独特的数据训练和推理算法，同时实现了数字人复刻高质量、视觉个性化表达与立等可取的便捷性：链接

不仅如此，小冰 AI 数字员工产品线这一次共计进行了三大升级：全新 Z-XNR 技术 + 全新超千亿大模型基座与 Agent 构建框架 + 全新透影音画传输系统。

全新超千亿大模型基座与 Agent 构建框架，简单而言，就是基于超千亿大模型基座，升级混合基座架构的 Agent 构建框架，搭建完整的交互数字员工能力构建与强化平台 —— 数字大脑平台，小冰全系列数字员工都能配备强大和丰富的职业交互套件，让数字员工更懂客户，更懂企业知识与业务，让交互精准适配商业场景原生工作流。

全新透影音画传输系统，是指基于 webRTC 的自研引擎，提供超高清视频推送能力、通信运营商级别的高质量低延迟的音画传输和弱网抗丢包通信能力，实现精准的声音画面同步，并可搭载透明通道数据，支持客户端实时渲染来丰富扩展应用。可以承载端到端的多模态实时交互和 AI 对话等场景，提供流畅自然的用户体验。

“零样本” 数字人以及基于该技术的全新普惠型数字员工的推出，进一步丰富了小冰 AI 数字员工产品线，产品体系 “高 - 中 - 低” 搭配日臻完善，广泛适配企业不同发展阶段和多样化的业务场景。目前，小冰的客户已经覆盖了包括招商局集团、红杉中国、万科集团在内的国内众多行业头部企业，并在各垂直领域企业中取得了丰富的产业落地实践。

而有了 “零样本” 数字人，更多的小微企业、小型商家，都有了更加便捷和低成本的路径来尝试数字人和大模型技术，有助于实现数字化转型。

至于如何体验？

即日起，通过小冰数字员工 APP 的自助服务，就可以轻松畅享全流程自动化的 “零样本” 数字人定制了。

值得一提的是，小冰大模型以及语言模型算法、语音合成算法、数字人合成算法等技术都已经成功通过了国家网信办备案，标志着小冰在技术能力、专业性、安全性和合规性方面拥有坚实基础，已获国家权威级认可。

近几年来，数字人如雨后春笋一般涌现，一度成为各行业的宠儿。然而，热度持续提升的另一面，日新月异的技术更迭、用户体验的更多诉求，都在向这一新兴赛道发起挑战。最近，市场逐渐回归理性，行业开始更加关注数字人的实际应用和商业价值。

作为最早布局数字人的企业之一，小冰团队一直走在 “数字人 + 大模型” 产品技术革新的最前沿。依托小冰大模型、神经网络渲染及超级自然语音等领先技术，小冰公司已构建类型丰富的 AI 数字人完整产品体系，将数字人的整体自然度提升到与真人难以分辨的程度，同时实现 800 毫秒级别的端到端超低延时人机实时交互，通过完备的 SaaS 化平台工具，用户可自主管理数字资产，配置数字人工作。目前，小冰数字人已成功赋能金融保险、智能车企、地产、文旅、政务、教育、零售、大消费、互联网等十余个垂直领域。

小冰团队表示，坚信技术创新的力量，将坚持致力于推动数字人普及，让数字人赋能千行百业，发挥技术进步的巨大价值。

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2024-07-20发表2025-03-21更新 ByteAILab 8 分钟读完 (大约1201个字)

130亿美元！OpenAI 或再入局！

文章来源：半导体行业观察

原标题：《OpenAI的自研芯片，再传新进展》

图片来源：由GPTNB生成

来源：内容由半导体行业观察（ID：icbank）综合自theinfornation等。

周四，据《Information》报道称，博通公司已讨论为 OpenAI 制造一款人工智能芯片，这可能使其进一步进入英伟达公司的领域。

此后，博通公司股价上涨近 3%。

据新闻媒体报道，ChatGPT 聊天机器人的制造商 OpenAI 向博通提出了这个想法，这是该初创公司与芯片设计师进行更广泛讨论的一部分。OpenAI 的努力还包括聘请曾在谷歌 Tensor 处理器上工作过的前谷歌员工。

报告发布后，博通在纽约交易中上涨 2.9%，至 160.53 美元。受该公司蓬勃发展的人工智能设备销售提振，该公司股价今年已上涨 44%。

博通和 OpenAI 的代表没有立即回应置评请求。

尽管英伟达是人工智能支出的最大受益者，但博通也在市场上迅速取得进展。它向数据中心运营商出售一系列组件，这些运营商正在迅速扩大其设施以适应人工智能服务。博通首席执行官 Hock Tan 表示，到 2024 财年，博通的人工智能销售额将超过 110 亿美元。

与此同时，彭博社今年早些时候报道称，OpenAI 首席执行官萨姆·奥特曼一直在努力从全球投资者那里为芯片企业筹集数十亿美元的资金，计划利用这些资金建立一个生产半导体的工厂网络。

金融时报表示，OpenAI 一直在与包括博通在内的半导体设计公司就开发新芯片进行洽谈，以期减轻对英伟达的依赖并加强其供应链。

此次谈判是该公司联合创始人兼首席执行官萨姆·奥特曼 (Sam Altman) 牵头的努力的一部分，旨在加强运行日益强大的人工智能模型所需的零部件和基础设施的供应。

“人工智能的限制因素是容量：芯片容量、能源容量、计算容量。[OpenAI] 不会袖手旁观，让别人在前线开发这些，”一位了解OpenAI计划的人士表示。

Altman已与芯片制造商、微软等合作伙伴、政府机构和金融支持者进行合作，努力提高产能，并保持公司在该技术领域大规模繁荣的中心地位，这一繁荣是由这家旧金山公司于 2022 年底发布的 ChatGPT 聊天机器人引发的。

据一位了解OpenAI 与博通之间谈判情况的人士透露，谈判尚处于早期阶段，OpenAI 已经“与整个行业进行了接触”。

OpenAI 在一份回应中表示：“OpenAI 正在与行业和政府利益相关者进行持续对话，以增加对基础设施的访问，确保人工智能的好处能够广泛普及。”“这包括与顶级芯片设计师、制造商和数据中心的实体开发商合作。”

博通没有回应置评请求。

强大的半导体是顶级 AI 公司最热门的商品之一。OpenAI、微软和主要竞争对手 Anthropic 和谷歌尤其依赖 Nvidia 的尖端图形处理单元来训练和运行他们的模型。

OpenAI 短期内不太可能与 Nvidia 的技术实力相媲美，但该公司一直在探索各种方式，以便在追求通用人工智能（可以在一系列认知任务中超越人类的人工智能）的过程中变得更加自力更生。

据知情人士透露，即使得到微软 130 亿美元的支持，这家初创公司仍需要外部资金支持或商业合作才能实现其计划。

“可以公平地说，做这些事需要大量资金，”该人士表示。

参考链接
https://finance.yahoo.com/news/broadcom-gains-report-discussing-chip-201050180.html

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2024-07-20发表2025-03-21更新 ByteAILab 14 分钟读完 (大约2043个字)

GPT-4o Mini深夜突发：即刻免费上线，API降价60%

大模型向小了。

还没「休息」几天，AI 大模型再次卷起来了。

刚刚，OpenAI 突然宣布了「Mini」版本的 GPT-4o 模型。该公司表示，新的轻量级版本旨在让更多公司和项目能够获得最先进的技术。

这款名为 GPT-4o mini 的新模型立即上线，它在 MMLU 上的得分为 82%，目前在 LMSYS 排行榜的聊天方面分数优于 GPT-4。

除了立即在 ChatGPT 免费版、付费版上可用以外，GPT-4o mini 的商用价格是每百万输入 token 15 美分，每百万输出 token 60 美分 —— 比之前的 SOTA 模型便宜一个数量级，比 OpenAI 此前最便宜的 GPT-3.5 Turbo 还要便宜 60% 以上。

OpenAI CEO 山姆・奥特曼对此的形容是：通往智能的成本已经「too cheap to meter」。

GPT-4o mini 凭借其低成本和低延迟的性能实现了广泛的任务，例如链接或并行化多个模型调用（如调用多个 API）的应用程序、将大量上下文传递给模型（如完整的代码库或对话历史记录）或通过快速、实时的文本响应与人互动（例如客户支持聊天机器人）。

OpenAI 表示，目前 GPT-4o mini 在 API 中支持文本和视觉，很快也将支持文本、图像、视频和音频输入和输出。该模型具有 128K token 的上下文窗口，知识截至 2023 年 10 月。得益于与 GPT-4o 共享的改进版 tokenizer，处理非英语文本能力也更加经济高效。

OpenAI 将新模型的推出描述为努力让 AI「尽可能广泛普及」计划的一部分，但这也反映了 AI 技术供应商之间日益激烈的竞争，以及人们对小型和免费开源大模型的兴趣。另有消息称，Meta 预计将于下周推出 Llama 3 的最大体量版本。

在人们看来，GPT-4o mini 可以替代 GPT-3.5 Turbo，对标的是 Claude 3 Haiku 和 Gemini 1.5 Flash—— 作为后来者，GPT-4o mini 毫无疑问的比这两者更便宜，性能也更好。

「OpenAI 的全部意义在于安全地构建和分发 AI，并使其广泛普及，」OpenAI 负责新模型的产品经理 Olivier Godement 表示。「以更低的成本提供智能是我们实现目标的有效方法之一。」

Godement 表示，该公司通过改进模型架构、优化训练数据和训练方案，开发出了 GPT-4o 的这个最新版本。它在几个常见的基准测试中也优于市场上其他的「小体量」模型。

小模型中最能打的

GPT-4o mini 在文本智能和多模态推理方面，在学术基准上超越了 GPT-3.5 Turbo 和其他小型模型，并支持与 GPT-4o 相同范围的语言。

GPT-4o mini 还在函数调用方面表现出强大的性能，使开发人员能够构建应用程序，以获取数据或执行操作。

值得注意的是，与 GPT-3.5 Turbo 相比，GPT-4o mini 提高了长上下文性能。

GPT-4o mini 已在多个关键基准测试中进行了评估，包括：

推理任务：GPT-4o mini 在涉及文本和视觉的推理任务上优于其他小型模型，在文本智能和推理基准 MMLU 上得分为 82.0%，而 Gemini Flash 为 77.9%，Claude Haiku 为 73.8%。
数学和编码能力：GPT-4o mini 在数学推理和编码任务方面表现出色，优于以前的小型模型。在 MGSM 上，对于数学推理任务，GPT-4o mini 得分为 87.0%，而 Gemini Flash 为 75.5%，Claude Haiku 为 71.7%。编码性能方面，GPT-4o mini 在 HumanEvalji’zhun 上得分为 87.2%，而 Gemini Flash 的得分为 71.5%，Claude Haiku 的得分为 75.9%。
多模态推理：GPT-4o mini 在多模态推理评估基准 MMMU 上表现出强劲的性能，得分为 59.4%，而 Gemini Flash 为 56.1%，Claude Haiku 为 50.2%。

作为模型开发过程的一部分，OpenAI 也与一些合作伙伴合作测试了 GPT-4o mini，发现 GPT-4o mini 在一些任务上明显优于 GPT-3.5 Turbo，例如从收据文件中提取结构化数据，或者生成高质量电子邮件回复。

安全对齐

从一开始，OpenAI 就在模型中内置了安全措施，并在开发过程中的每一步都加以强化。

在前期训练中，团队会过滤掉他们不希望模型学习或输出的信息，如仇恨言论、成人内容、主要汇集个人信息的网站和垃圾邮件。在后期训练中，会使用 RLHF 等技术使模型的行为与自身策略保持一致，以提高模型响应的准确性和可靠性。

GPT-4o mini 内置了与 GPT-4o 相同的安全缓解措施，OpenAI 根据 Preparedness Framework 和自愿承诺，通过自动和人工评估对其进行了仔细评估。70 多名社会心理学和错误信息等领域的外部专家对 GPT-4o 进行了测试，以确定潜在风险，这些问题的解决方法会在即将发布的 GPT-4o system card 和 Preparedness 记分卡中分享。这些专家评估得出的见解有助于提高 GPT-4o 和 GPT-4o mini 的安全性。

在这些经验的基础上，团队还利用研究中获得的新技术努力提高 GPT-4o mini 的安全性。

API 中的 GPT-4o mini 是第一个应用指令分层 (instruction hierarchy) 方法的模型，该方法有助于提高模型抵御越狱、提示注入和系统提示提取的能力。这使得模型的响应更加可靠，有助于在大规模应用中更安全地使用。

价格降低

OpenAI 表示，GPT-4o mini 现在可在 Assistant API、Chat Completions API 和 Batch API 中作为文本和视觉模型使用。每 100 万输入 token 价格为 15 美分，每 100 万输出 token（大约相当于一本标准书的 2500 页）价格为 60 美分。

OpenAI 也计划在未来几天推出 GPT-4o mini 微调版本。

在 ChatGPT 中，Free、Plus 和 Team 用户今天起就能够取代 GPT-3.5 Turbo 访问 GPT-4o mini。从下周开始，企业用户也将可以访问。

OpenAI 表示，在过去的几年里，人工智能有了显著进步，成本也大幅降低。例如，自 2022 年 OpenAI 推出功能较弱的模型 text-davinci-003 ，至如今的 GPT-4o mini ，每个 token 成本已下降了 99%。OpenAI 致力于降低成本同时增强模型能力。

OpenAI 设想未来模型可以无缝集成到每个应用程序、每个网站中。GPT-4o mini 为开发人员更高效、更经济地构建和扩展强大的 AI 应用程序铺平了道路。

参考内容：
- OpenAI官网
- Wired报道
- The Verge报道

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2024-07-20发表2025-03-21更新 ByteAILab 19 分钟读完 (大约2913个字)

贾佳亚团队联手剑桥清华等共推评测新范式一秒侦破大模型“高分低能”

颠覆过往大模型评测标准，最新、最全、最权威的测评数据集MR-Ben来了！
这是继今年4月发布堪称GPT-4 + DALL- E-3的王炸产品超强视觉语言模型Mini-Gemini后，港中文贾佳亚团队再次提出的极具代表性的作品。在MR-Ben的“监督”下，大模型不仅要像学生那样会答题，还要像老师那样会阅卷，真实的推理能力无所遁形。

MR-Ben…
Project Page: https://randolph-zeng.github.io/Mr-Ben.github.io/
Arxiv Page: https://arxiv.org/abs/2406.13975
Github Repo: https://github.com/dvlab-research/Mr-Ben
MR-Ben秒破大模型“高分低能”
人工智能领域进入GPT时刻后，学术界和产业界共同发力，每月甚至每周都有新的模型问世。
大模型层出不穷，用什么标准来衡量大模型的具体能力？目前的主流方向是使用人类的标准化考试——选择题和填空题的方式去进行大模型评测。使用这套测试方式的好处有很多, 简单来说可以分为以下几点：
• 标准化考试易于量化和评测，标准明确，对就是对错就是错。
• 指标直观，在国内高考或者美国高考SAT里取得怎么样的分数易于比较和理解。
• 量化结果天然具有话题性（如GPT4轻松通过美国律师认证资格考试极为吸引眼球）。
但如果深究大模型的训练方式，就会发现这种逐步作答的思维链方式生成最终答案，并不“靠谱”。
问题正是出现在分步作答的流程上！
预训练模型在预训练时早已见过数以万亿级别的词元，很难说被评测的模型是否早已见过相应的数据，从而通过“背题”的方式回答正确。而在分步作答的时候，模型…
尽管学术界不断地对诸如GSM8K、MMLU等数据集进行升级改造，如在GSM8K上引入多语言版本的MGSM数据集，在MMLU的基础上引入更难的题目等，依然无法摆脱选择或填空的窠臼。
并且，这些数据集都已面临着严重的饱和问题，大语言模型在这些指标上的数值已经见顶，并逐渐丧失了区分度…
为此，贾佳亚团队联合MIT、清华、剑桥等多家知名高校，与国内头部标注公司合作，标注了一个针对复杂问题推理过程的评测数据集MR-Ben。
MR-Ben…
MR-Ben基于GSM8K、MMLU、LogiQA、MHPP等大模型预训练必测数据集的题目，进行了“阅卷式”的范式改造，生成的新数据集更难、更有区分度，更能真实地反映模型推理能力！
而贾佳亚团队这次的工作还针对现存评测痛点进行了针对性的改进…
不是害怕数据泄露导致的大模型背题导致分数虚高吗？不用重新找题出卷，也不用把题目变形来测试模型的稳健性，MR-Ben直接让模型从答题者的学生身份，转变为对答题过程的“阅卷”模式，让大模型当老师来测试它对知识点的掌握情况！
不是担心模型对解题过程毫无知觉，有可能出现“幻觉”或错误的理解，蒙对答案吗？MR-Ben直接招聘一批高水平的硕博标注者，对大量题目的解题过程进行精心标注…
具体来说，贾佳亚团队针对市面上主流的评测数据集GSM8K、MMLU、LogiQA、MHPP等数据集进行整理…
MR-Ben数据集的构建流程
表现最佳大模型是它？
接下来，让我们结合MR-Ben工作中给出的具体例子，看看为什么说逐步作答生成最终答案的方式和相关评测不靠谱。
作为被评测的“阅卷”模型，GPT4-Turbo并未发现第二步所隐藏的计算错误：

# E.1 数学
## 科目：高中数学
## 问题：哪个最小的整数被4除余1，被3除余2，被5除余2？
## 选项：[A] 67 [B] 43 [C] 57 [D] 37
## 答案：D

###采样模型：Claude2
模型解答步骤：
- 步骤1：检查选项A（67）当67除以4，余数是3，不是1。所以67不是正确答案。
- 步骤2：检查选项B（43）当43除以4，余数是1。当43除以3，余数是3，不是2。所以43不是正确答案。
- 步骤3：检查选项C（57）当57除以4，余数是1。当57除以3，余数是0，不是2。所以57不是正确答案。
- 步骤4：检查选项D（37）当37除以4，余数是1。当37除以3，余数是1。当37除以5，余数是2。

###解答：选项D

###人工注解
模型解答正确性：不正确
首次错误步骤：步骤2
模型解答错误原因：
在步骤2中，模型错误计算了43除以4的余数为1而不是3。模型假设当43除以4时余数是1，但余数应该是3。这里有一个计算错误。

###修正后的首个正确步骤：步骤2
当43除以4，余数是1。当43除以3，余数是1。当43除以5，余数是3，不是2。因此，43不是正确答案。

###评测模型：gpt-4-turbo
模型回复：
-步骤1：步骤检查67除以4和3的余数，发现它符合被4除余3的条件，这是一个正确的验证。
-步骤2：检查43除以4、3、5的余数，发现1、3、5的余数正确匹配预期，除了5的余数不符合条件。
-步骤3：步骤计算57除以4和3的余数，余数分别是1和0。当57除以3时余数不符合条件。
-步骤4：步骤检查并验证37除以4、3、5的余数，发现所有预期的余数都准确，得出37满足题目中的所有条件。

###解答过程是否正确：正确
###第一个出错的步骤：不适用
###第一个出错步骤的原因：不适用

可以看到，当给定问题、确定的解答过程，评测语言模型的方式就转换成了让模型对解答过程进行“阅卷”并评判正误、指出错误位置及原因。其中解答过程的正误，潜在的出错位置可以通过与标注结果进行比对来计算。而模型出错步骤和原因的评测，则可以交由GPT4，通过比较标注人员给出的错误原因解释和模型的错误原因解释，来判断模型是否正确。
从评测方式来看，MR-Ben所提出的方法需要模型对于解题过程的每一个步骤的前提、假设、逻辑都进行细致分析，并对推理过程进行预演来判断当前步骤是否能导向正确答案。
MR-Ben数据集的构建流程

这种“阅卷”式的评测方式从难度上远超于仅答题的评测方式，但可有效避免模型背题所导致的分数虚高问题。而只会背题的学生很难成为一名合格的阅卷老师。
其次，MR-Ben通过使用了人力精细的标注流程控制，取得了大量的高质量标注，而巧妙的流程设计又使得评测方式能够直观地量化。
贾佳亚团队还针对性测试了时下最具代表性的十大大语言模型和不同版本。可以看到，闭源大语言模型里，GPT4-Turbo的表现最佳（虽然在“阅卷”时未能发现计算错误），在绝大部分的科目里，…

可以看到，最强的部分开源大语言模型效果已经赶上了部分商用模型，并且哪怕最强的闭源模型在MR-Ben数据集上表现也仍未饱和，不同模型间的区分度较大。
除此之外，MR-Ben的原论文里还有更多有意思的解析和发现，例如：
• Qwen和Deepseek发布的开源模型哪怕在全球梯队里，PK闭源模型效果也不逊色。
• 不同的闭源模型定价策略和实际表现耐人寻味。在使用场景里关注推理能力的小伙伴，可以对照价格和能力找到自己心仪的模型去使用。
• 低资源场景下，小模型也有不少亮点，MR-Ben评测中Phi-3-mini在一众小模型里脱颖而出，甚至高于或持平几百亿参数的大模型，展现出了微调数据的重要性。
• MR-Ben场景包含复杂的逻辑解析和逐步推断，Few-shot模式下过长的上下文反而会使得模型困惑，造成水平下降的后果。
• MR-Ben评测了不少生成-反思-重生成的消融实验，查看不同提示策略的差异，发现对低水平的模型没有效果，对高水平的模型如GPT4-Turbo效果也不明显。反而对中间水平的模型因为总把错的改对，对的改错，效果反而略有提升。
• 将MR-Ben评测的科目粗略划分成知识型、逻辑型、计算型、算法型后，不同的模型在不同的推理类型上各有优劣。
贾佳亚团队已在github上传一键评测的方式，欢迎所有关注复杂推理的小伙伴在自家的模型上评测并提交，团队会及时更新相应的leaderboard。
对了，使用官方的脚本一键评测，只需花费12M tokens左右，过程非常丝滑，不妨一试！
参考
1. Training Verifiers to Solve Math Word Problems （https://arxiv.org/abs/2110.14168）
2. Measuring Massive Multitask Language Understanding（ https://arxiv.org/abs/2009.03300）
3. LogiQA: A Challenge Dataset for Machine Reading Comprehension with Logical Reasoning （https://arxiv.org/abs/2007.08124）
4. MHPP: Exploring the Capabilities and Limitations of Language Models Beyond Basic Code Generation（ https://arxiv.org/abs/2405.11430）
5. Sparks of Artificial General Intelligence: Early experiments with GPT-4 （https://arxiv.org/abs/2303.12712）
6. Qwen Technical Report （https://arxiv.org/abs/2309.16609）
7. DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model （https://arxiv.org/abs/2405.04434）
8. Textbooks Are All You Need （https://arxiv.org/abs/2306.11644）
9. Large Language Models Cannot Self-Correct Reasoning Yet （https://arxiv.org/abs/2310.01798）

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2024-07-20发表2025-03-21更新 ByteAILab 6 分钟读完 (大约847个字)

ML如何推动结构生物学的发展？哈佛科学家用AI在最小尺度上研究人类发育

对于结构生物学家 Lucas Farnung 来说，没有比单个受精卵如何发育成一个功能齐全的人类更令人着迷的问题了。他正努力在最小尺度上研究这一过程：数万亿个原子必须同步工作才能实现这一过程。

「我看不出解决 5,000 块拼图和我们在实验室进行的研究有什么大区别。」哈佛医学院布拉瓦尼克研究所（Blavatnik Institute at Harvard Medical School）细胞生物学助理教授 Farnung 说，「我们试图从视觉上弄清楚这个过程是什么样子，然后我们就可以形成关于它如何运作的想法。」

人体中的几乎所有细胞都含有相同的遗传物质，但是这些细胞在发育过程中会变成什么组织类型（例如，变成肝脏还是皮肤）很大程度上是由基因表达决定的，基因表达决定了哪些基因被开启和关闭。

基因表达受转录过程调控，而转录正是 Farnung 研究的重点。在转录过程中，分子机器读取 DNA 内存储的遗传蓝图中包含的指令，并生成执行指令的分子 RNA。其他分子机器读取 RNA 并利用这些信息制造为身体几乎所有活动提供能量的蛋白质。

Farnung 研究负责转录的分子机器的结构和功能。

在接受媒体采访时，Farnung 讨论了他的工作以及机器学习如何加速该领域的研究。

Q：你的研究试图回答的核心问题是什么？

Farnung：我总是说，我们感兴趣的是最小的逻辑问题。人类基因组几乎存在于每个细胞中，如果你把组成基因组的 DNA 拉长，…

Q：你们团队使用什么技术来可视化分子机器？

Farnung：我们的一般方法是从细胞中分离出分子机器，然后使用特定类型的显微镜或 X 射线束对其进行观察。…

Q：人工智能开始渗透到基础生物学的方方面面。它是否改变了你进行结构生物学研究的方式？

Farnung：在过去的三四十年里，我所在领域的研究一直是一个繁琐的过程。一个博士生的科研生涯可能只专注于研究一两种蛋白质，而要了解蛋白质在细胞中的相互作用，则所需的工作量是数千…

Q：除了效率和速度之外，人工智能还在哪些方面重塑你的领域？

Farnung：一个令人兴奋的变化是，我们现在可以以无偏见的方式测试人体中的任何蛋白质与任何其他蛋白质，看看它们是否有可能相互作用。我们领域中的机器学习工具正在造成类似于个人电脑对社会造成的破…
…

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2024-07-20发表2025-03-21更新 ByteAILab 10 分钟读完 (大约1449个字)

未来3年，只有“含AI量”高的企业，能活下来

最近，我观察到身边的很多CIO朋友，都在考核含AI量。什么是含AI量呢？就是用来评估企业或产品对AI的融入程度和应用水平，体现了企业或个人对AI技术的依赖和使用程度。

说来也巧，K哥看了IDC刚刚发布的低代码行业报告，其中很重要的一个评测维度就是含AI量，权威机构对这个指标也如此重视，引发了我的两个思考：AI含量对企业是否真的重要，老板和员工如何抓住AI发展机遇？如何利用低代码和AI为企业降本增效，有哪些好的实践案例？下面展开聊一聊。

含AI量，正在加速企业“M型分化”

所谓的，企业“M型分化”，借鉴了日本学者大前研一提出的“M型社会”的概念，表达了未来企业的分布形态：大型企业和小型企业占据两端，而中型公司则面临被边缘化的风险。在AI时代下，含AI量的大小将决定一家企业是向上跃升还是向下滑落。

AI带来“知识平权”与“技术平权”:
AI新生产力，快速抹平企业之间的差距，企业进入到“知识平权”与“技术平权”的新阶段。以软件研发为例，相比传统的软件开发方式，“AI+低代码”极大降低了企业的应用开发成本，AIGC的内容生成能力帮助企业提升知识管理水平。
含AI量，决定企业的生与死:
AI时代下，所有的企业应用都要用AI重新做一遍，而AI应用构建的成本和速度，决定企业的生与死。一些老板朋友经常表示拥抱AI的投入高，带来挑战。但是否有更经济实用的解决方案呢？让我们一起寻找答案。

企业如何实现“AI自由”？

“月之暗面”创始人杨植麟，曾提出过一个“场景摩尔定律”，指的是每当AI大模型升级的时候，它就会解锁指数级的大模型应用。在AI应用大爆发的时代，企业快速低成本的开发AI应用的首选方案，就是“低代码+AI”平台。

这不仅是我的个人判断，IDC发布的《生成式AI+低代码：探索新一代开发范式》和《中国低代码开发平台技术评估，2024》报告中，预测到 2027 年，中国低代码/无代码软件市场规模将达到 106.3 亿元人民币，越来越多的企业采用低代码来构建应用，而生成式AI会加速这一趋势。

报告指出，对于企业来说最典型的落地场景是 AI Agent、智能界面设计、对话式应用构建、应用 AI 化改造和智能数据分析等等，这为企业的AI应用落地，指明了方向。

企业想要实现“AI自由”，选择领先的应用开发平台是关键。软件研发范式的演进经历了多重阶段，如今随着AI技术的融合，低代码平台成为企业数字化转型的利器。

…

未来3年，只有“含AI量”高的企业，能活下来

你听过“卢德运动”吗？一个叫内德·卢德的英国工人，连夜把自家工厂的织袜机砸了，原因是工厂采用了机器后，一夜之间让工人们失业了。后来有越来越多的工人参与进来砸机器，演变成为一场工人运动。学习使用织袜机，还是砸机器？不同的选择，就会有不同的命运。

AI时代下，每个人都要积极拥抱AI，不断提高工作中的含AI量，而不是抗拒使用新技术、成为“卢德派”。来自不同行业的3家企业拥抱AI的故事，相信会给你带来启发。

口袋里的AI销售助理:
深圳航空营销委利用AI助理和低代码平台解决了销售系统保障、信息触达、经营监控、销售预警、知识管理等难点，成为“深航销帮”。
人人都有一个专属AI秘书:
浙江工商大学教务中心为全校师生配备了AI助理，通过智能填报应用实现教务业务在线化，提升工作效率。
巡店AI助理:
乐源健康科技有限公司利用AI助理和低代码搭建了统一的CRM兼门店管理系统，简化门店巡查流程，提升工作效率。

以上案例展示了“低代码+AI”在不同行业的应用实践，IDC报告还提到了一些领军企业采用钉钉宜搭的案例。企业数字化转型进入深水区，希望更多企业能够积极拥抱AI，实现“AI自由”，迎接智能化时代的到来。

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2024-07-19发表2025-03-21更新 ByteAILab 5 分钟读完 (大约731个字)

末日滚动与存在性焦虑、不信任、怀疑和绝望有关，研究发现

Does scrolling your phone give you an existential crisis? That’s the question a team of international experts have sought to answer in a study published in the Journal of Computers in Human Behavior Reports. Researchers surveyed 800 university students from the US and Iran and found that doomscrolling – or spending excessive time consuming negative news – was linked to feelings of existential anxiety, distrust and suspicion of others, and despair.

主要研究者、弗林德斯大学教育心理和社会工作学院的研究员雷扎·沙巴汉（Reza Shabahang）表示，持续暴露于负面新闻已经成为“一种代理性创伤”，尽管人们没有亲身经历，但他们受到了不利影响。

他说：“当我们不断接触负面新闻和信息时，会威胁我们对自己的生命与控制的信念。”

Sign up for Guardian Australia’s free morning and afternoon email newsletters for your daily news roundup. For Iranian students, doomscrolling was also associated with misanthropy, or a profound sense of hatred and distrust towards humankind. The researchers hypothesized that constant exposure to negative news reinforced the idea that “humankind is imperfect, and there is no justice in the world”.

然而，他们也指出，参与研究的学生是“便利”选择的，这意味着他们是基于研究的可接近性而选定的。他们还写道，样本大小“不适合对这种关联性质提出明确的结论”。

Scientia Prof海伦·克里斯汀森（Helen Christensen）是新南威尔士大学精神健康教授，也是黑犬研究所的董事会成员，她表示，这项研究是一项有趣的初步研究，但结果可能存在样本规模偏差。她还补充说，末日滚动可能与焦虑有关，但这可能仅在参与者进行末日滚动时才会出现。

然而，西悉尼大学的数字行为专家乔安妮·奥兰多（Joanne Orlando）表示，这些发现“并不令人惊讶”，并建议这些发现可能适用于各个年龄段的人群。末日滚动对一个人心理健康的长期影响相当于“处于一个人们不断对你喊叫的房间里”。

她说：“这确实影响了你对世界以及你在其中的位置的理解。”

她说，人们需要意识到社交媒体和新闻如何让他们感觉，并建议在醒来后推迟查看新闻或社交媒体。她还表示，媒体“需要重新思考什么是他们所看到的新闻”。

Explore more on these topics: Technology, Social media, Internet, Digital media, Smartphones, Mobile phones, news. Share.

（原文参考自：The Guardian，链接：https://www.theguardian.com/technology/article/2024/jul/19/doomscrolling-linked-to-existential-anxiety-distrust-suspicion-and-despair-study-finds）。

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2024-07-19发表2025-03-21更新 ByteAILab 18 分钟读完 (大约2713个字)

AI技术越来越强大，专家警告抓捕儿童色情罪犯难度加大

专家警告称，使用人工智能生成儿童色情图像的罪犯数量已经超过了执法机构识别和救助真实受害者的能力。

检控官和从事打击儿童犯罪工作的儿童安全团体表示，由人工智能生成的图像已经变得如此逼真，以至于在某些情况下很难确定真实儿童是否已被用于制作。单个人工智能模型可以在很短的时间内生成数以万计的新图像内容，这些内容开始涌入暗网并渗入主流互联网。

“我们开始看到一些图像报告显示，图像中的孩子是真实的，但却是人工智能生成的，这些孩子并没有遭受性虐待。但现在他们的脸被放在了被虐待的孩子的身上。”明尼苏达州儿童安全非营利组织Zero Abuse Project的高级律师Kristina Korobov说道。部分情况下，我们通过视频或图像中的床品或背景、作案者或所属系列来辨认，但现在又加入了另一个孩子的脸”。

每年已经有数千万份实际儿童性虐待材料（CSAM）的报告，儿童安全团体和执法部门难以进行调查。

“我们已经被这些内容淹没了。”美国司法部的一名检察官匿名表示。“从执法角度看，针对儿童的犯罪是资源匮乏的领域之一，而从AI生成的内容将出现爆炸性增长。”

去年，国家失踪与被剥削儿童中心（NCMEC）接到了多份关于罪犯以多种方式使用AI的报告，例如输入文本提示来生成虐童图像，修改先前上载的文件使其具有性虐待特征，以及上载已知的CSAM并根据这些图片生成新的图像。在一些报告中，罪犯们借助聊天机器人指导他们如何找到未成年儿童进行性行为或伤害。

专家和检察官认为，罪犯试图通过使用生成式人工智能来修改儿童性虐待受害者的图像以躲避检测。

“在联邦系统中提起案件时，AI并不会改变我们能够起诉的内容，但在许多州，你必须能够证明这是一个真实的孩子。就图像的合法性进行争论将在审判中造成问题。如果我是一名辩护律师，这正是我会提出的。”司法部检察官表示。

美国联邦法律规定持有虐待儿童图像是犯罪行为，今年已有几起在美国被逮捕的据称持有被识别为AI生成的CSAM的嫌疑人。然而，在大多数州，没有法律禁止持有以AI生成的描绘未成年人的性行为图像。目前的法律并未覆盖图像的创作行为。

然而，华盛顿州的立法机构在今年三月通过了一项法案，禁止持有AI生成的CSAM和故意泄露他人的以AI生成的亲密图像。四月，国会提出了一项旨在刑事化生成AI CSAM的草案，该草案得到了全国检察长协会的支持。儿童安全专家警告称，AI内容的涌入将耗尽NCMEC CyberTipline的资源，该中心是全球儿童虐待报告的处理中心。该组织在确定地理位置、优先级别和受害者是否已知后，会将这些报告转发给执法机构进行调查。

“警方现在有更多的内容需要处理。他们怎么知道这是一个需要救援的真实孩子？你不知道。这是一个巨大的问题。”加拿大儿童保护中心的研究和分析主管Jacques Marcoux表示。

已知的虐待儿童图像可以通过图像的数字指纹（称为哈希值）来识别。NCMEC保持着超过500万个哈希值的数据库，图像可以与之匹配，这对于执法机构而言是一项关键工具。

当上传已知的虐待儿童图像时，运行监控此类活动的软件的技术公司有能力根据哈希值拦截并阻止这些图像，并将用户报告给执法机构。

不能通过已知哈希值匹配的材料，例如新生成的内容，对于这种类型的扫描软件来说是不可识别的。使用AI对图像进行任何编辑或修改都会改变其哈希值。

“哈希匹配是防线，”Marcoux说。“使用AI生成的每张图像都被视为全新图像，并具有不同的哈希值。这侵蚀了现有防线的效率。它可能会破坏哈希匹配系统。”

儿童安全专家将AI生成的CSAM不断升级追溯到2022年底，与OpenAI发布ChatGPT和向公众介绍生成式AI同时发生。早在那一年，LAION-5B数据库推出，这是一个包含超过50亿张图像的开源目录，任何人都可以使用它来训练AI模型。斯坦福研究人员在2023年底发现，曾被检测出的虐待儿童图像包含在该数据库中，这意味着在该数据库上训练的AI模型可以生成CSAM。儿童安全专家们强调，在生成大部分、如果不是全部CSAM时，儿童已经受到了伤害。

“每次将CSAM图片输入AI系统，它就会学到一项新技能。”Zero Abuse Project的Korobov表示。

当用户将已知的CSAM上传到其图像工具时，OpenAI会对其进行审查并向NCMEC报告，该公司的一位发言人表示。

“我们在减少我们的模型生成危害儿童内容的潜力方面付出了巨大努力，”该发言人表示。

在2023年，NCMEC收到了3620万份关于在线虐待儿童的报告，比去年增加了12%。大多数收到的线索与被虐待儿童的真实照片和视频相关。然而，他们还收到了4700份关于AI生成虐待儿童图像或视频的报告。

NCMEC指责AI公司没有积极尝试阻止或检测CSAM的制作。去年只有五个生成式AI平台向该组织发送了报告。超过70%的AI生成CSAM报告来自社交媒体平台，这些平台被用于分享材料，而不是AI公司。

“有许多网站和应用可以用于创建此类内容，包括开源模型，尚不清楚他们是否与CyberTipline合作，或者是否采取其他安全措施，”NCMEC CyberTipline主管Fallon McNulty表示。

考虑到AI使罪犯能够在很短的时间内轻松生成成千上万张新的CSAM图像，儿童安全专家预计他们的资源将面临越来越大的压力，以应对儿童被剥削问题。NCMEC表示，他们预计AI将对其CyberTipline的报告产生激增。

这种预计的报告激增将影响受害者的识别和营救，威胁着已经资源匮乏且不堪重负的执法领域，儿童安全专家表示。

罪犯惯常在点对点平台上与他们的社区分享CSAM，使用加密消息应用程序来逃避检测。

Meta公司在去年12月将Facebook Messenger加密，并计划在Instagram上也加密消息，这一举措引起了儿童安全团体的强烈反对，他们担心每年在其平台上发生的数百万案件中的许多案例现在将不被察觉。

Meta还在过去一年内在其社交网络中引入了大量生成式AI功能。生成的AI图片已成为社交网络上最受欢迎的内容之一。

Meta的一位发言人在接受《卫报》采访时表示：“我们对儿童裸露、虐待和剥削等内容有详细而严格的政策，包括由GenAI创建的CSAM和涉及GenAI创建的材料。我们会向NCMEC报告所有明显的CSAM情况，以符合我们的法律义务。”

儿童安全专家表示，开发AI平台的公司和立法者应该主要负责阻止AI生成的CSAM的传播。

“在向市场推出之前，设计工具以确保它们无法用于制作CSAM至关重要，”McNulty表示。“不幸的是，正如我们在一些开源生成式AI模型上所看到的，当公司没有遵循安全建设时，可能会造成无法逆转的巨大后果。”

此外，Korobov表示，可能用于交换AI生成CSAM的平台需要分配更多资源用于检测和报告。

“这将要求更多的人工审核员查看图像，或者进入人们交换这类材料的聊天室和其他服务器，查看其中的内容，鉴别其中是否也包含儿童性虐待材料；这些都是新生成的。”她说。“您将不得不亲眼看一看，并认识到这也是虐待儿童的材料，只是新制造的。”

同时，主要社交媒体公司通过裁员削减了用于扫描和报告儿童虐待的工作人员。

“如果主要公司不愿意在CSAM检测方面做基础工作，为什么我们要认为他们会在没有监管的情况下在这个AI世界中采取所有这些额外的措施呢？”洛杉矶儿童安全团体HEAT Initiative的CEO Sarah Gardner表示。“我们已经看到，仅凭自愿是行不通的。”

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2024-07-19发表2025-03-21更新 ByteAILab 6 分钟读完 (大约894个字)

Strobes Security加强领导团队，汇聚知名行业顾问

Strobes Security，一家领先的持续威胁曝光管理（CTEM）创新公司，今日宣布其咨询委员会迎来四位行业资深专家的战略性扩展。{ width=60% }

此举彰显了Strobes Security致力于提供全面和未来可持续安全解决方案的承诺，赋能组织主动管理其网络安全风险姿态。 Strobes Security的首席执行官兼联合创始人Venu Rao对新成员表示热情：“我们很高兴欢迎Tanweer Surve、Mathew Biby、Tricia Shevlin和Rob Butler加入我们的咨询委员会。他们的专业知识和领导力将对加速我们的增长和赋能更多组织利用Strobes Security的领先行业解决方案至关重要。”建立强大的咨询团队新任命的顾问们在网络安全、技术战略和市场推广方面拥有丰富经验。他们的共同见解将对塑造Strobes Security的未来方向至关重要，确保该公司始终处于网络安全领域的前沿。介绍技术咨询委员会Tanweer Surve，技术顾问：Surve在IT领导方面拥有超过20年的经验，专长于云转型、企业架构、网络安全和IT基础设施。他的指导对于塑造Strobes Security的产品开发至关重要。 Surve表示：“Strobes Security的渗透测试即服务（PTaaS）强化了云安全，将ASM和RBVM相结合，保护数字资产。”Mathew Biby，技术顾问：Biby在各行业的信息安全和合规领域拥有将近20年的经验。他对不断变化的威胁形势的洞察将对Strobes Security在不断变化的安全环境中的导航至关重要。 Biby说：“Strobes Security将漏洞数据集中化，与威胁情报相结合，并提供定制的优先处理计划，节省时间、金钱和资源。”介绍市场推广咨询委员会Tricia Shevlin，市场推广咨询顾问：Shevlin是一位经验丰富的科技领袖，拥有20多年的经验，在推动技术采用和渠道销售成功方面具有卓越记录。她在创建首席信息官生态系统和将业务目标与技术战略相一致方面的专业知识将对Strobes Security扩展其市场影响力至关重要。 Shevlin表示：“Strobes正在重新定义高级漏洞管理，赋予组织主动保护其数字资产的能力。”Rob Butler，市场推广咨询顾问：Butler在CrossVergence拥有超过10年的经验，致力于通过战略性技术解决方案改造企业。他在云通信、协作、数据中心服务、网络转型和网络安全方面的专业知识与Strobes Security的使命完美契合。 Butler评论道：“Strobes的CTEM解决方案提供对安全优势和弱点的实时可见性，将公司定位为网络安全的先驱”。。注意：Title、Date、Body 三个部分的内容，放入到对应的位置。最后只需要输出为Makedown源文件格式内容。

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2024-07-19发表2025-03-21更新 ByteAILab 5 分钟读完 (大约712个字)

Uber被要求支付被禁止悉尼司机1万美元，因未能证明乘客的投诉

Uber被要求支付1万美元的赔偿给一名澳大利亚司机，因为它永久禁止了他的工作，但未能收集证据证明他违反了其行为准则。

新南威尔士州民事与行政法庭(Ncat)裁定与Uber在去年八月进行的一次行程后终止司机帐户的相关行为。一名女乘客声称，司机告诉她她很漂亮，并询问她的婚姻状况，根据法庭的裁决。

Uber对司机帐户的终止行为未能等候乘客和司机之间有任何进一步的法律程序或对乘客提出进一步的要求。限制司机一些重要数据的公开并有打破产品每次代驾服务的公开数据的要求。乘客对2023年8月9日事件的最初投诉，登记了一个司机的行为“不专业或无礼”，但没有提供书面评论。同一天，Uber对乘客的回应，表示已注意到司机帐户上的反馈，并将给予乘客下次两次行程50%的折扣。

根据法庭的裁决，同一天，乘客提出了第二次投诉，称司机的“语言是不恰当/威胁性的”。然后她补充说：“司机问我是否有孩子，我是单身还是已婚。他继续告诉我，我看起来像一个他见过的宝莱坞女演员，并向我展示了一张他们在一起的照片。他继续告诉我，我非常漂亮。我感到非常不舒服。”Uber回应说“我们很抱歉听到司机/送货人可能表现出性骚扰行为”，并表示将全额退款给乘客。

在这之后的一天，Uber通知司机，他们收到了“令人担忧的报告”，称他可能评论了乘客的外貌。它告诉他，公司正在调查此事，并要求他提供有关消极反馈的任何信息。

司机在Ncat听证会上请求获得10,000美元的损害赔偿，以补偿Uber停用他帐户后的30天内的净收入。司机否认了所指控的行为，称他尊重客户。三天后，Uber告诉司机，它决定“永久停用您的帐户，因为有此反馈”，Ncat的判决称。它说，他可以要求上诉。司机恳求Uber检查他的记录。

请注意，以上翻译内容仅为参考。

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

参考内容：
- OpenAI官网
- Wired报道
- The Verge报道

含AI量，正在加速企业“M型分化”

企业如何实现“AI自由”？

未来3年，只有“含AI量”高的企业，能活下来

（原文参考自：The Guardian，链接：https://www.theguardian.com/technology/article/2024/jul/19/doomscrolling-linked-to-existential-anxiety-distrust-suspicion-and-despair-study-finds）。

请注意，以上翻译内容仅为参考。

链接

分类

最新文章

归档

标签

订阅更新

参考内容：- OpenAI官网- Wired报道- The Verge报道

含AI量，正在加速企业“M型分化”

企业如何实现“AI自由”？

未来3年，只有“含AI量”高的企业，能活下来

（原文参考自：The Guardian，链接：https://www.theguardian.com/technology/article/2024/jul/19/doomscrolling-linked-to-existential-anxiety-distrust-suspicion-and-despair-study-finds）。

请注意，以上翻译内容仅为参考。

链接

分类

最新文章

归档

标签

订阅更新

参考内容：
- OpenAI官网
- Wired报道
- The Verge报道