GPTNB · AI资讯与技术分享站

2024-05-24发表2025-03-21更新 ByteAILab 7 分钟读完 (大约986个字)

简化企业合规流程
Kim（www.kimdocument.com）是一家无代码、SaaS模式、受专利保护的文档生成、组装和工作流自动化平台，已推出一款“AI技术使用与合规应用”，以帮助组织满足其在日常业务中使用人工智能（AI）时的法规要求。![图片](https://ai-techpark.com/wp-content/uploads/2024/05/Kim-960x540.jpg){ width=60% }

2024年4月22日，英国金融行为监管局（FCA）和英国央行（BoE）（包括英国审慎监管局（PRA））发布了关于公司使用AI的方法更新。所有公司都需要能够向监管机构解释他们如何使用AI。这将涉及解释如何识别、评估和管理与部署AI相关的风险。简而言之，当监管机构询问时，公司需要解释其管理与AI相关风险的方法。
Kim已配置了一款“AI技术使用与合规应用”，作为旗下用于法律公司、会计公司和金融服务公司合规功能的工具套件之一。这款Web表格应用帮助公司：
评估和管理风险；记录他们的AI使用情况；报告给内部董事会、治理和审计委员会；满足外部合规和监管要求；拥有审核审查和更新的审计跟踪。
Kim应用分为两个部分。第一个选项卡是“公司概况”，涵盖公司使用AI的一般方法。第二个选项卡“使用的AI工具”允许公司确认正在使用哪些AI工具以及用途。
Kim的销售副总裁Samantha Jefferies解释说：“这款应用现已提供给所有现有客户。他们将其导入到自己的Kim实例中并使用。然后，他们可以填写公司详细信息，并根据需要随时更新，以便供内部/外部审计目的使用。
这是一个需要每次新的AI工具入职或公司对AI使用方法发生变化时进行填写的活动文档。每当Kim Web表单提交后，它都会自动更新和版本控制文档（Word和/或PDF）以供审计和内外部报告目的使用，确保始终能立即获得最新信息。”
使用Kim非常简单。一旦使用Kim的无代码向导创建了任何应用程序（Kim Web表单），它就会被发布。当用户单击Web表单链接时，该链接可以通过电子邮件发送或嵌入到现有系统中，如SharePoint、Salesforce、ServiceNow、Workday、Monday.com等，Web表单就会出现。用户填写表单，数据被捕获。Kim从中创建记录，可以生成一个或多个文档和报告，或更新其他系统。
Kim的活动功能还允许对合规和其他团队进行高效的一对多通信。上传并创建您想要填写的Kim Web表单一次，发送给多个接收者，接收回复和数据。通过结合个性化的活动创建、提醒以及全面的跟踪和报告，该功能确保合规、数据收集和信息共享实现了最佳效率。
更多信息以及请求Kim演示，请联系Becky Roberts：rebecca.roberts@kimtechnologies.com
探索AITechPark，了解人工智能、物联网、网络安全、人工智能技术新闻以及行业专家的深入见解！

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2024-05-24发表2025-03-21更新 ByteAILab 13 分钟读完 (大约1891个字)

PagerDuty发布PagerDuty运营云的创新

Advanced AI and Automation Enhancements Accelerate the Resolution of Operational Issues and Increase Revenue
PagerDuty On Tour – PagerDuty（纽约证券交易所：PD），在数字运营管理领域的全球领导者，今天为PagerDuty运营云推出了新的功能和升级。{ width=60% }

这些新功能对于正在现代化其运营中心、标准化自动化实践、转变事故管理以及自动化远程位置运营的企业至关重要。现在，团队可以利用AI和自动化以及更强大的端到端事故管理功能，比以往更快地预测、识别和解决运营问题。

PagerDuty运营云将事故管理、AIOps、自动化、客户服务运营和PagerDuty Copilot（预览版）结合成一个灵活、易于使用的平台，设计用于跨IT、DevOps、安全和业务团队的关键、时效、高影响工作。该平台通过允许组织与多个技术堆栈集成的API进行增强，为运营转型提供可靠的可用性。

“为保持竞争力，公司必须快速创新，并提供消费者期望的全天候、立即的数字体验。随着团队和工具间涌入的大量噪音，当您的团队陷入过时的系统和手动流程中时，特别是规模化时，要迅速采取行动是具有挑战性的”，PagerDuty首席产品开发官Jeffrey Hausman表示。“PagerDuty运营云让商务和IT领导者轻松跨越运营鸿沟，为其提供先进的AI和自动化功能，以应对企业运营中一些最复杂的、跨职能流程，从而释放时间和资源，集中精力开展最关键的工作，推动业务。”。

PagerDuty运营云利用生成式AI提高生产力，降低运营成本
PagerDuty Copilot（预览版）—嵌入在PagerDuty运营云中的生成式AI助手—通过使用AI和自动化来帮助团队更快、更有效地管理关键任务。通过解释自动诊断的结果，为响应者提供有用的事件背景，起草状态更新以及通过单击按钮生成事后审查草稿，PagerDuty Copilot让团队消除耗时且重复的任务，以便专注于高优先级需求。如果用户要求PagerDuty Copilot生成事后审查，它可以在几秒钟内生成一个草稿—通常需要几个小时。此外，PagerDuty Copilot可以通过简单提示快速摘要事故，从而创建事故的摘要视图。响应者进入事件时，可以利用PagerDuty生成式AI快速总结事件详细信息、Slack笔记和客户影响。PagerDuty Copilot节省响应者宝贵的时间，因为他们不再需要花时间收集分散的数据点和重要细节。

新的PagerDuty运营控制台为现代运营中心和IT运营团队提供可定制的仪表板，使其运行更加高效
PagerDuty运营控制台（预览版），最新的AIOps产品，作为新创建的事故的真实共享视图，提供了操作健康状况的实时视图。灵活的过滤器确保问题立即可发现，以便网络运营中心（NOC）和IT运营团队可以快速对问题进行分类并采取行动，以最小化业务影响并保护客户体验。团队可以通过直接在单个视图中呈现的有价值上下文加速分类和解决问题，包括问题的影响、关键见解、运行自动诊断的能力、推荐操作以及预测下一个可能的事故。

在规模化方面进行重要的自动化标准化增强
PagerDuty自动化帮助组织标准化运营、提高效率，并通过连接和自动化跨团队、系统和环境的关键工作，增强客户体验。PagerDuty工作流自动化允许开发人员和非开发人员完全自动化复杂和手动操作流程—包括人为步骤，如收集批准、做出决策或提供更新—并且可以利用PagerDuty操作手册自动化的运行簿作为过程的一部分。结果，团队减少了与人为错误相关的风险，并在运营效率方面看到了显著的改善。对PagerDuty操作手册自动化的新能力使组织能够构建、部署、运行和管理大规模的自动化任务，以便在整个业务中实现自动化标准化。项目管理运行者管理（预览版）帮助组织增加自动化的采用率，同时允许每个团队在其特定技术要求和依赖性中有效运作。

通过利用内置的端到端工作流来转变事故管理，从而降低风险，指导修复和改进
PagerDuty事故管理—一个将PagerDuty领先的事故管理产品与Jeli创新的事后审查功能相结合成一个端到端提供的企业级解决方案。PagerDuty通过Slack直接从每个事故中生成指导修复和自动化工作流，将每个事件转化为学习和改进的机会。动态叙述生成器可以将内容从Slack直接拖入事后审查。事故分析对于识别发生了什么以及为什么发生的模式至关重要，以便团队可以调整流程并避免重复问题。这让组织采取更为积极主动的方式来管理事件，从而随着时间推移提供更具韧性的运营。

支持语录
“快速提供和韧性是成功推动增长和客户忠诚的关键机制”，IDC的I&O、云运营和DevOps部门集团副总裁Stephen Elliot表示。“随着组织的发展规模化，他们需要将自动化纳入运营实践中，以继续提供中断，并达到消费级数字体验”。

可用性
PagerDuty运营控制台目前处于预览版，将于2024年第3季度普遍可用。工作流自动化已经普遍可用。PagerDuty操作手册自动化的基于项目的运行者管理目前处于预览版，将于2024年第3季度普遍可用。PagerDuty Copilot目前处于预览版，将于2024年第3季度普遍可用。包括Jeli事后审查的PagerDuty事故管理的企业计划目前普遍可用。

其他信息
在我们的博客和PagerDuty On Tour全球活动系列上了解有关PagerDuty运营云的所有最新升级的更多信息。

探索AITechPark，获取AI、物联网、网络安全、AITech News以及行业专家深入见解的最新进展！。

---
感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：[GPTNB](https://gptnb.com)。

2024-05-24发表2025-03-21更新 ByteAILab 8 分钟读完 (大约1155个字)

数据专业人士的五大最佳数据隐私认证计划

发现为数据专业人士提供基本的指导和培训解决方案的五大最佳认证计划。{ width=60% }

简介

随着远程工作的增加，技术景观逐渐变化，数据和网络安全的培训对于数据专业人士变得至关重要。应对这种转变需要培训解决方案和课程，可以根据其合规优先事项进行定制，并可以适应不同级别的专业知识、技能和对数据的暴露程度。

解决这一问题的方案是数据隐私认证，对于寻求更多关于数据隐私知识或了解新的隐私标准和保护组织数据要求的专业人士来说，这些认证是必不可少的工具。

因此，随着数字化的不断增长，AI技术园带来了一篇独家文章，将帮助您了解在这个数字世界中至关重要的五项热门认证课程。

Certified Information Privacy Professional (CIPP)
国际隐私专业人员协会（IAPP）提供CIPP认证，为专业人士提供全球隐私法律和实践的认识，以引领复杂的隐私法规领域。该计划建议适用于作为数据保护和安全专家的专业人士，他们管理商业和客户信息，并在合规、法律义务和数据治理等相关领域紧密合作。
Certified Data Privacy Solutions Engineer (CDPSE)
信息系统审计与控制协会（ISACA）推出了CDPSE课程，适用于至少在考试内容大纲中指定的两个领域具有五年以上专业经验的申请人。CDPSE课程旨在为数据专业人士、合规主任和软件工程师提供关于技术开发、产品创建或流程设计中数据隐私的知识。
PECB Certified Data Protection Officer (CDPO)
专业评估与认证委员会（PECB）推出了CDPO课程，旨在供有经验的数据保护官员获取实施GDPR合规计划所需的知识、技能和能力。要获得PECB数据保护官员认证，候选人必须通过考试，获得至少五年的数据专业人士工作经验，完成机构提供的300小时的数据保护学习，并且还需要至少五年的专业工作经验。
Certified Information Privacy Manager (CIPM)
IAPP提供另一项知名认证，即CIPM，专为隐私经理和数据专业人士设计，旨在教授建立和维护有效隐私管理计划所需的各种技能和知识。申请此课程的候选人需要通过考试，考察他们对隐私管理原则的了解和知识。
Certified in Data Protection (CDP)
身份管理协会（IMI）提供了适用于隐私官员、隐私管理人员、法律专家以及负责监督和管理隐私倡议的人员的CDP认证。该认证课程也适用于希望了解与国际安全标准和隐私法律相关的新数据保护实践的专业人士。要获得此认证，候选人必须注册IMI以深入了解数据保护，并理解CDP标识。

结论

随着商业世界的技术进步，数据泄露变得是网络攻击者的一种常见手段，为突显这一挑战，隐私监管变得更加严格。这宣告了数据专业人士扮演指南角色并革新数据隐私领域的重要性。然而，要成为值得信赖的数据专业人士和领军人物，您需要从上述列表中选择合适的认证课程，这些认证不仅能验证您在该主题上的专业知识和技能，还能在数据隐私、安全和保护领域树立权威的态度。

探索AITechPark，了解顶级人工智能、物联网、网络安全的进展，通过客座文章和链接合作扩大您的影响力。

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2024-05-24发表2025-03-21更新 ByteAILab 3 分钟读完 (大约418个字)

百川智能首款AI助手大秀神操作！Baichuan 4强势升级登顶国内第一

时隔4个月，百川智能的基座大模型又双叒升级了！新一代Baichuan 4出世直接登顶国内第一。不仅如此，首款最懂搜索、会提问的AI助手「百小应」正式杀入移动APP战场。

近半个月，国外科技大厂们连番轰炸，GPT-4o、Project Astra、Copilot+ PC的诞生让人目不暇接。
而国内大模型这边也是毫不示弱，不断地推陈出新、迭代升级。
就在今天，历时4个月打磨，百川智能发布了新一代基座大模型Baichuan 4。
不仅如此，他们还带着自家首款AI助手「百小应」杀入移动APP战场。
试玩地址：ying.ai
与吊人胃口的OpenAI不同，iOS和安卓版应用程序今天一并推出，并且免费使用。
毋庸置疑，「百小应」已经用上了升级后Baichuan 4基座大模型的能力，与其他的AI助手一样，读文件、获取最新信息、整理资料、辅助创作等各种问题，「百小应」通通可以解决。
但与众不同的是，「百小应」将Baichuan 4的能力与其天然的搜索技术优势进行了深度融合。
它不仅具备多轮搜索的能力，甚至还可以定向搜索，可以被看作是最懂搜索的AI助手。

…

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2024-05-24发表2025-03-21更新 ByteAILab 21 分钟读完 (大约3103个字)

阿里云大模型降价不是短期竞争行为，而是长期战略选择

今天，国内大模型圈十分热闹，先是阿里云宣布大模型降价，随后国内多家公司跟进、回应，掀起一轮行业的降价潮。

但与国内其它厂商仅下调轻量级模型价格的策略不同，阿里这次一共有9款模型降价，其中性能对标GPT-4的主力模型Qwen-Long，API输入价格从0.02元/千tokens降至0.0005元/千tokens，直降97%。

1块钱可以买200万tokens，相当于5本《新华字典》的文字量。

Qwen-Long实力究竟如何？根据官方的信息显示，其不仅性能达到GPT-4级别，还支持最长1000万tokens的超长上下文对话，可轻松处理约1500万字或1.5万页文档，是同级别模型之最。

近期，OpenAI的GPT-4o和谷歌的Gemini 1.5 Pro也下调了API价格。不过从性价比上来说阿里云的主力模型仍然具有优势，这次降价也显得诚意十足。

对于云计算厂商来说，没有产品力的降价是没有意义的，大模型基础能力的领先是通义千问降价的底气。自从去年8月宣布“全模态、全尺寸”开源路线以来，通义千问的技术实力已经获得了国际认可。通义千问已被多个国际权威榜单和测试基准认可，还是基于人类偏好评估大模型的开放平台Chatbot Arena中首个上榜并持续在榜的中国大模型，与GPT-4Turbo、Gemini-1.5-Pro等模型处于同一梯队。通义千问从5亿到1100亿参数的全模态、全尺寸的系列模型，也能够满足企业和开发者不同场景下的需求。

可以说阿里云的这次降价真正做到了便宜、量大、又能打。

今年年初，在和比尔·盖茨的播客节目中表示，大模型技术正处于陡峭的成长曲线上，成本也在飞快地下降，大模型门槛的降低是趋势所在。

GPT-4o发布之后，Sam Altman久违的发布了一篇个人博客，宣布了团队的阶段性目标更新：“用最低的价格甚至是免费，将最好的模型提供给世界上所有人”。这句话是代表OpenAI说的，其实也可以认为是代表微软说的。

因为“摩尔定律适用于大模型行业”不会自然发生，更不是单一一家公司能做到的，这需要硬件厂商、大模型厂商和云计算厂商之间的共同努力。如果把大模型行业比作一个庞大的工厂，那么云计算厂商就像是提供电力的公司。没有电力，工厂的机器就无法运转。

同样，没有云计算厂商提供的计算能力和存储资源，大模型的训练和推理就很难进行。没有云计算厂商提供弹性、可扩展、高效的云服务，原生AI应用普及的难度也会大大提高。

价格的降低背后则是大模型结构、训练、推理等成本的持续优化。对于阿里云这样的云厂商来说，能够把API的价格逐步降低，本质上是云计算规模游戏的必然结果。

技术进步带来的性能提升和效率增加，使得云平台能够以较低的成本提供更强大的计算服务。这一点对于大模型领域也不例外。

尤其是考虑到，GPU短缺导致算力的紧缺，如何高效利用算力，公共云服务是一种最直接、便捷的方式。

技术升级带来的是直接成本降低，而规模扩大带来的间接成本分摊。无论是大模型的训练、推理还是AI原生应用开发，阿里云提供的云计算网络和资源池，都随着客户增多，降低了供应链采购成本、研发成本分摊和资源闲置成本，从而提高了整体的成本效益。

以千问72B开源模型为例，根据阿里云的测算，如果每个月1亿token的使用量为例，在阿里云百炼上的调用成本是每月600元人民币，而如果做私有化部署，即使减去成本分摊，每个月成本也需要1万元。

具体来看，阿里云主要从模型和AI基础设施两个层面降低推理成本和性能。阿里云基于自研的异构芯片互联、高性能网络HPN7.0、高性能存储CPFS、人工智能平台PAI等核心技术和产品，构建了极致弹性的AI算力调度系统，结合百炼分布式推理加速引擎，大幅压缩了模型推理成本，并加快模型推理速度。

从阿里云的战略来看，这次大模型的降价实际上可以理解为阿里云公共云降价策略的一种延续。在过去两年，阿里云率先进行了几次大规模降价，一方面进一步提升了国内公共云市场渗透率，另一方面，也带来了新的营收增长空间。更重要的是，阿里云在降价的同时，继续保持着盈利。

依托公共云的领先优势，阿里云大模型的降价，不是打价格战，与“烧钱换市场无关”，更不能与当年云服务厂商“一元中标”抢占市场的历史同日而语。

这不是短期的市场竞争行为，而是长期的战略选择。是阿里云依托“AI驱动、公共云优先”战略所带来的领先身位的一种必然。对于阿里云来说，大模型时代的新机遇不是一场百米冲刺，它需要做的是把这种势能持续下去。

正如阿里云资深副总裁刘伟光所说，这不仅仅是CPU和简单的GPU带来的策略，更多是大规模GPU集群带来算力的基础，包括网络存储背后能力的提升。生成式AI从推理、训练，逐渐走向云端，再一次点燃了公共云的爆发。

“微软+OpenAI”的组合带来了巨大的商业价值潜力，所有云计算巨头都希望找到自己的OpenAI，亚马逊重金押注了Anthropic。阿里也不例外，除了通过投资，集齐了国内五大大模型独角兽之外。阿里还在打造属于自己的ChatGPT：通义千问，当然阿里云不仅仅打造的是阿里云+通义千问的组合，其百炼平台还支持百川、ChatGLM、Llama系列等上百款国内外优质模型，体现了阿里云在大模型时代的开放属性。

对于大模型行业来说，仅仅具有技术的先进性并不能带来应用的落地，如果不能降低大模型的推理成本，任何商业化都将是一种昂贵的尝试，尤其是C端应用，成本可能是个无底洞。

大模型的训练和推理都需要使用GPU或TPU这类专用硬件来加速计算过程，相比之下，许多传统互联网应用的计算需求通常较低。

例如，传统谷歌搜索每点击的成本约为0.2美分，而一次AI搜索，涉及大语言模型的深度分析与精炼总结，成本骤升。Perplexity的大额融资，也可以说明AI搜索是多么烧钱。

极高的估值、巨大的运营成本，如果大模型的使用成本不能进一步降低，无法明确商业化的众多项目都很难维系下去。此前Inflection AI 创始人跑路就是一个例子。

无论是对于企业还是个人开发者，推理成本的降低是大模型应用落地的前提，也是商业化的前提。所以，构建开发者生态，推动大模型应用的爆发，才是阿里云降价的真正意图所在。

当前，以文本为中心的单模态应用还是主流，但随着技术进步，大模型将走向多模态应用，比如图像、语音等更复杂的数据交互处理，这无疑会使得推理市场的体量进一步扩大。就像智能手机的发展，将电话从单一通话工具转变为集娱乐、社交、工作等多功能于一身的设备。

所以只要大模型应用真正爆发，AI推理市场也将迎来爆发，打造了具有基座大模型能力的公共云厂商，通过公共云+API的模式，才能走出新的增长曲线，获取更大的盈利空间。

根据IDC数据，随着人工智能进入大规模落地应用的关键时期，预计到 2026 年，在云端部署的算力当中，推理将占到 62.2%。阿里云认为到今年年底，大模型整个API的市场日均调用量将达到100亿次，这个数字还会增长十倍，一百倍，一千倍。甚至可能让云计算市场整体规模翻倍。

在移动互联网时代，从社交网络到移动支付，创新应用不断涌现，彻底地重塑了现代社会的生活方式和商业格局。像奈飞和米哈游这样的企业从诞生之初就100%在云上，其背后正是公共云作为基础设施的支撑，让企业和开发者无需大规模前期投资就能利用强大的计算资源。

正如云计算为移动互联网的爆发式增长提供了必要的土壤，公共云+大模型API的模式，也将为大模型的爆款应用提供类似的支持和催化作用。从这个角度出发，生成式人工智能时代的杀手级应用，也会是云原生应用。

在这一进程中，公共云厂商需要做的是持续将新技术与原有技术进行重新组织和重新架构，以支撑计算范式和算力格局的转变。

而以阿里云为代表的云计算厂商，通过从底层算力、AI平台再到模型服务的不断创新，同时AI也反哺了云从管理、应用、计算、基础架构能力的提升。这已经让我们看到了公共云在生成式人工智能时代神经网络和启动机器般基石作用的体现。

公共云技术红利的持续释放，为大模型应用的爆发铺平了路，我们将迎来一个大模型无处不在的世界，这可能不需要更多的逻辑推演，那么同理，公共云的AI基础设施也将成为无处不在的存在。当AGI有一天像水电一样廉价、可靠的时候，每个人都会想要使用它，每个人都会离不开它。

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2024-05-24发表2025-03-21更新 ByteAILab 23 分钟读完 (大约3462个字)

新融资 1.25 亿，用户超 1000 万，Suno 打算如何「改造」音乐行业？

昨天，Suno 在 X 上宣布成功完成了 1.25 亿美元的 B 轮融资。本轮投资者中，有风险投资公司 Lightspeed Venture Partners，还包括风险投资基金 Founders Collective，以及科技高管和投资者 Nat Friedman。

根据 The Information 的消息来源，本轮融资后 Suno 估值达到 5 亿美元。新筹集的资金将用于扩大公司的员工队伍，截至今年早些时候，公司仅有 12 名员工。自 8 个月前推出首款产品以来，Suno AI 的用户群体已迅速增长至超过 1000 万。微软公司更是将 Suno 的功能直接整合到了其 Copilot 产品中。在 Suno 的歌曲排行榜中，Stone 是第一首超过 100 万次收听的歌曲。如果 AI 音乐在开发一两年后就能如此流行，难以想象一下五年后它变成什么样。最近，知名科技博主 No Priors 邀请到了 Suno 的联合创始人兼首席执行官 Mikey Schulman 展开一场精彩的讨论。在访谈中，Mikey 分享了与他人合作创办 Suno 的心路历程，AI 音乐的难点以及它未来将会如何引爆产业变革。文章基于 No Priors 对 Mikey Schulman 的访谈编译，Founder Park 略有增删。

从物理学到 AIGC：一切源于热爱？
Sarah：作为一位音乐爱好者，你的转型之旅相当独特，从音乐领域跨越到哈佛物理学博士，再到创立数家人工智能企业，能否跟我们分享一下这段历程？
Mikey：确实，这是一条曲折的路。我玩音乐已经有很长时间了，四岁起学习钢琴，成长过程中参与了很多乐队。然而，我意识到虽然我热爱音乐，但我的专长并不在此。相比之下，物理是更为明智的选择。我一路求学，从大学到研究生，直到取得物理学博士学位，专注于量子计算的研究。然而，尽管量子计算魅力无限，我内心清楚，它并不是我的终身事业。
Sarah：你是否预想过自己会成为一位理论物理学家？
Mikey：我从来没有设定过固定的职业路径，从不限定自己要做什么或不做什么。在研究生期间，我接触到的量子力学研究不仅理论深奥，而且在实践层面极具挑战。这一领域在上世纪 50 年代奠定基础，其中包含许多复杂的低温微波工程挑战，这些对于实际应用至关重要，我发现自己在处理这些问题上比一般的物理学家更有天赋。我在这里找到了自己的优势，享受着每一个探索的瞬间。
Sarah: 能否谈谈你是如何从物理学术界转向创业的？
Mikey: 我的转折点始于偶然遇见一家名为 Kentro 的小公司，它只有大约 10 名成员，但我立刻被那里的人和氛围吸引了。于是，我决定加入他们，成为一名软件工程师。幸运的是，我入职之后机器学习的机遇便显现出来，尤其是在 2014 年，有物理学博士学位的我恰好成为了这一新兴领域中的一员。我抓住这个机会，快速学习，组建团队，开发出一些有趣的产品，最终在 2018 年，我们的公司被 S&P Global 收购。
Sarah：你们的起点是基于一个开源模型——Bark。能否分享一下你们最初的灵感来源，以及你们是如何进入音乐生成这片领域的呢？
Mikey：在 Kensho，我们专注于文本处理，直到被 S&P Global 收购后，我们接手了首个音频相关的项目——将收益电话会议转录为文字。你们两位都阅读过的收益电话会议记录，有很大一部分就是 S&P Global 的成果。以往这类工作全靠人工，不仅繁琐而且费时，但通过自动化，我们显著提升了效率和处理量，也因此对音频 AI 产生了浓厚的兴趣。虽然我们本身就是音乐爱好者，但恰恰是这样一个并不那么吸引人的项目——收益电话会议的音频转录，点燃了我们的热情。此外，我们观察到相比于图像和文本领域，音频处理技术的发展滞后许多，这一情况在 2020 年尤为明显，而近年来图像和文本技术的飞速发展更是加剧了这一差距。像我之前提到的，我们并没有一个详尽的长远规划。在开源项目 Bark 的开发过程中，甚至在它发布之前，我们就已经确定语音不是我们的主攻方向。确实，有不少人建议我们投身语音技术领域，他们认为开一个语音公司会更直接，「你会构建一个伟大的 B2B 产品，人们会喜欢它」。但我们太喜欢音乐了。所以我们决定建立一个音乐公司。

新一轮产业变革：既是消费者，也是创作者
Sarah：为何你们决定不专注于语音而是投身音乐？
Mikey：语音虽然迷人，但它缺乏我们所追求的那种创造性的自由度。语音的目的在于准确传达信息，哪怕稍显机械或缺乏感情色彩，只要传达的信息无误，任务就算完成了。而真正的创造力发生在音频的一个完全不同的部分，那就是音乐。
Elad：你们在技术实现上有哪些独到之处，特别是在处理音乐生成上？
Mikey：我们主要采用 Transformer 模型，这得益于我们团队在文本处理方面的背景，而 Transformer 模型在音乐生成上同样表现出色。音频的采样率极高，每秒达到约 50,000 个样本点，我们面临的挑战在于如何有效地将这种连续信号转换为可管理的 tokens 集，这是一个需要创新思维的过程。
Sarah：你们如何评估模型生成音乐的质量？
Mikey：音乐的美感是评估的关键，这在 AI 领域是一个公认的事实。我们可能在技术指标上达到高准确度，但音乐的感染力和情感表达往往超越了这些量化的标准。音乐评估往往更为主观，意味着要听很多东西，并让人们听很多东西。在如何评估这些东西的问题上，我们还有很长的路要走，同时这个评估过程也让我们更深入地理解人类情感。
Elad：你的音乐背景在 Suno 的开发中发挥了怎样的作用？
Mikey：创办公司以来，我反而学到了更多关于音乐的新知识，接触到了之前从没接触过的音乐流派。我的音乐背景或许帮助我们避免了模型中的隐性偏见，我们尽量让模型不受限于传统的音乐理论框架，就像不要告诉 GPT 这是一个名词，那是一个动词，而是让 GPT 自己去理解。如果我告诉我的模型只有 12 种音调，我的模型将只知道如何输出 12 种音调；如果我告诉我的模型有 50 种不同的乐器，我将永远无法获得那种独特的音色。音乐的无限可能性和多样性正是我们想要模型能够自行探索的。
Sarah：在你看来，AI 音乐生成面临的最大挑战是什么？
Mikey：音乐的独特之处在于它能触动人心，这是最大的挑战，因为 AI 音乐的目标正是激发听众的情感反应。音乐的多样性、文化依赖性以及个体差异性都给模型设计带来了挑战。对于那些整天在文本大模型中打转的人来说，他们很容易想到这样的事情：「这就是我在法学院入学考试中的表现，我可以用同样的方法通过律师资格考试。」这些对我们来说都不存在，就像我做了一首歌，它让我有了某种感觉，可能是颗粒感的音频让我有了某种感觉。我们正在探索如何让模型不仅能够生成悦耳的旋律，更重要的是能够触动人心。
Elad：Suno 的未来规划中，你们如何看待普通用户、专业人士及企业用户的需求？
Mikey：我想说的是，我们正试图改变整个世界与音乐的互动方式，并为人们带来新的体验。这意味着这是一款消费产品，而不是在 Ableton、Logic 或 Pro Tools 中加入 AI。这适合所有人，比如我妈妈。人们会花大量时间在电脑前享受创作歌曲的乐趣，对于自己的作品，他们感到有创造力和拥有感，并乐于分享它，这与现在的音乐创作方式不同。现在的音乐创作有时很痛苦，但它只为最终产品服务。而我认为，当你向人们开放这一切时，你肯定会关心最终产品，但你也会真正关心这段旅程，关心是否真正享受音乐创作。我做音乐的最大乐趣就是和朋友们一起玩音乐，即兴演奏，即使你没有在录音。在商业方面，立刻对产品收费可能并不符合传统智慧，但这实际上非常重要，因为我们正试图创造一套并不存在的行为方式，以了解究竟是什么让人们愿意掏钱，而不仅仅是沿袭现有的 SaaS 定价模式。
Elad：我记得我曾经和一些在 90 年代非常活跃的人交谈过，当时网络浏览器真正进入了人们的视野，他们试图找出适合网页的商业模式，重点落在了小额支付上，所以每次阅读《纽约时报》的文章时，你只需支付几分之一美分的费用。当然，世界最终还是倒向了基于广告的模式，但和我交谈过的那个时代的人中，没有谁认为广告模式一定是正确的答案，他们只是觉得这是短期内最容易做的事情。
Mikey：是的。
Sarah: 我记得我们之前讨论过创作平台上的一个现象，那就是创作者和观众之间的比例通常失衡，并且这种失衡因平台而异。你认为像 Suno 这样的创新工具能在多大程度上改变这一现状呢？
Mikey: 我认为，Suno 这样的平台能够开启一个全新的「微创作」时代，我们可以制作我们三个人都会听的歌曲，因为它捕捉到了我们三个人的某一时刻，就像我们自拍一样，而现在的音乐中完全没有这样的分享动力。Suno 技术的潜力在于，它能模糊创作与消费的界限，使这两者相互渗透，最终，我们不再区分谁是创作者、谁是消费者，因为所有人都在以自己的方式享受音乐带来的乐趣。
Elad: 这样的未来图景真是令人憧憬，它似乎预示着音乐、音乐产业乃至音乐在社会中的角色都将发生深刻变革。你对五年后这个行业的展望是什么？
Mikey: 如果我们能够让数十亿人以新的方式体验音乐创作，那么音乐消费的时间和经济投入都将显著增长。亲自参与创作过程，无疑会加深人们与音乐艺术家之间的情感纽带。正如数字音频工作站（DAW）曾经那样，它降低了音乐制作的门槛，促进了音乐和文化的快速演变。未来，如果你有一副好耳机，你有一双好耳朵，你愿意下功夫学习工具，你就可以在宿舍里做音乐。随着更多人通过 Suno 这样的工具轻松创作，音

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2024-05-24发表2025-03-21更新 ByteAILab 5 分钟读完 (大约718个字)

英伟达 Q1 净利润同比增长 628%！并宣布 1 拆 10，股价突破 1000 美元

周三美股盘后，英伟达发布了截至 2024 年 4 月 28 日的第一季度财报，创下了 260 亿美元的季度营收，比上一季度增长了 18%，同比增长了 262%。

本季度，每股稀释普通股的 GAAP 每股收益为 5.98 美元，比上一季度增长了 21%，同比增长了 629%。

非 GAAP 每股稀释普通股收益为 6.12 美元，比上一季度增长了 19%，同比增长了 461%。

英伟达创始人兼 CEO 黄仁勋表示：“下一次工业革命已经开始 —— 公司和国家正在与英伟达合作，将价值万亿美元的传统数据中心转向加速计算，并建立一种新型数据中心 —— AI 工厂 —— 以生产一种新的商品：AI。AI 将为几乎所有行业带来显著的生产率提升，并帮助企业更具成本效益和能源效率，同时拓展收入机会。

“我们的数据中心增长受到 Hopper 平台的生成式 AI 训练和推断的强劲和加速需求的推动。除了云服务提供商，生成式 AI 还扩展到消费互联网公司、企业、主权 AI、汽车和医疗保健客户，创造了多个市值数十亿美元的垂直市场。

“我们正准备迎接下一波增长。Blackwell 平台已全面投产，为万亿参数规模的生成式 AI 奠定了基础。Spectrum-X 为我们打开了一个全新的市场，将大规模 AI 带到仅以太网为基础的数据中心。NVIDIA NIM 是我们的新软件产品，提供企业级、优化的生成式 AI，在 CUDA 平台上无处不在 —— 从云到本地数据中心和 RTX AI 个人电脑 —— 通过我们庞大的生态系统合作伙伴网络。

英伟达宣布对股票进行 “1 拆 10”，并将季度分红提高 150%，至每股 0.01 美元（按拆股后计算）。过去一年中，随着谷歌和 OpenAI 等巨头购买了数十亿美元的英伟达 GPU，使得英伟达数据中心销售同比增长 427%，达到 194 亿美元。预计第二季度收入为 280 亿美元，上下浮动 2%，市场预期为 268 亿美元。

英伟达表示，新芯片 Blackwell 已经全面投产，对 H200 和 Blackwell 的需求远远超过供应，这种情况可能会持续到明年。H100 GPU 供应情况有所改善，但 H200 供应仍然短缺。

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2024-05-24发表2025-03-21更新 ByteAILab 5 分钟读完 (大约718个字)

英伟达 Q1 净利润同比增长 628%！并宣布 1 拆 10，股价突破 1000 美元

周三美股盘后，英伟达发布了截至 2024 年 4 月 28 日的第一季度财报，创下了 260 亿美元的季度营收，比上一季度增长了 18%，同比增长了 262%。

本季度，每股稀释普通股的 GAAP 每股收益为 5.98 美元，比上一季度增长了 21%，同比增长了 629%。

非 GAAP 每股稀释普通股收益为 6.12 美元，比上一季度增长了 19%，同比增长了 461%。

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2024-05-24发表2025-03-21更新 ByteAILab 10 分钟读完 (大约1463个字)

第一个 iPhone 刺客，倒下了

机器之能报道
编辑：Sia

“旗舰产品推出才一个月，创始人就想卖掉公司。”
败局来得太快。

图片
推出 AI Pin 仅一个月后，Humane 试图为其业务寻找下家。就在上周， AI Pin 还接入了 GPT-4o，改善产品体验。

据彭博社援引匿名消息人士的话报道，Humane 正在寻找下家，出售价格在 7.5 亿美元到 10 亿美元之间。

消息称，出售过程处于早期阶段。公司已为此聘请了一名财务顾问，收购是否成功还不确定。

图片
7.5 ～10 亿美元的报价，被一些人嘲笑为「彻头彻尾的搞笑。」

Humane 至今从未透露过任何一轮融资的官方估值，The Information 去年报道称其估值为 8.5 亿美元。

此前，他们已经从Microsoft，Qualcomm Ventures，Marc Benioff 和OpenAI 的 Sam Altman 等支持者那里筹集了约 2.3 亿美元。

目前尚不清楚 Humane 的知识产权会给他们带来多少价值。

Humane 处境不乐观似乎已有一段时间。

1 月，公司裁员 10 人，占其员工总数的4%，CTO Patrick Gates 也一起卷铺盖走人，「转型」为顾问。

此后，Humane 一直未有透露任何有关新任 CTO 的动向。

图片
很多人将此次出售与 AI Pin 遭受的史诗级差评联系起来。

一个月前，Humane 刚推出备受瞩目的 699 美元 AI Pin，被定为智能手机的后继者。

这是一款可穿戴 AI 设备，配备了传感器、生成式 AI 甚至小型投影仪，以独特的、个性化的交互方式著称。

也许是因为调子定得太高，拉高了人们预期，再加上不菲的定价，结果负面差评几乎一边倒。

最具灾难性的一击来自超级网红、YouTube「大V」 Marques Brownlee，他的节目标题直言：

「这是我评测过的最差的产品……目前为止。」

连「之一」都没有，真是一点情面都不留……

图片
但是，当你观看实际的视频时，标题确实兑现了它的承诺。

「激光投影+手部操作」算是最大卖点。讽刺的是，一款户外产品，它在户外正常阳光下几乎没有用，因为，你压根儿看不见手掌上的字！

CNET 科技记者 Scott Stein发现，纽约市中午，在正常日光下，也根本看不到手上的显示屏。

就连输入密码、选定选项这些普通操作，也很有门槛。

因为，手掌位置、距离和动作幅度都是一门新学问。

语音交互的槽点也不少。

即使你说清了问题，它也未必能听明白。好不容易听明白了，又会遇到糟糕的延时！答案出错也是常见的。

Ai Pin 最重要的一个宣传点是能够根据你的需求进行个性化，结果呢？

「AI Pin 与我的世界脱节了。」因为，它远远没有与你经常使用的应用集成起来。

另一个火力最猛的槽点是发热问题。

很多人发现，每当使用激光显示器超过几分钟，AI Pin 就会警报说自己太热，需要时间冷静。

也怪不得众口一词：

它根本不值与 Android 手机相同的标价、你一点都不比手机强、概念令人惊叹，操作起来却令人沮丧。

更不用说，还有 Meta 的 Ray-Bans 、 Rabbit R1 这些同行的「衬托」。

图片
Humane 由前苹果高管 Bethany Bongiorno 和 Imran Chaudhri 于 2017 年创立。

去年 6 月，公司向全世界宣布正在开发的产品—— Ai Pin。随着后续一些 demo 视频的放出，曾一度引发社交媒体的广泛关注。

这就是所有 AI 可穿戴设备的结局吗？谁知道!

既然 OpenAI 打开了潘多拉魔盒，它绝对不会是我们看到的最后一款 AI 可穿戴设备：

Sam Altman 正在与苹果设计师 Jony Ive 探索 AI 新硬件；
初创公司 Brilliant 正在制造依靠生成式 AI 的智能眼镜；
还有 RayNeo X2 AR 眼镜、Xreal 的 Air 2 系列；
…….

只是不知道下一个倒下的，又会是谁？倒下的速度会有多快？

参考链接
https://www.cnet.com/tech/mobile/humane-maker-of-wearable-ai-pin-is-exploring-a-sale-report-says/
https://techcrunch.com/2024/05/22/humane-the-creator-of-the-700-ai-pin-is-reportedly-seeking-a-buyer/

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2024-05-24发表2025-03-21更新 ByteAILab 6 分钟读完 (大约890个字)

AI生图、扩图、去水印……全免费！「Sora 平替」Viva 玩了把大的

机器之能报道编辑：山茶花

通通免费！AI功能「大杂烩」Viva，抢了美图秀秀的饭碗。

话接上回。

（查看详情请移步：「Sora 平替」来了！一键生成 5 秒视频，还免费，我们实测：很顶！）

国内的美图秀秀有 AI 视觉设计「大杂烩」之称，只要是市面上比较火的图片处理功能，都能在美图秀秀上找到身影。

而 Viva 堪称国外版「美图秀秀」，除了视频生成功能外，还有文生图、图生文、智能抠图、AI 扩图等，而且是把免费进行到底！

文生图：Midjourney 被「偷家」

Viva 野心不小，既想和 Sora 一较高下，又要抢 Midjourney 和 Stable Diffusion 的地盘。

众所周知，Midjourney 需要付费使用，每月至少 20 美元，而且还需要在 Discord 中一遍遍召唤机器人。

Stable Diffusion 虽然免费，但需要部署，对于小白用户很不友好。

而 Viva 打出来的招牌就是「免费且简单」。

Viva 官网链接：https://vivago.ai/

…

AI 修图（Repainting）

点击「Repainting」，进入操作界面后，我们上传一张图片，只需轻轻涂抹想要修改的区域，然后输入提示词即可。

例如，我们上传了一幅 MarcusCederberg 的摄影作品，用笔刷涂抹掉墙角部分，再输入「 Red rose bush 」，静待片刻画面就出现了一堆玫瑰花。

Viva生成的玫瑰花与整幅作品相得益彰，毫不突兀。

…

AI 消除（Magic Eraser）

旅行照中总有路人出镜、喜欢的图片中带有水印…… 我们在日常 P 图中总遇到类似的问题。

Viva 的「AI 消除」功能可解决这一烦恼。

我们只需上传照片，用笔刷涂抹或者框选需要消除的部分，点击「Erase」就 OK 了。

例如，我们上传了一张倪妮的照片，想把图片中的路人 P 掉：

大约 1 分钟的时间，Viva 就处理完成，生成「轻度消除」和「重度消除」两张照片。如果都不满意，还可以点击「Continue Erasing」继续处理。

最终生成的效果如下：

「轻度消除」会有 P 图痕迹，而且画面较为模糊；「重度消除」则效果更佳，Viva 会将消除的背景巧妙地补上。

此外，Viva 还可以消除水印：

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

目录

简介

结论

探索AITechPark，了解顶级人工智能、物联网、网络安全的进展，通过客座文章和链接合作扩大您的影响力。

…

参考链接
https://www.cnet.com/tech/mobile/humane-maker-of-wearable-ai-pin-is-exploring-a-sale-report-says/
https://techcrunch.com/2024/05/22/humane-the-creator-of-the-700-ai-pin-is-reportedly-seeking-a-buyer/

链接

分类

最新文章

归档

标签

订阅更新

目录

简介

结论

探索AITechPark，了解顶级人工智能、物联网、网络安全的进展，通过客座文章和链接合作扩大您的影响力。

…

参考链接https://www.cnet.com/tech/mobile/humane-maker-of-wearable-ai-pin-is-exploring-a-sale-report-says/https://techcrunch.com/2024/05/22/humane-the-creator-of-the-700-ai-pin-is-reportedly-seeking-a-buyer/

链接

分类

最新文章

归档

标签

订阅更新

参考链接
https://www.cnet.com/tech/mobile/humane-maker-of-wearable-ai-pin-is-exploring-a-sale-report-says/
https://techcrunch.com/2024/05/22/humane-the-creator-of-the-700-ai-pin-is-reportedly-seeking-a-buyer/