2024-06-02发表2025-03-21更新 ByteAILab 6 分钟读完 (大约842个字)

DataRobot加入IMDA，使LLM评估更容易被AI构建者使用

New framework and set of capabilities for benchmarking and red teaming AI evaluation
DataRobot,企业AI平台领导者，今天宣布了LLM评估措施的整合，这些措施与新加坡政府机构信息通讯媒体发展局（IMDA）的一项新倡议保持一致。{ width=60% }

“Project Moonshot”计划在新加坡亚洲科技峰会上推出，提供新功能，帮助AI从业者和系统所有者通过提供常用框架来对LLM部署风险进行基准测试和红队评估。
在DataRobot，我们的重点是解决信心差距问题，并帮助组织扩展对生成式AI的负责任使用，”DataRobot首席客户官Jay Schuren表示。“我们很高兴地宣布，我们的最新产品发布包含了Project Moonshot的测试工具包及其基准测试和评估测试。结果是LLM评估变得更容易，并有助于扩展对生成式AI的负责任使用，使从业者能够开启和配置警戒模型来改变LLM的行为和响应。”

Project Moonshot为AI从业者和系统所有者提供了三个核心功能：

自动评估工具，可轻松集成到CI/CD管道中的生成式AI解决方案。一个基准库，允许团队通过精选正确的基准进行与其应用相关的评估。一个一站式的AI红队工具，从越狱到定制攻击。

“Project Moonshot的开发，是世界上第一个将红队评估、基准测试和基准测试汇聚在一个易于使用平台上的开源工具之一，没有合作伙伴如DataRobot的贡献，这将是不可能的，”AI Verify基金会理事会主席Dr Ong Chen Hui表示。“Project Moonshot将为开发人员提供一个直观的工具包来测试他们的LLM应用。该工具包标志着新加坡继续致力于推进全球开源努力，以解决生成式AI安全问题。”

“我们很自豪能够支持我们的投资组合公司DataRobot在东南亚的增长之旅，”EDBI首席执行官Paul Ng表示。“该公司不仅扩大了在新加坡的业务范围，还促进了造福当地创新生态系统的合作，比如与IMDA的合作。Project Moonshot为本地企业提供了部署生成式AI技术的合适工具，从而使他们能够充满信心。作为战略投资者，我们致力于为我们的投资组合公司创造价值，同时增强新加坡的创新能力。”

DataRobot是IMDA认可公司，也是AI Verify基金会的成员，该基金会于2022年推出了世界上第一个AI治理测试框架和工具包。

探索 AITechPark，获取AI、物联网、网络安全、AI技术新闻的最新进展，以及来自行业专家的深入更新！。

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

DataRobot加入IMDA，使LLM评估更容易被AI构建者使用

https://www.gptnb.com/2024/06/02/2024-06-01-auto3-o6QvXQ/

作者

ByteAILab

发布于

2024-06-02

更新于

2025-03-21

DataRobot加入IMDA，使LLM评估更容易被AI构建者使用

作者

发布于

更新于

许可协议

喜欢这篇文章？打赏一下作者吧

链接

分类

最新文章

归档

标签

订阅更新