DataRobot加入IMDA以使LLM评估对AI构建者更易获取

New framework and set of capabilities for benchmarking and red teaming AI evaluation
DataRobot,企业AI平台领导者,今天宣布整合了与新加坡政府机构Infocomm Media Development Authority(IMDA)推出的一项新举措对齐的LLM评估措施。图片{ width=60% }


此举是在新加坡亚洲科技X峰会上发布的“Project Moonshot”计划,提供了新的能力,帮助AI从业者和系统所有者通过提供一个用于基准测试和红队评估的共同框架来管理LLM部署风险。
DataRobot的首席客户官Jay Schuren表示:“在DataRobot,我们的重点是解决信心差距,并帮助组织扩展负责任使用生成式AI。我们很高兴地宣布,我们最新的产品发布集成了Project Moonshot的测试工具包及其基准测试和评估测试。结果是LLM评估更易获取,并帮助扩展负责任使用生成式AI,使从业者能够打开和配置守护模型以改变LLM的行为和响应。”
Project Moonshot为AI从业者和系统所有者提供了三个核心功能:
易于集成到CI/CD流水线中的生成式AI解决方案的自动化评估工具。通过策划正确的基准测试,允许团队运行与其应用相关的评估的基准仓库。从越狱到定制攻击的AI红队的一站式工具。
AI Verify Foundation董事会主席王振辉博士表示:“Project Moonshot的开发,这是世界上第一个将红队、基准测试和基线测试汇集在一个易于使用平台中的开源工具之一,如果没有DataRobot等合作伙伴的贡献,这是不可能的。Project Moonshot将为开发人员提供直观的工具包,以测试其LLM应用。这个新工具包标志着新加坡继续致力于推动全球开源努力,解决生成式AI安全问题。”
EDBI首席执行官保罗·吴表示:“我们很自豪能够支持我们的组合公司DataRobot在东南亚的增长之旅。该公司不仅在新加坡扩大了业务范围,还促进了有利于本地创新生态系统的合作,例如与IMDA的合作。Project Moonshot为本地企业提供了部署生成式AI技术的正确工具,从而增强了创造信心。作为战略投资者,我们致力于为我们的组合公司创造价值,同时增强新加坡的创新能力。”
DataRobot是IMDA认可公司,也是AI Verify Foundation的成员,后者于2022年推出了世界上第一个AI治理测试框架和工具包。
浏览AITechPark,查看AI、物联网、网络安全、AITech新闻以及行业专家的深刻更新!



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

DataRobot加入IMDA以使LLM评估对AI构建者更易获取

https://www.gptnb.com/2024/06/03/2024-06-02-auto3-aH01MH/

作者

ByteAILab

发布于

2024-06-03

更新于

2025-03-21

许可协议