DataRobot加入IMDA以使LLM评估对AI构建者更具可访问性

新框架和一组功能,用于基准测试和红队AI评估
DataRobot,企业AI平台领导者,今天宣布与新加坡政府机构信息通信媒体管理局(IMDA)共同推出的新举措相符的LLM评估措施集成。图片{ width=60% }


在新加坡亚洲科技峰会上推出的“Project Moonshot”倡议提供了新功能,帮助AI从业者和系统所有者通过提供一个公共框架来进行基准测试和红队评估来管理LLM部署风险。
DataRobot首席客户官Jay Schuren表示:“在DataRobot,我们的重点是解决信心差距,帮助组织扩大生成式AI的负责任使用。” “我们很高兴宣布,我们的最新产品发布包含Project Moonshot的测试工具包及其基准测试和评估测试。结果是,LLM评估更具可访问性,并有助于扩展生成式AI的负责任使用,使从业者能够打开并配置守护模型,以改变LLM的行为和响应。”
Project Moonshot为AI从业者和系统所有者提供了三项核心功能:

  • 针对生成式AI解决方案的自动化评估工具,可轻松集成到CI/CD流水线中。
  • 通过筛选正确的基准测试,让团队运行与其应用相关的评估的基准库。
  • 从越狱到定制攻击,提供AI红队工具的一站式工具。
    AI Verify Foundation的管理委员会主席Dr. Ong Chen Hui表示:“Project Moonshot的开发,这是世界上首个将红队、基准测试和基线测试集成到易于使用平台中的开源工具,离不开合作伙伴如DataRobot的贡献。” “Project Moonshot将为开发人员提供一个直观工具包来测试他们的LLM应用。这个新工具包标志着新加坡继续致力于推动全球开源努力,以解决生成式AI安全问题。”
    EDBI首席执行官Paul Ng表示:“我们很自豪地支持我们的投资组合公司DataRobot在东南亚的增长之路。” “该公司不仅在新加坡扩大了业务范围,还促进了有利于本地创新生态系统的合作,比如与IMDA的合作。Project Moonshot为本地企业提供了部署生成式AI技术的正确工具。作为战略投资者,我们致力于为我们的投资组合公司创造价值,同时增强新加坡的创新能力。”
    DataRobot是IMDA认可公司,也是AI Verify Foundation的成员,该基金会于2022年推出了世界首个AI治理测试框架和工具包。
    探索AITechPark,了解人工智能、物联网、网络安全、AITech新闻的最新进展,并获取行业专家的深刻更新!


感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

DataRobot加入IMDA以使LLM评估对AI构建者更具可访问性

https://www.gptnb.com/2024/06/02/2024-06-01-auto3-SyoYN2/

作者

ByteAILab

发布于

2024-06-02

更新于

2025-03-21

许可协议