DataRobot加入IMDA,使LLM评估更容易被AI构建者使用
New framework and set of capabilities for benchmarking and red teaming AI evaluation
DataRobot,企业AI平台领导者,今天宣布了LLM评估措施的整合,这些措施与新加坡政府机构信息通讯媒体发展局(IMDA)的一项新倡议保持一致。{ width=60% }
“Project Moonshot”计划在新加坡亚洲科技峰会上推出,提供新功能,帮助AI从业者和系统所有者通过提供常用框架来对LLM部署风险进行基准测试和红队评估。
在DataRobot,我们的重点是解决信心差距问题,并帮助组织扩展对生成式AI的负责任使用,”DataRobot首席客户官Jay Schuren表示。“我们很高兴地宣布,我们的最新产品发布包含了Project Moonshot的测试工具包及其基准测试和评估测试。结果是LLM评估变得更容易,并有助于扩展对生成式AI的负责任使用,使从业者能够开启和配置警戒模型来改变LLM的行为和响应。”
Project Moonshot为AI从业者和系统所有者提供了三个核心功能:
自动评估工具,可轻松集成到CI/CD管道中的生成式AI解决方案。一个基准库,允许团队通过精选正确的基准进行与其应用相关的评估。一个一站式的AI红队工具,从越狱到定制攻击。
“Project Moonshot的开发,是世界上第一个将红队评估、基准测试和基准测试汇聚在一个易于使用平台上的开源工具之一,没有合作伙伴如DataRobot的贡献,这将是不可能的,”AI Verify基金会理事会主席Dr Ong Chen Hui表示。“Project Moonshot将为开发人员提供一个直观的工具包来测试他们的LLM应用。该工具包标志着新加坡继续致力于推进全球开源努力,以解决生成式AI安全问题。”
“我们很自豪能够支持我们的投资组合公司DataRobot在东南亚的增长之旅,”EDBI首席执行官Paul Ng表示。“该公司不仅扩大了在新加坡的业务范围,还促进了造福当地创新生态系统的合作,比如与IMDA的合作。Project Moonshot为本地企业提供了部署生成式AI技术的合适工具,从而使他们能够充满信心。作为战略投资者,我们致力于为我们的投资组合公司创造价值,同时增强新加坡的创新能力。”
DataRobot是IMDA认可公司,也是AI Verify基金会的成员,该基金会于2022年推出了世界上第一个AI治理测试框架和工具包。
探索 AITechPark,获取AI、物联网、网络安全、AI技术新闻的最新进展,以及来自行业专家的深入更新!。
感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB。
DataRobot加入IMDA,使LLM评估更容易被AI构建者使用