DataRobot加入IMDA,使LLM评估更易于AI构建者使用
New framework and set of capabilities for benchmarking and red teaming AI evaluation
DataRobot,作为企业级人工智能平台的领导者,今天宣布将LLM评估措施与新加坡政府机构Infocomm媒体发展局(IMDA)的新倡议整合在一起。{ width=60% }
在新加坡Asia Tech x Summit上推出的“Project Moonshot”倡议提供了新的功能,帮助AI从业者和系统所有者通过提供公共框架用于基准测试和红队评估来管理LLM部署风险。
“在DataRobot,我们专注于解决信心差距问题,并帮助组织扩大生成式人工智能的负责任使用,”DataRobot的首席客户官Jay Schuren说道。“我们很高兴地宣布,我们最新的产品发布版本整合了Project Moonshot的测试工具包及其基准测试和评估测试。其结果是,LLM评估变得更易于使用,从而帮助扩大生成式人工智能的负责任使用,使从业者可以打开和配置保护模型以更改LLMs的行为和响应。”
Project Moonshot为AI从业者和系统所有者提供了三个核心功能:
易于集成到CI/CD流水线中的生成式AI解决方案的自动化评估工具。
允许团队通过筛选适当的基准测试来运行与其应用相关的评估的基准仓库。
从越狱到定制攻击等红队测试的一站式工具。
“Project Moonshot的开发,作为全球首个将红队测试、基准测试和基线测试汇集到易于使用平台中的开源工具之一,如果没有合作伙伴如DataRobot的贡献,将是不可能实现的,”AI Verify Foundation的主席王振晖博士说。“Project Moonshot将为开发人员提供一个直观的工具包,用于测试其LLM应用。这个新工具包表明新加坡将继续致力于促进解决生成式人工智能安全问题的全球开源工作。”
“我们很自豪地支持我们的投资组合公司DataRobot在东南亚的增长之路,”EDBI的首席执行官Paul Ng说。“该公司不仅在新加坡扩大了业务范围,还促进了有利于当地创新生态系统的合作,例如与IMDA的合作。Project Moonshot为本地企业提供了部署生成式人工智能技术的正确工具。作为一家战略投资者,我们致力于为我们的投资组合公司创造价值,同时增强新加坡的创新能力。”
DataRobot是IMDA认可的公司,也是AI Verify Foundation的成员,后者于2022年推出了世界上第一个AI治理测试框架和工具包。
在AITechPark上探索最新的人工智能、物联网、网络安全、AI技术新闻以及来自行业专家的深入更新!
感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB。
DataRobot加入IMDA,使LLM评估更易于AI构建者使用