Valted Seq推出革命性AI驱动的基因组工具
AI驱动的基因组工具SCADE在解决单细胞基因组问题的准确性上显著超过了包括OpenAI和DeepSeek在内的通用模型,准确性提高了两倍以上。{ width=60% }
Valted Seq, Inc.是一家在前沿生物技术解决方案方面的先驱,今天宣布推出一款新型AI驱动基因组工具——单细胞AI发现引擎(SCADE)。该工具旨在彻底改变研究人员和医疗专业人士对庞大遗传数据的解读方式。SCADE通过利用先进的机器学习算法,承诺显著提高从基因组序列中获得洞察的速度和准确性,为更快的生物标志物和药物发现、个性化医学以及更有效的细胞疾病治疗开辟了道路。
“我们的目标是让生物学家和生物化学家等科学家无需编写计算机代码即可进行基因组学和生物信息学。”Valted Seq首席执行官巴尔迪亚·内扎米(Bardia Nezami)表示。“分析基因组数据,尤其是来自单细胞的数据,是非常复杂的。然而,有了SCADE,我们正在使这一过程变得更加民主化。它在前所未有的规模上提供强大的分析和解读,加速了朝向拯救生命的突破的旅程。我们之所以能做到这一点,是因为我们的AI模型是在内部生成的高质量同质单细胞大数据上训练的,其中包含数千万个细胞。”
通用AI模型(OpenAI, DeepSeek, Claude, Gemini等)在解决复杂基因组问题方面失败,主要原因在于缺乏特定领域的知识和/或调优。Valted Seq旨在通过利用在内部生成的高度同质单细胞大数据,针对不同的基因组任务、应用和组织类型训练专门的AI引擎,来解决这一问题。SCADE采用的层级多层模型包括数据管理、生物信息核心、基本大型语言模型(LLM)、专门的基因组层、专门的单细胞层和依赖于应用的层,为特定用例(如神经学、肿瘤学、微生物学或免疫系统)提供量身定制的AI工具。
Valted Seq的重要贡献之一是创建了一个基准数据库,专门用于评估AI模型在单细胞分析任务上的表现。这是通过关注基础类别来实现的,例如细胞类型注释,其中包含数百个问题。这个基准为在这个专门领域的性能测量建立了一个重要的基线。Valted Seq正在将基准数据库扩展到数千个问题。
Valted Seq的第一阶段测试表明,标准AI方法在复杂任务中的表现显著乏力,即使是最好的传统模型,代码执行成功率也仅为约25%,而匹配预期结果的准确率约为14%。相比之下,Valted Seq的SCADE框架采用多代理框架,使用数千万个内部生成的单细胞进行训练,能够显著改善结果,代码执行成功率超过96%,匹配预期结果的准确率达到36%。SCADE的准确性超过了独立模型的两倍。
SCADE的关键特性包括:
- 规模化基因组数据:通过机器人生成高质量的大数据,以训练和微调AI基因组和生物信息学工具。
- 高速数据处理:部署先进的AI算法,同时分析多个大型数据集,显著缩短识别变异和模式的时间。
- 前所未有的准确性:采用最先进的模型,最小化假阳性和假阴性,提高对关键决策的信心。
- 用户友好的仪表板:为科学家提供直观的界面,用于探索和分析基因组数据,并无提示地创建报告,帮助团队快速发现潜在的关系和可靠的目标。
- 适用于研究和临床环境的可扩展性:能够处理小规模实验室研究和大型项目,确保各种用户的可接入性和灵活性。
通过提供无与伦比的速度和准确性,SCADE为那些希望站在精准医疗前沿的组织提供了强大的优势。制药和生物技术公司可以利用该平台缩短从药物发现到市场的时间,而医疗保健提供者可以根据个体的基因组特征细化治疗策略。
“科学家需要明确、可操作的洞察,且需要快速得到这些洞察。”巴尔迪亚·内扎米补充道。“像SCADE这样的AI驱动平台不再仅仅是‘锦上添花’;它们正迅速成为现代基因组科学的基础。全球的研究人员正在寻求能够简化复杂基因组数据解读的创新工具,帮助他们跟上精准医学快速发展的步伐。”
如需更多信息,请联系info@valtedseq.com。
背景
单细胞分析是分子生物学的前沿领域,目前商业上主要由基于液滴的技术主导。然而,现有的基于液滴的最先进方法在准确性和可扩展性方面都存在两个主要问题,主要由于其底层物理学的限制。虽然替代的组合方法在很大程度上可以解决准确性问题,并在一定程度上解决可扩展性问题,但仍然缺乏自动化,这也是市场上现有方法的集成特色。
另一方面,缺乏大数据级别的分析工具是一个明显的瓶颈,同时也是这一领域商业应用的机会,这直接源于现有方法产品的可扩展性有限或较低。与其他领域一样,没有大数据,开发AI驱动的单细胞发现工具是相当具有挑战性的,甚至是遥不可及的。Valted Seq处于一个独特的位置,能够通过开发基于机器人技术的样本处理自动化平台,生成训练AI驱动分析工具所需的高质量大规模同质数据,从而解决这些挑战。
Valted Seq已经建立了一个包含数千万个单细胞的最大数据库之一,并计划扩展至数十亿个,以提升AI模型的性能。这些数据来自于约翰霍普金斯大学和巴纳健康研究所生物样本库的尸体冷冻大脑样本,这两者都是公认的国际顶级脑库。Valted Seq已经利用该数据库识别出多种特定细胞类型的生物分子作为不同疾病的生物标志物和治疗靶点,大多数已经在体外和体内的临床前设置中得到验证。
感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB。
Valted Seq推出革命性AI驱动的基因组工具