亚博体育世界杯中国官网首页亚博·体育世界杯(中国)官方网站 Cell Reports Methods | 北京大学将来本领学院王劲卓团队诞生生成式AI诬捏细胞模子达成多模态扰动响应瞻望
你的位置:亚博体育世界杯中国官网首页 > 2026世界杯赔率 >亚博·体育世界杯(中国)官方网站 Cell Reports Methods | 北京大学将来本领学院王劲卓团队诞生生成式AI诬捏细胞模子达成多模态扰动响应瞻望
发布日期:2026-05-28 11:27 点击次数:157
2026年5月21日,北京大学将来本领学院王劲卓团队在CellReportsMethods在线发表了题为“Agenerativeframeworkforpredictingcellularmorphologicalandtranscriptomicperturbationresponses”的磋论说文,建议了一种面向AIVirtualCell(AIVC)的多模态生成式诬捏细胞框架MultiVCDiff。该门径简略仅基于药物结构或基因扰动信息,同期瞻望细胞边幅图像和转录组抒发谱,为大限度诬捏筛选、扰动响应模拟和药物作用机制默契提供了新的打算器用。

细胞在受到药物、基因剪辑等外界扰动后,会在多个层面产生复杂响应。其中,细胞边幅简略响应细胞结构和表型气象,转录组则揭示了其背后的分子调控门径。准确瞻望这两类响应,关于深化细胞行运变化、默契药物作用机制以及构建AIVC具有进犯有趣有趣。
比年来,机器学习门径被庸碌用于细胞扰动响应瞻望,但现存门径仍存在两类要津瓶颈:一类门径经常只瞻望单一模态,举例仅生成细胞边幅图像或仅瞻望基因抒发变化,难以描述细胞边幅与分子门径之间的内在关连;另一类跨模态生成门径诚然简略诈欺转录组瞻望边幅,或诈欺边幅关联分子气象,但时常需要扰动后的实测RNA或图像行为输入,因此无法用于实在的denovo诬捏筛选。关于尚未实际测试的新药物或新基因扰动,扰动后的实测数据并不存在,这收尾了这些门径在真是药物发现场景中的应用。
针对上述挑战,研究团队诞生了MultiVCDiff。不同于依赖扰动后实测数据的跨模态生成模子,MultiVCDiff径直以扰动自己行为条款输入,在归拢的扩散生成框架中同步生成细胞边幅图像和基因抒发谱。关于药物扰动,模子将化合物结构行为输入;关于基因扰动,模子将成见基因暗示行为输入。通过这种遐想,MultiVCDiff简略在莫得任何扰动后实际读数的情况下,瞻望细胞可能产生的多模态响应,亚博·体育世界杯(中国)官方网站从而更面对真是诬捏筛选任务的需求。在数据层面,研究团队系统整合了CellPainting细胞边幅数据与L1000转录组数据,并通过分享的药物或基因扰动构建了四个多模态数据集:CPgenes-BBBC021、CPgenes-CDRP、CPgenes-JUMP和CPgenes-LINCS。每个样本同期包含扰动信息、细胞边幅图像和对应的基因抒发谱,为模子学习“扰动—边幅—转录组”三者之间的关联提供了基础。

图一:数据构造与MultiVCDiff框架图
在细胞边幅瞻望任务中,MultiVCDiff展示出优于现存门径的生成智力。研究团队将其与八种代表性生成模子进行比较,包括MorphDiff、MorphNet、IMPA、MorphoDiff、StarGAN、DMIT、MDTv2和StableDiffusion。成果标明,MultiVCDiff简略生成更接近真是细胞图像的扰动特异性边幅,并显耀裁汰FID和KID等图像分散距离目的。与容易产生模式崩塌的基线模子比较,MultiVCDiff简略更好地分裂不同药物辅导的细胞边幅各异。研究团队进一步使用CellProfiler从图像中索求6,345个边幅学特征,发现MultiVCDiff生成图像的特征分散与真是扰动细胞高度一致,并显著区别于未扰动对照细胞。
在转录组瞻望任务中,MultiVCDiff不异深化出宏大的零样本泛化智力。研究团队在CPgenes-LINCS数据集上构建了严格的out-of-distribution测试场景,将30个结构上与检会集显耀不同的药物行为测试集。成果显露,MultiVCDiff瞻望的基因抒发logfoldchange与真是实际成果高度一致,举座关联性达到0.872,简略准确捕捉不同药物辅导的上斡旋下调基因抒发模式。此外,研究团队还将MultiVCDiff与chemCPA、biolord和PDGrapher等先进转录组扰动瞻望模子进行系统比较。成果标明,MultiVCDiff在各异抒发基因识别、AUPRC、Spearman关联性、抒发变化标的一致性等多个目的上均获得超越或具有竞争力的性能。
综上,该研究建议的MultiVCDiff为构建生成式AIVC提供了一个新的本领框架。它打破了现存门径只可瞻望单一模态、或依赖扰动后实测数据进行跨模态生成的收尾,简略仅基于药物结构或基因扰动信息,同期瞻望细胞边幅和转录组响应。这一智力使其具备应用于大限度诬捏筛选、药物机制默契、药物重定位和新靶点发现的后劲,也为将来发展愈加无缺、可证据、可膨胀的诬捏细胞模子奠定了基础。
北京大学将来本领学院王劲卓为论文通信作家,北京大学前沿交叉学科研究院博士生彭睿为论文的寥寂一作,北京大学元培学院本科生刘子孺为论文作念出了进犯孝敬。
参考文件:
Bunne,C.,九游体育中国官网入口Roohani,Y.,Rosen,Y.,Gupta,A.,Zhang,X.,Roed,M.,Alexandrov,T.,AlQuraishi,M.,Brennan,P.,Burkhardt,D.B.,etal.(2024).Howtobuildthevirtualcellwithartificialintelligence:Prioritiesandopportunities.Cell187,7045–7063.
Way,G.P.,Natoli,T.,Adeboye,A.,Litichevskiy,L.,Yang,A.,Lu,X.,Caicedo,J.C.,Cimini,B.A.,Karhohs,K.,Logan,D.J.,etal.(2022).Morphologyandgeneexpressionprofilingprovidecomplementaryinformationformappingcellstate.CellSystems13,911-923.e9.
Bray,M.-A.,Singh,S.,Han,H.,Davis,C.T.,Borgeson,B.,Hartland,C.,Kost-Alimova,M.,Gustafsdottir,S.M.,Gibson,C.C.,andCarpenter,A.E.(2016).CellPainting,ahigh-contentimage-basedassayformorphologicalprofilingusingmultiplexedfluorescentdyes.NatProtoc11,1757–1774.
Subramanian,A.,Narayan,R.亚博·体育世界杯(中国)官方网站,Corsello,S.M.,Peck,D.D.,Natoli,T.E.,Lu,X.,Gould,J.,Davis,J.F.,Tubelli,A.A.,Asiedu,J.K.,etal.(2017).ANextGenerationConnectivityMap:L1000PlatformandtheFirst1,000,000Profiles.Cell171,1437-1452.e17.
Carrillo-Perez,F.,Pizurica,M.,Zheng,Y.,Nandi,T.N.,Madduri,R.,Shen,J.,andGevaert,O.(2024).Generationofsyntheticwhole-slideimagetilesoftumoursfromRNA-sequencingdataviacascadeddiffusionmodels.Nat.Biomed.Eng9,320–332.

备案号: