2020年以来
国内AI推算驱动的创新药物研发领域
(下称“AI+药物研发”)
热度显著攀升
出现多起大额融资:
晶泰科技
2020年9月 C轮 3.188亿美元
(其时全球领域内最高纪录)
2021年8月 D轮 4亿美元
英矽智能
2021年6月 C轮 2.55亿美元
百图生科
2021年8月 A轮 数亿美元
望石智慧
2021年4月 B及B+轮 1亿美元
齐鲁锐格
2021年2月 B轮 9000万美元
星药科技
2020年12月 A轮 数千万美元
2021年8月 战术融资
......
凭据公开信息整顿
2021年截至目前
国内已实现31起融资买卖
总融资额超过110亿元人民币
已超过2020年整年融资买卖数量与融资额
而市场对AI+药物研发领域有诸多好奇
好比:
1. 为什么这一两年AI+药物研发这么火热? 2. AI能从底子上颠覆创新药市场格局吗? 3. AI在创新药研发领域有哪些利用? 4. AI辅助药物研发(AIDD)目前重要利用的算 法有哪些?有何局限性? 5. 将AI技术引入药物研发后能否引发学科革命,使得推算科学可能切实领导药物研发? 6. 对于AI+药物研发公司来说,算法沉要还是数据沉要?若何理解算法的优势以及判断数据质量? 7. AI+药物研发公司的重要数据起源有哪些? 8. AIDD主流算法模型必要大量数据驱动,而创新药行业内真实数据依然相对匮乏,若何解决这一问题? 9. 目前绝大无数AI+药物研发企业集中在幼分子药物研发领域,AI是否也能利用到大分子药物研发领域? 10. 什么样的AI+药物研发公司团队称得上是一个优良的团队? 11. AI+药物研发公司若何进行贸易变现? 12. 2022年AI+药物研发融资趋向若何? 针对公共普遍关注的上述这12个问题 乐天堂fun88本钱给出了乐天堂fun88答案。 01 为什么这一两年AI+药物研发这么热? 近年来深度进建算法的突破,算力大幅提升,以及生物学技术发展和成本降落带来的生物医药大数据加快堆集为AI在生物医药领域的利用提供了客观前提。 海表AI驱动研发的候选药物进入临床,以Schrodinger和Relay为代表的AI/推算驱动造药公司上市,以及多个跨国药企和互联网巨头的涉足成为该领域热度攀升的催化剂。 新冠疫情对行业与资金面的影响不成忽略。疫情驱动市场对生物医药行业有了前所未有的关注,流动性宽松的布景下资金向风险资产倾斜,而AI+药物研产生为市场设想空间巨大的交叉领域,同时受到TMT和医疗这两个大行业本钱的追捧。 对国内企衣反说,国度对于创新药的搀扶是AI+药物研发热的沉要驱动成分。以2015年药品审评审批造度鼎新为起点,国度从注册审批、医保支付、本钱市场上市规定、人才政策、专利;さ雀鞲鼋嵌热婕だ葱乱┑姆⒄,me-too、me-worse等“伪创新药”和仿造药的价值空间被极大压缩,对创新的追赶以及降本增效的需要驱策医药企业加快拥抱AI。 凭据乐天堂fun88本钱的扫描,截至2021年8月底,国内共计有57家AI+药物研发公司。其中最早一批公司成立于2012年-2014年,无数公司成立于2018年后,就AI的利用场景及AI驱动的研发成就而言,目前行业整体还处于起步阶段。 02 AI能从底子上颠覆创新药市场格局吗? 就目前的利用成效而言,AI在药物研发领域只是表演赋能工具的角色,谈AI对市场格局的颠覆还为时尚早。我们预期AI带来的研发质量与效能的提升会成就一批选取创新研发模式的“新生代”biotech,但big pharma多年堆集构筑的临床开发与贸易化壁垒非一旦一夕能够建成,行业主流格局在短期内难以被撼动。但我们不排除随着数据堆集、模型创新与迭代、新的监管与贸易模式的出现,AI将来有可能沉塑创新药行业格局。 03 AI在创新药研发领域有哪些利用? AI在靶点发现与验证、分子发现与优化、临床前钻延注临床试验设计与患者筛选入组、药物上市后钻研等新药研发的各个环节均有大量利用。新药研发的链条很长,分歧环节所必要的技术能力与经验布景差距很大,因而无数AI+药物研发公司选择从其中一两个环节切入,且重要集中在靶点发现与验证和分子发现与优化阶段,这是由于生物学机造理解和候选分子性质是决定临床试验成败的最关键因素。 04 AI辅助药物研发(AIDD)目前重要利用的算法有哪些?有何局限性? 目前利用在创新药研刊行业的AI技术重要指的基于数据驱动的机械进建(ML)算法,现实上ML乃是AI大领域下的一个重要工作。而以深度神经网络DNN代表的深度进建技术则是目前最前沿的ML方向,在这次AIDD热潮中阐扬了至关沉要的作用。AIDD当前重要利用的深度进建算法模型蕴含卷积神经网络CNN、循环神经网络RNN(LSTM)、天生匹敌网络GAN、Transformer、图神经网络GNN及其变种和组合等。除此之表,模型中还时时有很多机械进建中的经典算法来共同使用,如决策树、支持向量机、蒙特卡洛树搜索、MCMC等。 对于深度神经网络有关算法来说,其形成的端到端的系统结构对于输入输出而言类似一个黑盒,因而模型参数的可诠释性相对较差也就成为其重要的局限性,若何用现有的生物医药知识有效地领导模型搭建和成效优化也是当前的一个重要钻研方向。 05 创新药的研发重要依附于有机化学、生物化学、临床医学等一系列尝试科学,而偏沉理论的推算科学一向以来对药物研发过程领导甚微。将AI技术引入药物研发后能否引发学科革命,使得推算科学可能切实领导药物研发? 推算机辅助药物设计(CADD)在幼分子药物研发领域已有很长的利用汗青,NASDAQ上市公司Schrodinger提供的解决规划就是CADD的利用范例。CADD基于物理规定,利用推算机来仿照化学事务并精确推算原子和分子的物理化学性质,对算力要求高,通量低,重要利用于已有苗头化合物后的分子优化。 AI则是基于数据的统计进建步骤,AI的引入能够加快数据处置过程,显著提升CADD的效能,但AIDD绝不能单一理解为CADD的迭代与延长,AI 技术能够被有机整合至新药研发的各环节,将推算科学在药物研发中的利用从CADD聚焦的分子发现和优化阶段扩大到药物研发的整个性命周期,为药物研发带来更彻底、宽泛的刷新。 06 对于AI+药物研发公司来说,算法沉要还是数据沉要?若何理解算法的优势以及判断数据质量? 都很沉要,引用一句在业界宽泛流传的话:数据与特点决定了机械进建的上限,模型和算法只是无限逼近这个上限。 算法模型的关键是理解其底层生物学意思,对domain knowledge的理解是决定模型质量的关键。算法模型的优势能够体此刻多个维度,好比了局的精准度、推算速度、模型体量、泛化机能等,分歧算法模型可能有分歧的侧沉方向,因而优势也会不尽一样,在特定工作需要和利用场景下合理选择拥有相应优势的算法模型至关沉要。 数据质量重要体此刻数据自身的统计特点(如单成分分析与多成分分析的统计学显著性)、分歧起源和分歧批次数据间的一致性等方面。另表,原始数据的结构化水平,噪声含量,以及与真实利用场景下的数据散布误差水平,也都是判断数据质量的沉要尺度。 07 AI+药物研发公司的重要数据起源有哪些? 公共数据是很沉要的数据起源,如TCGA、PDB、Drugbank、GenBank等大量公共数据库及丰硕的文件专利为AI+药物研发企业提供了海量宝贵数据。 通过委托CRO、客户合作及公司自有尝试平台定向产生有价值的高质量数据。 数据的质量和数量对AI+药物研发公司来说至关沉要,但对数据的挖掘、理解以及对关键问题的界说的沉要性不亚于数据自身,这必要基于公司团队对于生物学与药物研发的深刻理解。 08 AIDD主流算法模型必要大量数据驱动,而创新药行业内真实数据依然相对匮乏,若何解决这一问题? 目前主流的深度进建都是依附大量训练数据,通过自动进建的算法得到蕴含有关知识的模型参数,从而实现模型职能。面对训练数据不及的情况,目前重要从“开源”和“增效”两个角度来解决。 “开源”即是增长训练数据量,能够利用传统的数据处置思路,如机械预标注、数据加强等方式来削减数据筹备成本从而扩增数据量;也能够通过行业整合的方式,结合多方数据源头搭建数据共享平台,利用区块链和联国进建等技术在保障数据隐衷和所有权的情况下,实现行业数据的合理利用与有效整合。 “增效”即是通过创新和改进深度进建步骤,提高对有限训练数据的使用成效,好比利用迁徙进建、幼样本进建等步骤,利用少量训练数据对现有预训练模型进行微调,从而实现模型在新数据集下的相应职能(预训练模型通常来自一样工作下现有的通用模型,或者可通过低成本大体量的数据集训练获得)。 09 目前绝大无数AI+药物研发企业集中在幼分子药物研发领域,AI是否也能利用到大分子药物研发领域? AI在大分子药物领域的利用简直远远落后于幼分子领域,重要原因是大分子结构与职能的复杂性以及大分子数据的不足。 在蛋白药物研发领域,AI辅助的抗体定向进化已在工业界崭露头角。蛋白定向进化通过构建突变文库、高效表白与筛选蛋白、对筛到的突变体进行再次突变与筛选,多轮迭代后得到性质中意的蛋白,这一伎俩在酶工程领域已有成熟利用,近年来有不少公司将这一思想利用到抗体药物筛选中,如国表的BigHat、Absci、Ginkgo和国内少数从事AI+大分子药物开发的公司。AI的利用能够提高文库构建的效能与质量,削减迭代筛选次数,使得抗体定向进化更为高效。 然而在巨大的潜在蛋白质序列空间中,定向进化步骤只能覆盖很一幼部门,且即便有AI辅助,抗体定向进化过程依然必要多轮尝试迭代,繁琐耗时。只管在幼分子领域虚构筛选已得到宽泛利用,但大分子的虚构筛选一向是学术与工业界的难题。最近我们欣喜地看到国内的信华生物已实现基于抗体虚构筛选的沉大突破,该公司开发的Vibrantfold平台能够高通量精确地预测抗体结构和构建虚构抗体突变文库,实现不依赖于实体突变文库的、不受库容限度的高效抗体虚构筛选。 当前的抗体定向进化与虚构筛选均必要基于已有的天然抗体,在大分子药物领域的终极指标是实现蛋白质的重新设计。蛋白重新设计不依赖现有的天然蛋白,而是基于生物物理与生物化学道理重新搭建、设计拥有全新结构和全新职能的蛋白质;⒍俅笱avid Baker教授是蛋白质设计领域的领武士物,他辅导的尝试室已经在这一领域获得了一系列奠基性的成就,我们等待在不久的将来能看到蛋白质设计的前沿成就在工业界中得到利用。 除了蛋白药物以表,我们也在基因医治、mRNA、新抗原等多个生物药领域看到AI的利用,例如Dyno利用机械进建和高通量尝试刷新病毒衣壳;mRNA公司将AI用于mRNA密码子优化、mRNA结构优化和LNP筛;而机械进建在肿瘤新抗原的筛选过程中险些成为“标配”,国内华大吉诺因已经将AI驱动研发的新抗原疗法推向临床。 10 什么样的AI+药物研发公司团队称得上是一个优良的团队? 对于AI+药物研发这样的前沿交叉领域而言,首创人必要具备持续进建、急剧迭代及合作共赢的企业家心灵。 决策层拥有推算和药物研发的双沉布景是很大的加分项,复合布景的治理层能够疏导推算团队和药物研发团队高效深度融合。 11 AI+药物研发公司若何进行贸易变现? AI+药物研发公司有两种典型贸易模式,一种是以服务为主的SaaS供给商/CRO模式,一种是自研管线为主的Biotech模式。SaaS供给商/CRO模式优势是能够更快实现收入,并通过宽泛合作堆集更无数据以支持算法迭代,但因药物研发里程碑实现周期长、本土药企付费意愿不强,因而天花板比力显著;Biotech模式通过自有管线推动能更快验证算法平台能力,且创新药资产能够给公司带来更大的价值发作潜力,我们更看好占有创新自研管线的AI+药物研发公司。 12 2022年AI+药物研发融资趋向若何? 随着二级市场估值回调及美元对国内投资的收紧,预计整个市场热度将出现肯定水平的回落,但二八分化效应显著,拥有顶尖推算与药物研颁布景团队、顶级基金和MNC背书的AI+造药公司仍将受到本钱追捧。 融资整体向中后期转移。凭据公开信息披露,获投项目数量占比超85%,而获投项目中近半仍处于早期阶段,预测将来一年资金将向中后期市场转移。 产业本钱数量不会大幅增长,仍旧以财政投资为主。以药企为主的产业主体更偏差于与AI创新公司合作的模式。重要原因是行业整体还处于早期阶段,而药物研发的周期太长,无法短功夫内看到验证了局,无数本土药企对于AI的价值仍处于张望态度。 总结与瞻望 生物医药研发持久处于“作坊式”状态,数字化与自动化水平低,依附大量人力与专家经验,分歧研发环节之间存在显著脱节。而创新药均匀10亿美金级的研发成本、均匀超过10年的研发周期、幼于10%的临床开发成功率和药企逐年走低的本钱回报率导致行业刷新的需要火烧眉毛,AI无疑让各人看到了但愿。 但AI在药物研发领域的利用还存在好多现实挑战,好比高质量数据的不足、模型可诠释性不及、人才的稀缺、传统药企对AI的审慎态度等。只管AI在短期内还无法彻底“沉塑”创新药研发流程,但随着数据堆集、模型创新与迭代、新的监管与贸易模式的出现,我们等待将来能看到AI将与药物研发流程深度融合,并对创新药行业带来更彻底的刷新。 附录 AI+药物研发本钱市场近况 CEC Capital 公开数据显示,截至2021年8月17日,全国共计46个AI+药物研发项目获得融资,产生买卖99起,参投契构(VC、基金、产业本钱)190家,累计融资总额近160亿元人民币。 融资左袒早期,逐步向中后期发力。融资行为自2015年开启,每年皆集中在早期阶段,买卖量占比超过50%,中后期占比逐步提升。与AI行业整体融资顶峰期重要集中在2018年之前相反,AI+药物研发买卖重要集中在2018年后,尤其2021年截至当前买卖量已超2020整年的24次。 整体而言,因大笔融资额的影响,2021年公开披露实现逾110亿元人民币。刨除大额买卖,21年截至当前融资额已超2020整年32亿元人民币的总额。此表,受中后期买卖增多影响,2020年融资额同比增长超400%。 本钱活跃,以财政投资为主。参投契构(VC、基金、产业本钱)共计190家,二次追加及以上者占比近30%,其中参加5次买卖以上的有8家机构,别离是红杉本钱、五源本钱(原晨兴本钱)、峰瑞本钱、高榕本钱、源码本钱、百度、真格基金、BAI本钱。其中产业本钱24家,药企近半,共计参加40起买卖,以百度、晶泰科技、腾讯、依图科技、药明康德为代表。此表,与其他产业本钱偏好选择与财政本钱合投分歧,药企更偏好独立投资。 作者 乐天堂fun88本钱医药与生物科技组 张骁 卜佩璇 乐天堂fun88本钱健全产业钻研院 李海存 造图 李鑫 赵毅
郭国晖(女士)
电话:+86 (10) 8519 2080
传真:+86 (10) 8519 2078