“ITBT”跨界融合大热,这种新研发模式或将改写未来生物制药格局

随着首届中国生物计算大会的召开,ITBT再次被推到了行业风口上。百度公司创始人、董事长兼首席执行官,百图生科创始人兼董事长李彦宏在会上发表了开场致辞,中国科学院鄂维南院士、施一公院士、董晨院士、谭蔚泓院士等多位顶尖科学家与会发表主题演讲,引起了业内的广泛关注。

这次大会的主办方百图生科是李彦宏去年创办的中国首家以生物计算技术驱动的生命科学平台公司。而生物计算也正是“ITBT”的核心含义。ITBT是在人工智能、大数据之上延伸出来的一个新概念,是计算科学IT与生命科学BT的一种有机融合,聚焦于基于大数据算法进行的生物医药开发。

计算科学与生命科学本是两个并行发展、各自独立的领域,但是随着近年来计算科学的飞速发展,两个互无关联的行业逐渐发生了交集:计算科学开始作为工具为生命科学赋能,以加快新药研发的效率、提高药物研发的质量。这种跨界融合诞生出了“ITBT”的概念。

首届中国生物计算大会似乎也传达出了一种信号:ITBT已经可以作为一个独立的子赛道,具备改变未来生物制药研发模式及市场格局的潜力。

面对这样一个热门的新兴赛道,业内翘首观望之人不少。ITBT因何诞生?它的兴起会对传统生物制药模式带来哪些颠覆?全球有哪些生物计算公司?他们未来发展还将面临哪些困局?又如何突围?

源起于医疗AI

初次接触ITBT可能会比较陌生,但是如果提及医疗AI赋能新药研发则已能耳熟能详。ITBT中的“计算IT”其实就是广义的计算,包含了人工智能与机器学习。也就意味着,ITBT隶属于大医疗AI赛道。

除了AI赋能新药研发,医疗AI的应用场景还包括医疗信息化、智能诊疗、医学影像等,其中在医疗信息化场景下的应用是最早的,在智能导诊的应用是最广的,在医学影像的应用是发展最快的。反观医疗AI在新药研发场景里,发展虽较其他场景晚,但是市场规模巨大,占据总人工智能市场35%以上份额。

近年来,投资机构为了划分医疗AI在不同场景下的细分赛道,将新药研发场景下的医疗AI定义为“ITBT”。五源资本是国内最早提出ITBT概念的投资机构之一,该机构早在2017年便关注到了该赛道的潜力,早早布局并投资了晶泰科技、未知君、星亢原、星药科技、剂泰科技等ITBT企业。

如果追溯ITBT产业的发展史,则需要回归到中国新药研发发展史与人工智能的发展路径上。2015年,中国医药界发生了著名的“722事件”,推动了国内医药企业往创新药领域发展,随后,2017年被称为创新药元年,新药临床和上市的审批政策频出,大批新药批准进入临床试验。

如果说创新药是种子,那么人工智能便是土壤。同样是在2017年,国务院出台《关于印发新一代人工智能发展规划的通知》,强调基于人工智能开展大规模基因组识别、蛋白组学、代谢组学等研究和新药研发,推进医药监管智能化。

生物计算(ITBT)便从这时开始萌芽,而它生长的关键则在于计算(IT)上。“计算方法的突破,带来的就是人类认知的革命。”施一公院士在首届中国生物计算大会上说道,“伴随人工智能的出现,本世纪将会出现颠覆性的变化!”

这种变化已经可以从ITBT上窥见眉目。伴随中国计算科学的飞速发展,超级计算机、算法优化,再加上不断累积的医疗大数据,诸多种种为ITBT铺设好了“天时地利人和”。

ITBT爆发的“天时地利人和”

“生物计算的发展与互联网的发展有着惊人的相似之处,驱动互联网搜索量增长的有三个关键指标——上网人数、上网时间、网页数量,而在生物计算领域同样也由三个关键指标共同驱动。”李彦宏在首届中国生物计算大会上用最通俗的比喻解释了ITBT产业发展的动力来源。驱动ITBT产业发展的三个关键指标分别对应了算力、算法和数据。

从算力上看,中国计算机的算力水平已经达到世界一流。中国有6个国家超级计算中心,分别位于无锡、天津、济南、深圳、长沙和广州,其中国家超级计算无锡中心的超算“神威·太湖之光”在2016年就已经达到了每秒12.54亿亿次的算力,成为全球最快的超级计算机,为中国生物医药、金融分析、信息安全等领域提供计算和技术支持。

从算法上看,各类机器学习算法的不断迭代优化。算法是人工智能的核心,通过摸索药物与疾病、疾病与基因之间的隐秘关系,构建强大的底层计算架构,并在不断试错与应用之间进一步完善,最终让算法越来越贴近真实的人类逻辑。

从数据上看,人类生物医学研究积累了巨大医学数据,包括基因组学、转录组学、蛋白质组学、代谢组学、小分子数据等。这些数据既来自公开的海量医学文献,也来自药企/CRO自主研发积累的数据库。而伴随人类观测手段的丰富,我们能够获得的生物指标数据也在变多,未来将会有更多、更大体量的多组学数据产出。

“随着医疗数据的进一步积累,眼下似乎已经到达了一个临界值——足够多的生物数据整合在一起,再以AI作为桥梁,可以为新药研发助力。”百图生科首席AI科学家宋乐表示,“我们非常希望和制药行业、生物计算行业的各位同行一起努力,找到一些新的AI助力新药的方向。”

伴随中国计算科学算力的提升、算法的精进,以及医疗大数据逐年累月的沉淀,成为了孵化ITBT的天时地利人和。中科院计算技术研究所高性能中心主任谭光明肯定道,将药物从实验驱动推向数字驱动,推动供给侧提供高效优质的产品,这是一种极有潜力的趋势。

ITBT将改写制药产业多元化格局

传统药企采用经验主义进行药物开发,不仅研发成功率低,还面临研发周期长、费用高等问题。一款新药从临床发现到获批上市平均历时10-15年,研发成本高达30亿美金,平均成功率却不到10%。ITBT模式的出现或将改变这一现状。新药研发作为医疗AI应用场景中增速最快且最具潜力的市场,在计算科学IT的加持下,凭借其算法和算力优势,可以助力新药研发的多个环节,加速靶点发现、化合物合成、制剂开发、晶体预测等。

而这种助力实则是一种“数字化”,中科院计算所-哲源·图灵-达尔文实验室副主任赵宇告诉动脉网:“在计算机上对细胞功能数字化、疾病机理数字化、药物机制数字化、病人数字化等,可以实现高维度下的‘人药匹配’。”

在靶点发现上,ITBT利用自然语言处理(NLP)技术检索分析海量的文献、专利和临床试验报告非结构化数据库,找出潜在的、被忽视的通路、蛋白和机制等与疾病的相关性,从而提出新的可供测试的假说,以发现新机制和新靶点。

在晶型预测上,ITBT可以利用认知计算实现高效动态配置药物晶型,预测小分子药物所有可能的晶型。晶型变化会改变固体化合物的物理及化学性质,导致药物在临床治疗、毒副作用、安全性方面的差异,对药物研发造成干扰。

在化合物筛选上,凭借IT的强大算力,可以对候选化合物进行虚拟筛选,更快筛选出活性较高的化合物。根据36氪“AI+医疗”行业研究报告数据显示,在人工智能助力下的化合物虚拟筛选平均可以节约40-50%时间,年均节约260亿化合物筛选成本。

从理论上来说,在药物研发过程中引入IT技术,利用深度学习技术对分子结构进行分析与处理,在不同研发环节建立拥有较高准确率的预测系统,可以减少各个研发环节的不确定性,从而缩短研发周期,降低试错成本,提高研发成功率。据TechEmergence报告显示,有人工智能技术参与的新药研发成功率能从12%提高到14%。

在ITBT加持下,将会对传统生物制药产业带来多元化的格局改变,主要可以从药企端和CRO/CDMO服务端两个方向进行解读。

在药企端,ITBT的加入将会加速新药研发市场的竞争,特别是在小分子药物上。由于小分子药物的研发逻辑相对大分子药更加线性和直观,IT技术可以通过多学科融合的技术路径让一些在高校科研机构里面的优秀储备靶点甚至是还未被科学家确定结构的蛋白靶点,快速寻找到最适配的小分子化合物。

药明康德相关负责人在首届生物计算大会上也肯定了ITBT对小分子药物领域的积极促进作用。ITBT型的药企可以针对特定靶点批量产生小分子候选化合物,伴随算法引擎的优化,每代候选药物之间相互协同,共同作用支持迭代出更好的药物。从长远来看,利用ITBT的企业相对传统小分子药物研发公司在寻找特定靶点的小分子化合物上更具有优势,将在药物发现端形成更明显的头部规模效应。

不过,中科院计算所西部高等技术研究院常务副院长张春明也指出,ITBT的数字药物实验场不会直接取代药企,而是以二八原则展开——80%上计算机干,20%还得人做。但是使用计算医学技术的企业,一定会去替代那些不使用计算医学技术的企业,趋势如此。

站在CRO/CDMO的角度,一些ITBT企业则是选择聚焦于新药研发中的某一特定环节,为药企或医疗机构提供基于此环节的技术服务,如化合物筛选、分子设计、晶体预测等,从而加速新药研发进程。

这种提供“计算服务”的模式属于一种新型CRO/CDMO,这类型ITBT企业会在与药企的实际合作中执行不同的商业模式,例如一些企业可能会以化合物IP的方式进行合作,二者共同推进IP完成临床试验到上市。

ITBT企业正在加速合作发展

虽然是一种全新的概念,但是IT与BT的融合并不是近年来才出现的,以计算科学赋能生物制药早在数年前就已有企业涉足,宇道生物、晶泰科技、哲源科技等都是国内最早一批生物计算领域的公司。而伴随着人工智能技术的完善、医疗数据资源的积累,ITBT领域也涌入了越来越多的新企业,2019年成立的星药科技、2020年成立的百图生科,都是基于医疗大数据挖掘进行生物医药研发探索。

动脉网对全球涉足ITBT的企业进行了简单梳理:中国涉足ITBT的部分典型企业盘点

可以看到,在我们统计的国内涉足ITBT药物研发的14家典型企业中,有8家不仅自主拥有ITBT技术能力,也基于该能力自主搭建起了独立的临床新药管线,分别是宇道生物、冰洲石生物、未知君、亿药科技、智药科技、星亢原、星药科技和索智生物;

另外6家企业晶泰科技、哲源科技、深度智耀、望石智慧、百图生科、剂泰科技更侧重提供药物研发服务,这类公司更注重结合自身在AI领域的专长与药企合作,共同搭建/推进管线进程。值得一提的是,与中国首届生物计算大会共同展开的还有百图生科与索智医疗的合作。百图生科侧重于AI算法等生物计算引擎的建设,索智医疗则是在百图生科和维亚生物共同加持下成立,旨在打造一个以人工智能为基础的新型的新药研发范式。

与此同时,一些大型药企、CRO/CDMO企业也开始通过合作或兼并购等方式扩大公司在ITBT方向的比重。例如,药明康德投资了强化学习和生成对抗网络(GAN)相结合进行分子发现的公司Insilico Medicine;正大天晴通过与阿里云医疗AI合作,以获得全新的基于机器学习模型的化合物筛选方法;

2018年,罗氏以19亿美元收购肿瘤大数据公司Flatiron Health,为其提供研发所需的数据与技术支持,加速新药上市;2019年,江苏豪森与美国AI制药公司Atomwise达成合作,双方将合作设计并发现多个治疗领域中多达11种未公开靶蛋白的潜在候选药物。据悉,全球前十大药企均已入局ITBT。

海外部分ITBT企业代表Atomwise:化合物筛选 

Atomwise成立于2012年,位于美国旧金山,是一家利用超级计算机进行药物研发的AI制药公司。公司利用运用超级计算机、深度学习和复杂的算法模拟人类分析化合物分子的过程,从千万量级中筛选出潜在药物,从而加速化合物筛选、新药发现,同时降低研发成本。

该公司在2020年8月11日获得了由B Capital Group和沙特公共投资基金Sanabil Investments共同领投的B轮投资,总金额1.23亿美元,老股东DCVC、BV百度风投、腾讯、Y Combinator、杜比创投、AME Cloud Ventures等老股东继续追加投资。同年10月6日,Atomwise又获得了比尔及梅琳达·盖茨基金会230万美元捐款(Grant)。

据悉,Atomwise计划继续扩大与礼来公司、拜耳、汉索制药、Bridge Biotherapeutics、StemoniX、SEngine Precision Medicine等生物制药公司的合作。迄今为止,Atomwise已与公司合作伙伴签署了价值约55亿美元的共同研发条款。

Exscientia:小分子化合物设计

Exscientia成立于2012年,位于英国牛津,是一家自动化AI药物设计公司,平台同时利用大数据和机器学习方法,根据已有的药物研发数据自动设计出上百万种与特定靶标相关的小分子化合物,并根据药效、选择性、ADME等其他条件对化合物进行评估和筛选。公司尝试将一些算法进行组合,可以将药物研发时间从4.5年降低至1年,并且能够有效减少前期需要考虑的化合物数量。

2021年4月27日,Exscientia宣布完成了融资总额为2.25亿美元的D轮融资,由软银愿景基金二期领投,上轮融资的主要投资方Novo Holdings和BlackRock(贝莱德集团)旗下基金参投,其他投资者包括Mubadala Investment Company、Farallon Capital、Casdin Capital、GT Healthcare Capital、Marshall Wace、Pivotal bioVenture Partners、Laurion Capital、Hongkou以及百时美施贵宝。与此同时,软银还提供另外价值3亿美元的股权承诺,由Exscientia自行决定是否注资。

而就在一月前的3月4日,Exscientia才完成了4000万美元的C轮融资,投资方包括BlackRock(贝莱德集团)旗下基金、Novo Holdings、Evotec、Bristol Myers Squibb和GT Healthcare Capital。与此同时,Exscientia正积极与百时美施贵宝、赛诺菲、拜耳和大日本住友以及多家生物技术公司建立了药物发现合作伙伴关系。

Genesis Therapeutics:分子生成及特性预测

Genesis Therapeutics成立于2019年,位于美国旧金山,是一家致力于利用AI技术推动新型小分子药物的发现和开发的生物制药公司,公司将新型深度神经网络、生物物理模拟和大规模可扩展的计算基础设施相结合,以实现分子自动生成和特性预测。据悉该公司是由Feinberg博士在斯坦福大学Vijay Pande博士实验室工作时搭建的AI技术平台演化而来,由斯坦福大学与默沙东研究实验室合作验证后创立。

2020年12月2日,Genesis Therapeutics宣布完成了5200万美元的A轮融资,由Rock Springs Capital领投,T. Rowe Price Associates、Andreessen Horowitz、Menlo Ventures和Radical Ventures、Felicis Ventures、Jazz Venture Partners、Harpoon Ventures、Ulu Ventures、Propagator Ventures和Open Field Capital等共同跟投。

该公司积极与世界各地的生物制药公司合作,在2020年10月与罗氏旗下子公司基因泰克(Genentech)达成多目标合作协议,将利用Genesis Therapeutics的图形机器学习和药物发现专业知识,为多个疾病领域的治疗目标确定创新的候选药物,共同推出新型疗法。

Redesign science:蛋白质靶点小分子筛选

Redesign science成立于2017年,位于美国纽约,旨在通过强大的云端并行分子动力学模拟技术,重点研究难以成药的蛋白质靶点。公司独家技术平台研发的AlphaSpace物理引擎可在原子级别精度对药物靶点蛋白进行超长时分子动力学模拟 ,快速筛选上亿级别的小分子数据库。通过传统力学和量子力学的结合,Redesign Science能够对任意蛋白质靶点进行快速高精度建模,即使是没有任何结构数据的蛋白体。

该公司在2019年10月15日完成了数百万美元的种子轮融资,由Notation Capital领投,晨兴资本(现五源资本)、Third Kind Venture Capital、Refactor Capital等跟投。与此同时,Redesign Science针对癌症以及IBD(发炎性肠疾病)等疾病领域,已建立起多个新药研发合作关系。通过与合作伙伴进行多种不同疾病的共同研究,Redesign Science计划利用其AlphaSpace物理引擎来揭示以往未知的蛋白运行机制,并开发新型小分子药物来治疗疾病。

ITBT产业发展的方向与难点

虽然赛道火热,但ITBT在中国依旧还处于早期,面临着诸多亟待解决的痛点与矛盾,IT端的数据来源及存储问题便是其中之一。“尽管数据的生产已经工业化,但是数据的理解与使用的能力还是非常欠缺,尤其在生物和医药领域更加明显。”中科院计算所-哲源·图灵-达尔文实验室副主任赵宇认为,大数据对一些医药企业来说并不是工具,而是泥潭。

数据是ITBT发展的基石,包括那些通过多种手段检测而来的多维度数据。“以前多维度数据是没办法很好整合到一起的,但是伴随AI的加入之后,多组学数据已经可以对疾病判断、靶点研究产生积极的影响。”百图生科副总裁蒋昭实这样表示,“庞大的数据库为临床药物靶点研究起到非常重要的作用。”

而这些数据的来源,主要分为公开和非公开。公开数据集包括了海量文献、专利、临床试验报告等,这部分开源数据的标准化程度不够,颗粒度越来越细,一些误差可能就会掩盖背后的规律。“怎么建设更体系化的数据集是百图生科作为生物计算公司努力探索的方向。”百图生科联合创始人兼CEO刘维表达了这样的观点。

对于非公开的数据,例如一些大型药企利用本身技术和研发基础以及多年积累的药物研发数据,同样能够为药物研发赋能。不过这部分数据在业内都是稀缺资源,ITBT企业往往只能通过商务合作等方式获取。

在数据储存上,目前主要还是基于本地化以及云端存储的解决方案。而伴随未来医疗数据的增多,预计到2025年中国产出的需要被存储的数据量最高可能会达到20EB以上级别,数据储存及加密也会成为ITBT企业长远发展必须面临的问题之一。另一方面,基于ITBT模式加速了新药研发的效率,但是对于药企而言怎么从效率提升变成最终的质量提升,即提高药物临床研发成功率也是ITBT企业需要面对的一大问题。

药明康德相关负责人提到,计算对于医药行业并不是从1到1,而是还有很多机会可以推进:第一层,ITBT最清晰的路径是从已知靶点找到合适配体;第二层,ITBT如何基于靶点和通路设计出新药,提升整体药物的临床成功率;第三层,ITBT怎么从海量数据中发现,基于还原论,从一个靶点一个分子的思路找到新的适应症、新的治疗方法。

目前来看,ITBT产业还主要停留在第一层,传统药企与IT行业正处于融合阶段,即提高药物研发的效率,但是提升效率只是第一步,怎么从效率的提升进展到决策质量的提升,这就需要来自于好的数据与好的决策模型。只有伴随着未来生物数据量和数据质量的提升,IT与BT的融合才将获得进一步加速,未来十年的生物医药产业也将随着生物计算的兴起再次步入黄金时代。