“我想我的整个职业生涯都在进行数字化,20 年,”葛兰素史克研发技术高级副总裁 Michael Montello 说。“我记得我在发现中实现的第一个数据仓库。..在这里,我们仍在谈论数字化转型。”
蒙特罗在 9 月的生物 IT 世界大会上回忆起过去 3 年 GSK 数字化计划的情况。辉瑞、罗氏和礼来公司的同行也加入了他的行列,描述了他们公司在药物发现数据管理方面的类似项目。
他们的讨论有一个熟悉的环:打破功能孤岛,建立中央数据管理,开发标准术语。事实上,一位经常参加会议的人很可能已经同意了蒙特罗的观察:“我们又来了。”
但毫无疑问,鉴于现在无处不在的云计算使用以及即将无处不在的人工智能和机器学习部署,为实验室配备信息技术是一项快速变化的努力。药物发现 IT 的变化速度因发展速度更快的事物——科学而增加。
基因编辑和基因组学等新技术将药物发现置于数据管理转型的前沿。随着实验室产生PB 级数据,在寻找新药的过程中管理和整理信息的责任越来越多地从集中的 IT 部门转移到替补席上的研究团队。这对科学家和 IT 部门来说都是一个巨大的变化。
“很明显,科学创新的速度远远超过了IT创新的速度。它还比我作为 IT 人员构建存储系统、构建分析环境或构建数据库的速度更快,”生命科学 IT 咨询公司 BioTeam 的高级主管 Chris Dagdigian 说。
Dagdigian 说,实验室的科学家不可避免地直接参与了 IT 系统的开发,承担了传统上由企业 IT 部门承担的职责。反过来,传统的集中化实验室数据管理基础设施已经转变为由药物研究人员与数据科学家和软件工程师共享的工作台级 IT。
“近年来的信息是,我们使用和访问数据的方式非常微妙且非常流畅,不适合 IT 部门可以简单部署的基于规则的简单决策,”Dagdigian 说。“在涉及科学数据时,有些事情非常不适合 IT 拥有和控制。”
Dagdigian 提倡让科学家能够“自助”的技术:自行访问、使用和归档数据。“另一方面,我不希望科学家只是为了完成他们的工作而成为 IT 专家。”IT 部门不会折叠帐篷。
行业观察家一致认为,转型正在进行中,不能简单地将其描述为集中 IT 的分散。大型制药公司、初创企业和学术研究实验室所采用的方法必然会根据现有 IT 基础设施的数量而有所不同。但是,所有研究领域的实验室都在组建多学科团队来开发数据管理系统,为研究人员提供比以往任何时候都更大的代理权。
快速的行动
这家大型制药公司的分子科学家兼精准医学负责人 Holly Soares 表示,变化率是辉瑞实施数据管理 IT 最具挑战性的方面。“当我们更快地获得新系统并且技术复杂性越来越高时,有时很难适应和灵活。”她说,随着公司推进抗病毒药物和疫苗的研究,曾经需要数年才能部署的新技术现在必须在几个月甚至几天内完成。
辉瑞的 IT 管理也在不断发展。“我们看到数据科学家现在融入了研究团队,”苏亚雷斯说,并指出各个学科正在相互学习。研究科学家越来越多地参与整理数据,而数据科学家正在利用研究科学家的专业知识,这有助于他们更有效地在实验室中应用 IT 工具。她说,相互学习在基因组学研究中很普遍,其中 IT 是识别药物靶点和理解靶点差异的核心。“数据量可以达到 TB 级。”
该公司负责研究 IT 的副总裁 Ramesh Durvasula 表示,管理数据也已成为礼来的一项“团队运动”。他说,主题专家、IT 技术人员和数据科学家都挤在实验室工作台前。
Durvasula 指出,近年来进入实验室的化学家和生物学家为跨学科研究做好了充分准备。“与几十年前相比,越来越多的科学博士在软件和计算方面更加精通,”他说。“我们需要重新利用我们的许多系统,使他们能够利用他们带来的所有技能,而不是假设他们拥有几年前严格的替补科学家的技能。”.
装备多学科团队的挑战集中在学科之间的差异上。Durvasula 说:“我们需要了解,一个替补科学家对数据的消耗和对模型的利用与纯数据科学家对数据的消耗和对模型的利用有很大不同。”
数据标准化是另一项艰巨的任务。“随着科学仪器的进步,所收集数据的性质正在超过我们标准化的速度,”他说。
Durvasula 表示,研究团队正在努力克服障碍,专注于计算模型并将囤积数据的恶习转化为美德。“并不是科学家需要我们囤积数据;模型需要我们囤积数据,”他说。Durvasula 表示,为研究建立的计算模型正在成为实验室的竞争优势。“我们不再谈论杀手级应用,”他说。“我们更感兴趣的是杀手级数据集。”
阿斯利康 (AstraZeneca) 肿瘤转化医学战略与合作高级主管 Tom Plasterer 同意标准化继续困扰该领域的观点,但表示制药行业在数据标准存储库(例如国家生物医学本体中心的 BioPortal)的帮助下取得了进展。
Plasterer 说,制药业主导的努力,如同素异形体基金会,已经为数据管理提供了先进的通用术语。最近,包括阿斯利康 (AstraZeneca) 和辉瑞 (Pfizer) 在内的制药公司采用了FAIR 原则——确保存储数据可找到、可访问、可互操作和可重复使用的指南。
最近,Plasterer 的组织正在为肿瘤学研究建立数据模型。数据来自板凳。
“我们有很多非常聪明的科学家,”Plasterer 说。“他们一直在阅读论文,而且这一切都在他们的脑海中。而且你需要把它拉出来,放到一个电脑可以使用的模型上。这就是我所做的很多事情。把我从人们脑子里拿出来的东西放到模型中。”
较小的公司,尤其是在云计算和软件即服务 (SaaS) 世界中推出的研究密集型生物技术公司,可以解决科学家日益增长的问题,而无需适应根深蒂固的 IT 系统和管理。
Recursion 是一家将湿法化学外包的生物技术公司,它在打造适合各个实验室特定项目的数据管理技术方面投入了大量资金。Mason Victors 是这家拥有 8 年历史的公司的首席产品官。这个词的产品在他的头衔指的不是毒品,而是软件和协议构成本公司的数据管理系统。
Victors 表示,药物研究中多学科团队的兴起表明“现状并不是很好——对于生活在数字时代的公司来说,情况并非如此。不适用于 21 世纪的生物技术公司。”
凭借应用数学、数据科学和机器学习方面的背景,Victors 对科学家在实验室中处理数据的方式也持批评态度。“科学家们想要进行一项实验,因为他们试图回答一个非常具体的问题,”他说。“当他们得到答案时,他们不想再弄乱数据了。”原始数据最终不会在任何存储库中被捕获和整理,其他研究人员以后可以访问这些存储库。
Recursion 设计了一个基于云的存储系统来解决这个问题。“Recursion 的大部分数据都是高内涵的荧光显微镜成像,”他说。“我们每周通过我们的荧光显微镜平台运行大约 170 万个实验孔,这些图像在从显微镜捕获时会自动同步到 Google Cloud。”
Victors 说,在那里,图像被转化为数学表示,定义了对数据的见解,并且可以随时根据用户的要求提供给用户。
工作台的新工具
供应商提供的数据管理软件也正在进入发现实验室。据 9 年前成立的公司总裁兼联合创始人 Ashu Singhal 称,Benchling 是一家为药物发现制作 SaaS 应用程序的初创公司,它着眼于科学家的工作方式以及他们对 IT 工具的偏好。
Singhal 指出了以 iPhone 为代表的 IT 的“消费化”,以及数据管理系统向云的稳定迁移。“我认为我们正在看到消除 LIMS 的完整 SaaS 平台的出现,”Singhal 说,指的是传统的中央实验室信息管理系统。
Singhal 说,Benchling 为特定研究领域开发应用程序,例如基因组学或基因编辑,将软件配置交到用户手中。“这意味着他们可以调整软件的设置方式和工作方式,”他说。“它的软件与目前研发的速度兼容。”
尽管如此,该公司仍依赖于高度的标准化。“我认为 80% 的用户对我们的需求都是开箱即用的,”Singhal 说。
Benchling 声称其工具已被 600 家公司的 200,000 名科学家使用,这些公司从从头开始构建 IT 的小型生物技术公司到拥有完善数据管理系统的大型工业和机构研究组织。
替补科学家也出现了新的数据存储和搜索选项。WekaIO 是几家新公司之一,其产品旨在共享存储大量复杂的生命科学数据。该公司与包括 Hewlett Packard Enterprise 和 Hitachi Vantara 在内的硬件供应商合作,提供基于云的数据存储和本地选项。首席执行官 Liran Zvibel 表示,使用该公司的 WekaFS,研究部门可以将存储扩展到目前定义药物发现实验室高端的数十 PB 之外。
除了高容量外,WekaFS 还可以高速运行。任何科学工具都可以访问单个数据源,而大多数传统系统在分配给特定项目或研究类型的区域中冗余存储数据。访问单一来源还可以适应项目变化,而无需调整专用数据来源。“这款游戏的未来来得很快,”兹维贝尔说。“我们最强大的能力之一就是灵活性。”
用于数据搜索的新软件也首次亮相。七岁的 Genomenon 专注于基因组学研究,在数据生成方面经历了爆炸式增长。该公司首席执行官 Mike Kline 表示,该公司使用人工智能来实施用于临床研究的基因组学搜索引擎和用于药物发现的名为 Genomic Landscapes 的基因组学数据库。
“我们识别出与疾病相关的任何已发表的变异。我们对这些进行策划并提供与之相关的科学证据的解释,”克莱恩在描述基因组景观时说。
中心可容纳
LIMS 的支持者说,新技术并没有消除主力 LIMS 和类似的集中实验室 IT。事实上,LIMS 供应商 LabVantage Solutions 的销售和营销副总裁 Robert Voelkner 指出,数据管理的关键目标实际上可能会加强 LIMS 在药物发现中的地位。研究人员需要整合、协调和标准化数据,这是传统 LIMS 的核心竞争力。“公司不想要定制的 IT 系统,”Voelkner 说。
Voelkner 说,在他近 40 年的药物发现系统实施过程中,他看到 LIMS 发生了巨大变化。“在早期,您的 IT 组织负责所有与 IT 相关的工作。实验室只是其中之一,”他说。同一管理部门还负责人力资源计算、电子邮件和个人电脑。实验室研究 IT 现在是一个独特的实体。
“CIO 级别的人仍然具有战略眼光,希望部署标准和整合平台,”Voelkner 说,他指的是首席信息官。“但负责日常 IT 运营的人员现在是实验室组织的成员。”
IT 系统也在不断发展,以适应开发新工具的更大自主权。LabVantage 最近推出了其 LabVantage 分析系统的一个版本,该系统结合了机器学习算法,用于创建供研究人员使用的数据集。
宾夕法尼亚大学卫生系统宾夕法尼亚大学医学部 LIMS 高级应用程序经理 Ned Haubein 表示,他的团队正在努力为精通数据的科学家提供集中存储架构,允许在实验室中进行数据管理和管理。
“在个别实验室进行更多分析的转变正在增长,”他说。“你正在招募拥有更多完成这项工作所需技能的人——具有统计背景的人。”Haubein 的部门专注于使来自中央存储库的多个不相关实验室可以访问数据。
“我们扮演的部分角色是定义研究人员如何命名数据。我们扮演数据管理员的角色,”他说。“重要的是,我们 LIMS 团队中的大多数人都拥有跨科学和技术的背景。它使我们能够用他们的语言与实验室交谈。”Haubein 拥有化学工程博士学位。
Haubein 说,LIMS 系统更新了高级配置,允许实验室级别的员工进行定制。他认为,研究人员更多地控制其 IT 的趋势不会对大型数据存储系统构成生存威胁。
最大的制药公司也在努力平衡传统和新兴数据管理技术,以支持多学科药物发现团队的需求。蒙特罗在波士顿的会议上发言,描述了葛兰素史克的数字化转型计划如何从一个研究领域的小规模开始,然后在所有 IT 开发中发展壮大。
“我们看到的是,这些团队的行动速度更快,并且也更好地管理了他们的积压工作和优先事项。所有 IT 产品都是与研究人员合作开发的,”他说。“我们现在有 80 个产品团队。每个人都与科学家、医生、监管人员合作[工作]。这种协作和共同前进的文化对成功极为重要。”