当然还有最重要的是,身边有太多,太多,可以学习,交流的对象,而且几乎都是热爱科研的那群人。
这种身边全都是同类,且还能帮助自己提升自己科研水平的环境,实在是让她觉得,自己是不是在做梦。
这段时间她在找一种能够抑制一种遗传性疾病相关酶的分子,她测试了数百种候选物质,有3款候选,但还是没有达到她的预期,还需要继续测试下去。
这天,公司信息部门的负责人却把她叫进办公室,并向她介绍了李扬,李扬是爱英集团的一名数据科学家,之前一直都是在爱英生物数据中心部门做数据支持工作。
崔敏进门之后。
“您好,我叫李扬,是公司这边数据科学家,公司这边近期开发了一种新的生成模型,可以帮助到你的科研项目。”李扬却是开门见山,没有半点客套。
崔敏倒是比较喜欢这种沟通方式,因为足够的节省时间。
“你好,我是崔敏,公司的高级化学家,怎么帮?”
崔敏对李扬说的话却是持怀疑态度。生成模型她当然知道,不过可靠性还有准确性却是很让人怀疑。而且从心底里,她也不认为一个生成模型就能够取代人类的专业知识和直觉。
不过本着这段时间在爱英生物科研的良好体验,她也没有拒绝。
之后李扬跟着崔敏来到她的实验室,在那里李扬将他的笔记本电脑连接到她的工作站上。
他打开了一个应用程序,显示了一个看上去非常简单的操作界面,并有几个选项和参数。
“在开始之前,我们需要确定一下目标从属性。”李扬说道。“比如说,你想要找到什么属性的分子,当然这块儿说起来比较复杂,有没有关于你的候选物质的结合亲和力的数据?”
“有。”崔敏说着,示意了一眼不远处的她的助理,她的助理快速地在电脑上操作起来,片刻功夫之后,就呈现了一组数据。
“好的,接下来我把它们上传到这个模型里。”李扬说着,拿出手机,直接拍下了相关数据,一页,两页,三页.拍摄的同时,相关的数据信息片刻功夫之后,就已陆续呈现在了电脑屏幕上。
“你们可以对一下,看看数据有没有错漏,没有的话,我就让他运行了。”李扬说道。
崔敏点点头,稍作检查之后。
“没问题。”
李扬轻点之后,这个界面初步运行起来,进入下一页。
“好了,现在我们可以设置我们想要生成的 IC50值范围。”李扬说道。他在屏幕上移动了两个滑块,直到它们显示为 0-10 nm。
崔敏微微有些惊讶李扬的操作,但也没说什么。
“这个小的数值?”崔敏助理却是直接惊讶道,一般ic50的数值越小,说明抗体的特异性能越强,效果越好。“我们现在还没有一个候选物质有这么低的 IC50值。”
“待会儿就知道了。”李扬笑着说,表现的却是非常有自信。“它可以探索你没有探索过的化学空间区域。”
他点击了另一个选项,允许他为生成分子指定一些额外约束条件。
“我们还要确保我们的分子是类药物化合物。”毕竟是爱英集团高薪挖来的数据师,在这里工作这么长时间了,一些普通的专业知识,他已经理解了不少。所以往往还未等崔敏说什么,李扬就已经打开了对应页面。
“这意味着它们应该具有合理的分子量、logP值、溶解度等等。我们可以使用一些常见过滤器,如 Lipinski的五规则或 QEd分数来筛选掉不理想的化合物。”
他在屏幕上勾选了一些框,并相应地调整了一些阈值。
“还有别的吗?”他问崔敏。
“嗯,需要避免那些与我已经拥有的分子太相似的分子。”崔敏说道。“不用浪费时间和资源在测试重复或近似重复的化合物。”
李扬点点头,而后在 Tanimoto相似性系数的截止值处输入了 0.8,这是一种常用的比较分子结构的指标。
“那就开始了?”李扬转头又问。
崔敏轻轻嗯了一声。
随后点击了一个标有“生成”的按钮。模型开始工作,在屏幕上显示一个进度条和一些统计数据。Alice紧张地观看,想知道是否会有任何有用的东西出现。
大约 3分钟后,模型完成了 1000个满足所有条件的分子的生成。它根据它们预测的 IC50值对它们进行排序,从最低到最高,并以表格格式显示它们为 3d结构。它还突出显示了它们的关键特征,如功能团、环或杂原子。
这一刻的崔敏再没了之前的从容,一脸不敢置信。
她走到电脑前,快速地滚动界面,仔细地看着每个分子。而越看,惊讶也就越大,这些分子确实是多样化和创新性的,显示出不同于她候选物质的骨架