最近,谷歌人工智能和加州理工学院的研究人员使用墨水打印机和机器学习方法发现了新的金属氧化物。几项研究使用机器学习来预测材料质量,但这些方法本质上是专业的,未能掌握问题的全局性质。让我们来看看这一切是如何发生的。
机器学习算法的使用
机器学习算法用于确定材料对给定属性的适用性。但是,它们已被用于缩小每个给定属性的优秀材料列表。因此,研究人员反对使用机器学习来识别具有特定特征的材料。此外,化学家经常声称对控制材料产生的试剂特性和组成比的模式有一种“直觉”。如果存在这样的模式,当给定成功和不成功反应的数据库时,可以使用数据挖掘技术发现它们。
在这里,研究人员创建了两种数据科学方法,用于在高阶组成区域中发现材料。此外,本研究详细介绍了为这些系统数据提供数据的高通量过程的制定和构建,以及用于领先发现的用例的说明。主要发现是,完善的数据科学模型可以使用通常不用于相表征的数据集来推断复杂材料的相行为。此外,这些结论为当前数据集提供了科学价值,并有助于开发新材料。
好处
数据科学驱动的实验数据评估的应用补充了量子力学和基于机器学习的相位预测。此外,通过光学数据建模检测新系统和组合物可以作为进一步研究新相和/或评估三阳离子组合物显示独特特征的跳板。此外,该方法建立在组合材料科学的原理之上,其中混合物库的合成与所需属性的测量相关联。虽然这种方法提供了发现特定成分系统中理想属性的直接途径,但由于属性测量的相对成本增加,它限制了许多成分区域的发现以及测量每个所需属性的每个组合库的要求。
其他研究贡献
美国的研究人员使用典型的 RF 来预测基于 Voronoi 镶嵌和原子特征的结构能量。
中国研究人员使用卷积神经网络和迁移学习预测了稳定的全赫斯勒化合物。
来自美国的一组研究人员采用了各种回归和分类技术来分析用于增加固体氧化物燃料电池的阴极数据集。
加拿大研究人员使用簇分辨率特征选择对二元晶体结构进行分类。
同样,美国的研究人员使用 VAE 来预测晶体结构。
结论
传统上进行的 ML 研究一次只探索一个属性。因此,必须对同一材料进行多次评估。此外,训练数据集在高阶组成领域尤其稀缺,这允许通过开发包含所有三种阳离子的相来调整许多属性。然而,材料训练数据的稀缺常常限制了预测的准确性,特别是在没有训练数据存在的合成区域。此外,关于一般材料科学中的机器学习以及化学科学中的机器学习,已经发表了一些重要的评论,这可能预示着为新企业开辟道路。