Kateb M, Safarian S. Machine learning-driven predictive modeling of mechanical properties in diverse steels[J]. Machine Learning with Applications, 2025, 20: 100634.
Kateb, Movaffaq, and Sahar Safarian. "Machine learning-driven predictive modeling of mechanical properties in diverse steels." Machine Learning with Applications 20 (2025): 100634.
Kateb, M., & Safarian, S. (2025). Machine learning-driven predictive modeling of mechanical properties in diverse steels. Machine Learning with Applications, 20, 100634.
背景简介
钢铁因其可调节性满足多样化需求,成为现代工程和工业应用中使用最广泛的材料。其分类依据多样,包括碳含量/合金元素、精加工工艺、机械强度、热处理和质量等。得益于卓越的成本-强度效益,钢铁是建筑、铁路、桥梁、管道和发电厂等基础设施的核心材料。前工业时代的铁匠缺乏合金化知识,但他们通过有意调控碳含量和去除炉渣来获得目标力学性能,而现代钢铁则刻意添加不同合金元素,其特定成分显著影响性能。除合金含量外,工程师还可通过处理工艺调控微观结构(如晶粒尺寸、相组成、织构)进行优化,例如:高碳/高合金钢通过退火改善切削性,再经热处理硬化恢复初始性能,处理工艺的选择与现有元素强相关。此关联已通过机器学习(Machine Learning, ML)数据分析验证,但当前ML研究存在两大局限:依赖大型数据集和局限于单一钢种。本研究旨在突破上述局限,探索小样本数据集(312个样本)在多钢种(不锈钢、工具钢、马氏体时效钢、高强度低合金钢)场景下,预测机械性能,包括屈服强度,抗拉强度和伸长率。
成果介绍
(1)作者使用了312个不同钢样品的数据,以开发ML模型,数据集提供了每个钢样品的应力-应变机械性能,其中包括极限抗拉强度、屈服强度和伸长率。ML算法使用80%的数据集进行训练,剩下的20%用于测试。为了确保所建立的ML模型的强度并考虑随机性的影响,采用了三种评估策略:(1)使用固定种子以单个随机训练-测试分割进行训练和测试,以维持相似的训练/测试集(2)使用100个唯一种子进行100个随机训练-测试分割,以分析模型一致性(100个种子)(3)利用LOOCV来评估整个数据集的性能。图1比较了各种ML模型(人工神经网络,支持向量机,随机森林和分布式梯度提升库)在预测机械性能方面的性能。结果显示,随机森林与分布式梯度提升库性能显著优于人工神经网络/支持向量机。
.png)
图1 ML模型预测屈服强度,拉伸强度和伸长率的RMS评分比较
(2)作者利用预测获得的屈服强度、拉伸强度和伸长率值和试验值之间的关系形成散点图,如图2所示。图上显示的RMS值量化了模型的预测准确性,值越高表示性能越好。对于屈服强度和拉伸强度,RMS值分别为0.84和0.85,表明预测结果和试验结果之间有很强的一致性,这表明ML模型能够有效地捕获这些属性的数据中的底层模式。然而,对于伸长率,RMS值相对较低,为0.52,这表明该模型很难准确预测该属性。
.png)
图2 力学性能参数预测和试验值对比结果:(a) 屈服强度,(b)抗拉强度和(c)断裂延伸率
(3)作者为了更深入地了解每个输入(元素成分)如何影响输出(机械性能),进行了特征重要性分析。图3显示了影响材料抗拉强度、屈服强度和伸长率的特征重要性,蓝色条表示对目标具有积极影响的特征,红色条表示具有负面影响的特征。
.png)
图3 对随机森林模型中每种机械性能的前10个最具影响力的特征进行排名:(a)屈服强度,(b)拉伸强度和(c)拉伸强度。红色和蓝色条表示对应于组合物的负面和正面影响,细黑线表示误差条
致谢
本文第一作者和通讯作者:Movaffaq Kateb(Uppsala University)。
本期小编 代忠伦(整理)
董乃健(校对)
程 航 (审核)
董乃健(发布)
|