当前位置：首页>郑州>郑州大学[MATER DESIGN]:数据稀缺下基于微调迁移学习的 Cu-Ti 合金加速设计

郑州大学[MATER DESIGN]:数据稀缺下基于微调迁移学习的 Cu-Ti 合金加速设计

2026-03-31 10:41:09

【简介】

本研究提出一种新颖的机器学习框架，利用迁移学习（TL）克服数据稀缺问题，设计兼具高极限抗拉强度（UTS）和高电导率（EC）的高性能 Cu-Ti 合金。研究利用基于多体系铜合金大数据集训练的预训练模型，将其知识迁移至仅含 40 个样本的目标 Cu-Ti 体系，开发了两种迁移学习策略：第一层冻结（TL1）和逐层解冻（TL2）。针对Cu-Ti 数据集，TL1 在训练过程中仅冻结第一个隐藏层，TL2则采用渐进式逐层解冻方法。Cu-Ti 合金的 TL2 模型实现了卓越的预测精度（UTS 模型：R²=0.96，EC 模型：R²=0.93），显著优于R²<0.77 的传统机器学习模型。优化后的 TL2 模型指导贝叶斯优化驱动的主动学习逆向设计，仅通过三次迭代便快速识别出最优合金 ——Cu-4Ti-0.3Fe-0.2Cr（CTFC）。实验验证表明，CTFC 合金具有优异性能：UTS=1107MPa（预测误差 1.8%），EC=20.8% IACS（预测误差 2.8%）。微观结构分析显示，纳米析出相 β'-Cu₄Ti、Fe₂Ti 和 Cr 的协同析出同时提升了合金的强度和电导率。该机器学习框架为数据受限条件下高性能材料的设计提供了高效途径。

【全文链接】

https://doi.org/10.1016/j.matdes.2025.115055

【亮点】

（1）分层解冻迁移学习模型仅用 40 个样本，对铜钛合金性能的预测决定系数（R²）即达 0.93 以上

（2）贝叶斯优化通过 3 轮主动学习迭代，筛选出铜钛铁铬（CTFC）系合金的最优成分为 Cu-4Ti-0.3Fe-0.2Cr

（3）该铜钛铁铬合金借助位错 / 析出相双强化机制，实现 1107MPa 的抗拉强度（UTS）和20.8% 国际退火铜标准的导电率（EC）

【背景】

弹性铜合金广泛应用于弹性元件和导电元件领域，包括载流弹性部件、开关、连接器和端子部件等。极限抗拉强度（UTS）超过 1GPa 的高弹性铜合金主要包括 Cu-Be、Cu-Ti 和Cu-Ni-Sn 合金体系。在这些弹性铜合金中，Cu-Be 合金因铍的毒性和加工难题面临严格限制，Cu-Ni-Sn 合金则存在原材料成本高的问题。Cu-Ti 合金综合性能优异，具有环境友好和原材料成本低的优势，应用前景广阔。

随着信息化、自动化和智能化的加速发展，对弹性铜合金的力学性能和电导率提出了更高要求。然而，Cu-Ti 合金通常表现出较低的电导率，尤其是当极限抗拉强度超过 1GPa 时。研究人员通过元素添加和工艺优化来同时提升 Cu-Ti 合金的力学性能和导电性能。研究表明，在 Cu-Ti 合金体系中，少量添加 Fe 可协同提升强度和电导率，但过量 Fe 会导致力学性能显著恶化；Ni、Al、Mg 等元素可提高电导率但会损害力学性能；Zr、Cr 等元素可强化合金但会降低其导电性。另一方面，固溶处理温度 / 时间、冷轧压下量、时效温度 / 时间等工艺参数对力学性能和电导率存在耦合影响。在大设计空间内同时优化多种合金元素和工艺参数，可协同改善 Cu-Ti 合金的力学性能和电导率。目前，耗时耗力的试错实验方法已无法满足 Cu-Ti合金快速精准设计的需求。

数据驱动方法利用实验 / 模拟数据集和机器学习（ML），在加速新型金属材料开发方面展现出巨大潜力，包括高熵合金、钛合金、形状记忆合金等领域。上述研究主要采用传统机器学习模型，其精度严重依赖大数据集。然而，对于 Cu-Ti 合金这类研究较少、可用数据有限的材料，训练用于合金设计的机器学习模型也需要谨慎考虑。迁移学习（TL）技术是指利用解决一个问题所获得的知识，来改进相关但不同任务的性能。作为机器学习方法的一个分支，迁移学习技术可使在大数据集上训练的模型适配并应用于数据有限的另一任务。通过使用预训练模型并在新任务上进行微调，迁移学习有助于提升模型性能，减少对大量数据收集的需求。

迁移学习方法已应用于新型金属合金的开发或其他材料科学应用。研究人员提出一种迁移学习框架，将 1053 组商用 AA7xxx 合金的工艺 - 性能数据迁移至 E2 铝合金，高效设计了三阶段固溶 - 时效处理工艺，打破了传统的强度 - 塑性权衡，实现了 767MPa 的峰值强度和 13.4% 的伸长率。研究人员提出一种方法，将预训练卷积神经网络（CNNs）的知识迁移应用于高温钛合金的预测，该卷积神经网络最初在 Fe 基、Ni 基和 Co 基高温合金的大数据集（753个样本）上训练，用于改进小数据集（88 个样本）高温钛合金的预测性能。他们的方法包括冻结预训练模型的卷积层和全连接层，并引入新的全连接层来预测材料性能。虽然该策略可以提升预测性能，但用于大规模数据预测时，作为评估预测精度关键参数的决定系数（R²）在某些情况下可能低于 0.8。在迁移学习中，卷积层中的知识通常被视为通用知识，而全连接层负责整合卷积层提取的特征并进行特定任务训练。这表明，在新任务上应用精心设计的微调迁移学习模型策略，对决定预测性能至关重要。

本研究通过将迁移学习模型与贝叶斯优化和主动学习相结合，提出了一种实现 UTS 和 EC 均衡提升的Cu-Ti 合金逆向设计框架。首先评估了数据稀缺条件下不同传统机器学习模型预测 Cu-Ti 合金成分 / 工艺 - 性能关系的性能。为解决预测精度有限的问题，通过微调预训练模型的隐藏层（最初在 Cu-Ti、Cu-Fe、Cu-Ni、Cu-Cr 和 Cu-Zr 合金的大数据集上训练），提出了两种迁移学习策略，实现跨体系知识迁移。然后，将性能更优的迁移学习模型与贝叶斯优化和主动学习相结合，在设计空间内搜索最优的 Cu-Ti 合金成分和工艺参数。最后，通过力学测试和微观结构表征等实验验证，证明了数据稀缺下迁移学习驱动逆向设计策略的效率。该方法显著加速了高性能 Cu-Ti 合金的发现，同时最大限度地减少了对大量实验数据集的依赖。

【图文】

图 1 展示了本研究采用的 Cu-Ti 合金设计框架，包括四个主要部分：数据收集、机器学习模型建立、合金逆向设计和实验验证，共同构成主动学习迭代循环。

2.1 数据收集

基于文献收集的数据建立的数据集包含 Cu-Ti、Cu-Fe、Cu-Ni、Cu-Cr 和 Cu-Zr 合金的相关信息，每条数据均包括合金成分、热机械加工（TMP）参数和合金性能，用于建立 Cu-Ti 合金的成分 / 热机械加工参数 - 性能关系。数据集中的合金均采用相同的加工路线制备：铸造、固溶处理、冷轧和时效。热机械加工参数包括固溶处理温度和时间、冷轧变形量（%）以及时效温度和时间。评估的力学性能为极限抗拉强度（UTS）和电导率（EC）。材料成分和热机械加工参数用作机器学习模型的输入特征，UTS 和 EC 为目标输出。整合后的数据集在不同合金体系间存在固有不平衡。为减轻特征尺度偏差的潜在影响，在模型训练前对所有特征进行 Z 分数标准化预处理，防止模型受特定体系数值大小的主导，从而提高模型的泛化能力。

该数据集包含 40 组 Cu-Ti 合金数据和120 组其他铜合金体系数据（补充材料）。图 2 展示了多体系铜合金数据集的散点图。

2.2 机器学习模型建立

2.2.1传统机器学习方法

为建立 Cu-Ti 合金成分 / 热机械加工参数与性能之间的关系模型，最初仅使用 Cu-Ti 合金数据评估了六种经典机器学习算法，包括支持向量回归（SVR）、岭回归、随机森林回归（RF）、k 近邻（KNN）、梯度提升回归（GBR）和套索回归。所有传统机器学习模型均采用网格搜索结合 5 折交叉验证进行严格优化，以确保公平比较。每种模型的超参数搜索空间如下：SVR：核函数（线性、径向基函数）、C（[1,10,100,1000,10000]）、伽马（[1,10,100,1000,10000]）；RF：决策树数量（[50,100,200,300,400,500]）、最大深度（[3,5,7,9,11,13]）；GBR：决策树数量（[50,100,200,300,400,500]）、最大深度（[3,5,7,9,11,13]）；KNN：邻居数量（[3,5,7,9,11,13]）、权重（[均匀、距离]）；岭回归 / 套索回归：阿尔法（[0.001,0.01,0.1,1,10,100]）。以决定系数（R²）作为预测精度的主要评价指标，R² 衡量模型预测值解释实验值方差的比例，定义为：

R²=1−∑ₙ(yₙ−ŷₙ)²/∑ₙ(yₙ−ȳₙ)²

其中，ŷₙ为预测值，yₙ为实验值，ȳ为实验值的平均值，n 为样本总数。R² 的取值范围为0-1，值越高表明模型性能越好。

2.2.2迁移学习方法

为进一步提升 Cu-Ti 合金模型的性能，采用迁移学习策略，利用在多体系铜合金数据上训练的预训练模型所捕获的通用知识，将其迁移至专门针对 Cu-Ti 合金数据训练的模型中。迁移学习方法采用多层感知器（MLP）作为基础算法。

虽然多层感知器的隐藏层具有相同的物理结构 —— 每个神经元执行加权求和、偏置加法和激活函数变换，但根据深度不同，其功能作用和学习到的特征表现出不同的物理意义。浅层通常捕获输入数据的基本、低级特征，而深层则逐步抽象和组合这些基础特征，以学习更复杂、专门的表示。这种分层特征提取类似于感知系统，理解是从通用特征到特定特征逐步构建的。因此，对预训练模型的隐藏层实施两种不同的微调策略以优化 Cu-Ti 合金模型，如图 3 所示：

（1）迁移学习方法 1（TL1 模型 —— 第一层冻结）：在 Cu-Ti 数据集上进行迭代训练时，仅冻结预训练模型的第一个隐藏层。该策略保留了从所有收集的铜合金数据中学习到的基本特征提取能力，同时允许后续层专门适应 Cu-Ti 体系的特征。

（2）迁移学习方法 2（TL2 模型 —— 逐层解冻）：训练开始时冻结所有隐藏层，最初仅解冻第二个隐藏层在 Cu-Ti 数据上进行训练，随后在连续的训练迭代中逐渐解冻更多层。这种渐进式方法有助于更深入地适应 Cu-Ti 数据的复杂性，同时系统地利用预训练模型的知识，增强了适应过程中的灵活性，并可能减轻过拟合。

两种迁移学习模型的性能也采用决定系数（R²）进行评估。

模型训练前，对数据集进行标准化处理，以归一化特征分布并消除尺度差异。然后将数据分为 80% 的训练集和 20% 的测试集，以评估模型的泛化能力。为最大限度地减少随机分割带来的变异性并系统地确定最优超参数，采用网格搜索结合 5 折交叉验证。

2.3 合金逆向设计

为在设计空间内确定最优成分和热机械加工参数，采用与先前研究类似的贝叶斯优化策略。通过 100 次独立建模迭代构建 UTS 和EC 的概率代理模型，每次迭代使用 Cu-Ti 训练数据的随机80% 子样本。对于从收集的合金数据插值得到的每个候选合金，计算这些 100 次预测的平均预测性能（UTS 为 μ₁，EC 为 μ₂）及其相应的标准差（UTS 为 σ₁，EC 为 σ₂）。每个候选合金的期望改进（EI）可通过以下公式计算：

EI_U TS=σ₁[φ(z₁)+z₁Φ(z₁)]（2）

EI_EC=σ₂[φ(z₂)+z₂Φ(z₂)]（3）

其中，φ(z) 和 Φ(z) 分别表示标准正态概率密度函数（PDF）和累积分布函数（CDF），z=(μ−μ*)/σ，μ* 代表当前最佳（基准）性能值。为平衡 UTS 和 EC 这两个相互冲突的目标，采用多目标期望改进（MOEI）函数，定义如下：

MOEI=EI_UTS×EI_EC（4）

如相关研究所示，当此类多目标期望改进公式用于贝叶斯优化时，适用于设计同时具有改进 UTS 和 EC 的 Cu-Ti 合金。多目标期望改进值最大的候选合金被认为具有最优的综合性能，因此采用这种多目标优化策略进行逆向设计。

2.4 实验验证

根据逆向设计结果，在氩气氛围下使用真空感应熔炼炉制备 Cu-Ti 合金。原材料包括工业纯铜、钛、钴、铬和铁，纯度均超过 99.9%。随后，在相应的热机械加工参数下对合金进行加工，并评估加工后样品的力学性能和电导率。采用电火花加工（EDM）从板材上切割出标距长度为 10mm、横截面为 2.5mm×1.2mm 的狗骨形拉伸试样。在螺杆驱动的 SUNS UTM 5105 试验机上以 0.5mm/min 的横梁速度进行单轴拉伸试验。使用 D60k 数字涡流金属导电率仪评估电导率。采用 Cu Kα 辐射，在 40kV 下进行 X 射线衍射（XRD）分析，在 2θ 范围为 20°-100° 内获取衍射图谱，步长为 0.013°，每步停留时间为 40.8s。透射电子显微镜（TEM）观察样品经机械研磨后，采用氩离子铣削减薄。所有透射电子显微镜观察均在 FEI Talos F200S 电子显微镜上进行，加速电压为 200kV，配备高角环形暗场（HAADF）探测器和能量色散 X 射线光谱（EDS）系统。

2.5 主动学习循环

将逆向设计的成分、热机械加工参数和性能测试结果纳入初始 Cu-Ti 合金数据集，重新训练 UTS 和 EC 的 TL2 模型预测模型。随后计算多目标期望改进值，指导下一轮合金成分 / 工艺设计和实验验证。建立闭环优化框架，持续迭代直至逆向设计合金的实测综合性能开始下降。

图 1. 基于迁移学习的 Cu-Ti 合金设计主动学习框架。

图 2. 所建立数据集中多体系铜合金的性能分布。

图 3. 迁移学习微调策略：(a) 第一层冻结；(b) 逐层解冻。

图 4. 传统机器学习模型性能：(a1)-(f1) 极限抗拉强度（UTS）；(a2)-(f2) 电导率（EC）。

图 5. 预训练模型性能评估：(a) 极限抗拉强度（UTS）；(b) 电导率（EC）；(c) 极限抗拉强度（UTS）和电导率（EC）的交叉验证结果。

图 6. 直接迁移学习模型性能评估：(a) 极限抗拉强度（UTS）；(b) 电导率（EC）。

图 7. TL1 和 TL2 模型性能评估：(a1)-(b1) 极限抗拉强度（UTS）；(a2)-(b2) 电导率（EC）。

图 8. 不同机器学习模型的预测性能比较：(a) 极限抗拉强度（UTS）；(b) 电导率（EC）。

图 9. 原始建立数据集与主动设计合金的性能分布比较。

图 10. CTFC 合金的透射电子显微镜（TEM）微观结构表征和分析：(a) 纳米析出相的高分辨透射电子显微镜（HRTEM）图像；(b) 高角环形暗场 - 扫描透射电子显微镜（HAADF-STEM）图像及相应的能量色散 X 射线光谱（EDS）元素图谱；(c) 析出相的定量尺寸分布；(d) 具有致密缠结的位错网络。

图 11. CTFC 合金的 X 射线衍射（XRD）图谱和威廉姆森 - 霍尔线性拟合结果。

【结论】

本研究成功开发了一种基于迁移学习的主动学习策略，克服数据稀缺问题，加速高性能 Cu-Ti 合金的逆向设计，结论如下：

（1）通过利用来自多体系铜合金数据集（Cu-Ti、Cu-Ni、Cu-Fe、Cu-Cr、Cu-Zr）预训练获得的知识，迁移学习框架相比仅在有限 Cu-Ti 数据上训练的传统机器学习模型表现出更好的性能。关键的是，渐进式逐层解冻微调策略（TL2）实现了卓越的极限抗拉强度（UTS）（R²=0.96）和电导率（EC）（R²=0.93）预测精度。

（2）将优化后的 TL2 模型与贝叶斯优化和主动学习循环相结合，逆向设计合金成分和热机械加工参数。仅通过三次迭代，该框架便识别出最优的 Cu-4Ti-0.3Fe-0.2Cr（CTFC）合金，其加工工艺为固溶处理（1173K/2.5h）、冷轧（90%）和时效（773K/12h）。实验验证表明，CTFC 合金具有优异性能：1107MPa 的极限抗拉强度（UTS）和 20.8% IACS 的电导率（EC）。这些实测值与预测值高度吻合，极限抗拉强度（UTS）和电导率（EC）的误差分别仅为1.8% 和 2.8%。

（3）微观结构分析表明，CTFC 合金的优异性能源于协同强化机制：致密的纳米级 β'-Cu₄Ti 析出相、Fe₂Ti 析出相、Cr 析出相，以及冷轧保留的高位错密度。纳米级 β'-Cu₄Ti、Fe₂Ti 和 Cr 析出相协同提升强度和电导率，高密度位错网络提供补充强化。析出强化和位错强化共同实现了强度和电导率的平衡。