关键词:
机器学习
钙钛矿太阳能电池
光电转化效率
SHAP
遗传算法
摘要:
作为第三代光伏技术的核心代表,钙钛矿太阳能电池(Perovskite Solar Cells,PSCs)凭借其高光电转换效率(Power Conversion Efficiency,PCE)、低制备成本及优异柔性特征,在能源结构转型中发挥重要作用。然而传统实验与理论计算的研究范式受限于高试错成本与长研发周期,难以满足当前技术迭代需求。随着大数据技术和人工智能技术的发展,大数据驱动的第四研究范式成为了钙钛矿与PSCs研究的新翘楚。因此,采用机器学习(Machine Learning,ML)方法,对钙钛矿和PSCs进行研究,发掘钙钛矿与PSCs结构与性质之间潜在的关联关系,进一步为实验和理论计算提供依据和指导。本研究对于促进钙钛矿和PSCs的研究发展,以及计算机学科与材料学科的结合应用发展有重大意义。
本文基于*** Jacobsson等人所建立的PSCs实验数据库(含42400+器件样本),创新性地建立了数据驱动的钙钛矿与PSCs研究新体系,基于该体系初步实现了三维、二维及准二维钙钛矿体系的PCE预测与器件性能优化,主要研究成果包括:
(1)多模态特征工程框架:针对数据多模态特征与数据信息缺失的问题,构建钙钛矿多模态特征工程框架。通过建立分类-描述型文本分层处理策略处理器件参数中存在的文本型特征,分别采用One-Hot编码与Word2Vec词向量嵌入技术实现特征空间重构。通过ML算法对重要数据进行补全,有效解决数据缺失问题。进一步,基于处理后的全量数据,采用多模型评估方法验证构建特征与PSCs物理机制的关系,证明了特征及数据处理方法的有效性。
(2)三维PSCs器件逆向设计优化:基于三维PSCs原始数据,利用优化后的极限梯度提升算法(EXtreme Gradient Boosting,XGB),结合Shapley验证构建加性解释(Shapley Additive ex Planations,SHAP)分析获取的启发式条件和词增量技术,获取的词增量空间,进一步融合遗传算法(Genetic Algorithm,GA)实现器件参数逆向设计。在指定种群条件保证种群多样性的前提下,通过自适应参数优化策略,实现了模型的快速收敛与稳定性,基于该模型获得PCE达23.38%的优化构型。
(3)基于迁移学习的二维和准二维PSCs体系结构设计:针对二维和准二维PSCs体系数据量少的问题,基于三维PSCs模型结合迁移学习方法,进一步揭示数据中潜在的新机制,经GA优化后,迁移模型在初始种群质量薄弱的条件下,获得了PCE达18.65%的稳定构型。
本研究成功构建了ML驱动的钙钛矿光伏材料研发新范式,其方法论框架对新型能源材料的智能化开发具有重要参考价值,为交叉学科研究提供了创新性技术路径。