近日,我院劉萬強教授課題組在基于機器學習預測有機太陽能受體材料分子的能量轉換效率方面取得進展,相關研究成果以“Predicting power conversion efficiency of binary organic solar cells based on Y6 acceptor by machine learning”為題,發表在國際頂級期刊《Journal of Energy Chemistry》(TOP,中科院一區,IF: 13.1)。該文是繼“Theoretical exploration of molecular packing and the charge transfer mechanism of organic solar cells based on PM6:Y6”一文在頂級期刊《Journal of Materials Chemistry A》(TOP,IF:14.51,中科院二區)發表以來的進一步研究成果。
Y6受體因其強吸收、窄帶隙和優異的電子遷移率,已成為裡程碑式的高性能有機太陽能電池(OSCs)受體材料之一。設計和合成與Y6匹配的供體分子來制備高性能OSCs器件是一種很有前景的策略。然而,基于傳統實驗-試錯方法的供體分子的設計和合成往往是複雜的,且實驗消耗十分昂貴。快速和低成本的機器學習(ML)可以有效地從數據學習并建立預測的模型。與耗時的實驗-試錯方法相比,機器學習在光伏材料設計中的應用有望極大促進高性能材料的發現。
課題組收集了近4年來基于Y6受體的PCE數據(圖1所示),優化每種材料分子的結構,并計算了每個分子4000多個分子特征描述符。

|
圖1基于Y6受體的二元OSCs分布直方圖。(a)小分子供體,(b)聚合物供體。 |
如圖2所示,對于4000多個特征,經過預處理并用于構建機器學習預測模型。

|
圖2根據特征重要性篩選特征的工作流程。 |
根據以上策略篩選的特征用于構建以下6種ML模型:GBRT、随機森林(RF)、極限梯度增強(XGBoost)、自适應增強(AdaBoost)、支持向量回歸(SVR)和多元性性回歸(MLR)。
模型的訓練和預測結果如圖3和4所示。其中,GBRT模型體現了較低的RMSE和較高的r值,表明GBRT模型在預測器件性能方面具有較高的準确性和可靠性。

|
圖4 基于小分子供體的機器學習預測值與實驗值進行比較。(a) GBRT,(b) RF,(c) XGBoost,(d) AdaBoost,(e) SVR和(f) MLR。對角線表示完全正相關(r = 1)。 |

|
圖4基于聚合物供體的機器學習預測結果值與實驗值進行比較。(a) GBRT,(b) RF,(c) XGBoost,(d) AdaBoost,(e) SVR和(f) MLR。對角線表示完全正相關(r = 1)。 |
為了解釋特征對預測PCE的影響,課題組對GBRT模型進行了SHAP分析,如圖5所示。 |
圖5GBRT模型的SHAP分析。(a) (b) 基于小分子供體;(c) (d) 基于聚合物供體。 |
為了驗證模型的預測能力,在模型構建後又收集了10多個供體的新數據,并進行了預測。如表1所示。結果表明,這些模型的預測PCE與實驗PCE具有較好的一緻性,特别是GBRT模型的MAE值最小,且表現非常一緻。這證明了這些模型具有良好的預測能力和魯棒性。
這項工作提供了一個使用ML預測OSCs能量轉換效率的策略,即使用ML算法挖掘了基于Y6的OSCs的PCE和供體分子結構描述符之間的複雜關系。這些模型可以為發現基于Y6受體的OSCs供體材料提供合理的預測。該工作為供體分子的快速預測和篩選提供了一種新策略,有望設計和篩選出高性能的供體材料分子。
文章信息:
Predicting power conversion efficiency of binary organic solar cells based on Y6 acceptor by machine learning
Journal of Energy Chemistry
DOI: 10.1016/j.jechem.2023.03.030
聯系方式:wanqiangliu@hnust.edu.cn