上海光機所高功率激光物理聯(lián)合實驗室前沿部在利用深度強化學習實現(xiàn)激光種子源鎖模狀態(tài)搜索研究上取得重要進展,相關(guān)成果以“Deep reinforcement with spectrum series learning control for a mode-locked fiber laser”為題發(fā)表在Photonics Research。
針對高功率激光器光纖鎖模種子源穩(wěn)定鎖模狀態(tài)搜索的問題,提出了一種算法,可有效搜索耗散孤子鎖模激光器(圖1)的鎖模狀態(tài)并完成不同運行狀態(tài)之間的切換(圖2)。該算法結(jié)合了時間序列深度強化學習和長短時記憶網(wǎng)絡(luò)。數(shù)值模擬表明,激光腔的動態(tài)特征可以從光譜序列中獲得,與傳統(tǒng)的進化搜索算法相比,該模型大大提高了鎖模搜索的效率。在實驗中,所提出的算法平均只用了690ms即可獲得穩(wěn)定的鎖模狀態(tài),搜索次數(shù)比傳統(tǒng)方法少一個數(shù)量級,也是目前報道搜索次數(shù)最少的方法(圖3)。在16°C–30°C溫度環(huán)境下,該方法平均只需18次搜索就可以獲得穩(wěn)定的鎖模狀態(tài),極大地提高了激光器在復(fù)雜環(huán)境下的適應(yīng)能力。
該方法是無模型的,因此不僅可以用于鎖模狀態(tài)的搜索,還可以獲得特殊時間-光譜特性的鎖模動力學模式,在激光時空精確調(diào)控等方面有潛在應(yīng)用前景,受到國內(nèi)外同行的關(guān)注。
相關(guān)研究得到了中科院先導專項A類子課題的資助。
圖1 耗散孤子鎖模激光器
圖2 時間序列深度強化學習算法模型
圖3 隨機初始狀態(tài)鎖模搜索結(jié)果
轉(zhuǎn)載請注明出處。