利用NVIDIA多進程服務提升分子動力學模擬效率


NVIDIA的多進程服務(MPS)優化了分子動力學(MD)模擬中的GPU使用,通過允許多個模擬在同一GPU上並行運行,提升了吞吐量。 MPS減少上下文切換開銷,增加GPU利用率,支持並發內核執行。用戶通過OpenMM可以啟動多個模擬腳本以提高整體性能,儘管單個模擬速度可能較慢。基準測試顯示,MPS在不同系統中顯著提高吞吐量,尤其是在高端GPU上。設置cuda_mps_active_thread_percentage環境變量可以進一步優化吞吐量。 MPS是增強MD模擬性能的有效工具。


Alvin Lang Jun 04,2025 15:44

NVIDIA的多進程服務優化了分子動力學模擬中的GPU用法,從而通過在單個GPU上運行並發過程來增強吞吐量。

通過NVIDIA的多進程服務增強分子動力學

分子動力學(MD)模擬,對於隨著時間的推移建模Atom相互作用所必需的,需要大量的計算資源。儘管如此,許多模擬涉及小型系統大小,通常不足以現代GPU。 NVIDIA稱,NVIDIA的多進程服務(MPS)通過允許多個模擬在同一GPU上同時運行,從而最大程度地提高GPU利用率並改善吞吐量,從而提供了解決方案。

了解國會議員

國會議員是CUDA API的二進制兼容實現,可促進通過多個過程進行有效的GPU共享。它通過允許所有流程共享計劃資源來減少上下文開關開銷,並改善了整體GPU利用率。由於NVIDIA VOLTA GPU生成,MPS還支持來自不同過程的並發內核執行,從而在單個過程無法完全飽和GPU時提高性能。值得注意的是,MP可以使用常規用戶特權啟動,從而簡化其部署。

用OpenMM實施MPS

為了利用流行的MD引擎的OpenMM中的MPS,用戶可以同時運行多個模擬。這是通過啟動模擬腳本作為單獨過程的幾個實例來完成的。儘管單個模擬可能會放慢速度,但由於並行執行,總體吞吐量會增加。簡單的命令結構使用戶可以控制GPU定位和過程管理,從而提高資源分配效率。

基準性能

基準測試顯示,將MPS應用於不同大小的系統時,會顯示出明顯的吞吐量改進。例如,具有23,000個Atom的DHFR系統受益於大量性能的提升,尤其是在Nvidia H100張量芯等高端GPU上。甚至更大的系統,例如具有409,000個Atom的纖維素基準,吞吐量增加了約20%。

用cuda_mps_active_thread_percentage優化吞吐量

默認情況下,MPS允許全GPU資源訪問所有進程。但是,設置cuda_mps_active_thread_percentage環境變量可以通過限制每個過程的線程可用性來進一步優化吞吐量。這種調整已顯示出可顯著提高集體吞吐量,尤其是在涉及多個並發過程的模擬中。

在自由能計算中應用

國會議員在自由能擾動(FEP)模擬中也有優勢,該模擬依賴於復制– 交易所分子動力學。通過同時在不同的λ窗口上運行多個模擬,MPS減輕了GPU的未利用,從而在NVIDIA的L40S或H100 GPU上使用三個MPS過程時,導致36%的吞吐量增加。

結論

NVIDIA的MPS是通過最少的編碼工作來增強MD模擬吞吐量的寶貴工具。通過優化GPU資源利用,MPS可以顯著提高各種模擬方案的性能。對於有興趣進一步探索這些功能的人,NVIDIA提供了其他資源和教程來支持實施和實驗。

圖像來源:Shutterstock

資訊來源:由0x資訊編譯自BLOCKCHAINNEWS。版權歸作者所有,未經許可,不得轉載

Total
0
Shares
Related Posts