原標題:正式支持 JIT LTO,英偉達發布 CUDA 12.0 開發工具集更新
12 月 10 日消息:英偉達(NVIDIA)公司于近日發布了 CUDA 12.0 開發工具更新。本次更新帶來了非常多的改變,包括支持最新的 Hopper 和 Ada Lovelace GPU 架構、升級 C++ 方言(Dialects)、正式支持 JIT LTO、改善和引入新的 API 等等。
IT之家了解到,CUDA 12.0 主要功能介紹如下
CUDA 12.0 為 NVIDIA 的 Hopper 和 Ada Lovelace 架構提供可編程功能。CUDA 12 為 Hopper 和 Ada 架構提供了很多張量操作(tensor operation)選項,這些選項很多都支持公共 PTX 中間表示法。合作網格陣列(CGA)支持 C 內置函數,用于 SM 多投的編程式二級緩存,基因組學 / DPX 指令,以及其它新增功能。
支持對標記為 CUDA_VISIBLE_DEVICES 的 GPU 使用虛擬內存管理 API。
應用程序和庫開發人員可以以編程方式更新 CUDA 流的優先級。
改良后的 CUDA 動態平行化 API,與之前的 API 相比,性能有了 "實質性" 的提高。
現在通過 nvJitLink 庫正式支持即時鏈接優化(JIT LTO)。
支持 GCC 12.1 主機編譯器。
NVCC 和 NVRTC 對 C++20 方言的支持。
NVRTC 將其默認的 C++ 方言從 C++14 更新為 C++17.
更多關于 CUDA 12.0 變化的細節請參見發布說明。用戶和開發者可以從 developer.nvidia.com 下載適用于所有主要平臺的 CUDA 12.0.
來源:IT之家
IT時代網(關注微信公眾號ITtime2000,定時推送,互動有福利驚喜)所有原創文章版權所有,未經授權,轉載必究。
創客100創投基金成立于2015年,直通硅谷,專注于TMT領域早期項目投資。LP均來自政府、互聯網IT、傳媒知名企業和個人。創客100創投基金對IT、通信、互聯網、IP等有著自己獨特眼光和豐富的資源。決策快、投資快是創客100基金最顯著的特點。
小何
小何
小何
小何