GPU 驅(qū)動(dòng)漏洞:窺探驅(qū)動(dòng)漏洞利用的技術(shù)奧秘
當(dāng)前位置:點(diǎn)晴教程→知識(shí)管理交流
→『 技術(shù)文檔交流 』
本文嘗試以 GPU 漏洞為引介紹圍繞 GPU 驅(qū)動(dòng)這一攻擊面,安全研究人員對(duì)內(nèi)核漏洞利用技術(shù)做的一些探索。 背景介紹目前移動(dòng) SOC 平臺(tái)上由多個(gè)硬件模塊組成,常見的硬件模塊有:CPU、GPU、Modem基帶處理器、ISP(圖像處理器)等,這些硬件模塊通過硬件總線互聯(lián),協(xié)同完成任務(wù)。 對(duì)于 GPU 驅(qū)動(dòng)漏洞研究來說,我們需要關(guān)注的一個(gè)關(guān)鍵特性是 GPU 和 CPU 共用同一塊 RAM。 在 CPU 側(cè)操作系統(tǒng)通過管理 CPU MMU 的頁表來實(shí)現(xiàn)虛擬地址到物理地址的映射 GPU 也有自己的 MMU,不過 GPU 的頁表由 CPU 內(nèi)核中的 GPU 驅(qū)動(dòng)管理,從而限制 GPU 能夠訪問的物理地址范圍。 在實(shí)際的業(yè)務(wù)使用中,一般是 CPU 側(cè)分配一段物理內(nèi)存,然后映射給 GPU , GPU 從共享內(nèi)存中取出數(shù)據(jù)完成計(jì)算、渲染后再將結(jié)果寫回共享內(nèi)存,從而完成 GPU 與 GPU 之間的交互。對(duì)于 GPU 驅(qū)動(dòng)安全研究來說,特殊的攻擊面在于由于其需要維護(hù) GPU 頁表,這個(gè)過程比較復(fù)雜,涉及到內(nèi)核中的各個(gè)模塊的配合,非常容易出現(xiàn)問題,歷史上也出現(xiàn)了多個(gè)由于 GPU 頁表管理失誤導(dǎo)致的安全漏洞 以 ARM Mali 驅(qū)動(dòng)為例,這幾年出現(xiàn)的幾個(gè)比較有代表性的漏洞如下:
? CVE-2021-28664先以最簡(jiǎn)單的漏洞開始講起,這個(gè)漏洞算是 Mali 第一個(gè)出名的漏洞了,同期出道的還有 CVE-2021-28664,這個(gè)漏洞是由 Project Zero 捕獲的在野利用,該漏洞的 Patch 如下
Patch 的關(guān)鍵點(diǎn)在于將 get_user_pages 參數(shù)中的
reg 的類型為 圖中的關(guān)鍵要素如下:
核心觀點(diǎn):驅(qū)動(dòng)利用 kbase_va_region 表示一組物理內(nèi)存,這組物理內(nèi)存可以被 CPU 上的用戶進(jìn)程和 GPU 分別映射,映射的權(quán)限由 reg->flags 字段控制. 回到漏洞本身,其調(diào)用路徑中的關(guān)鍵代碼如下:
漏洞在于傳遞 get_user_pages 參數(shù)是只考慮了 KBASE_REG_GPU_WR 情況,沒有考慮 KBASE_REG_CPU_WR,當(dāng) reg->flags 為 KBASE_REG_CPU_WR 時(shí) get_user_pages 的第三個(gè)參數(shù)為 0
get_user_pages 的作用的是根據(jù)用戶進(jìn)程提供的 va (start)遍歷進(jìn)程頁表,返回的是 va 對(duì)應(yīng)物理地址對(duì)應(yīng)的 page 結(jié)構(gòu)體指針,結(jié)果保存到 pages 數(shù)組中。
其中如果 gup_flags 為 1,表示獲取 va 對(duì)應(yīng) page 后會(huì)寫入 page 對(duì)應(yīng)的物理頁,然后在 get_user_pages 內(nèi)部需要對(duì)只讀頁面和 COW 頁面做額外處理,避免這些特殊 va 對(duì)應(yīng)的物理頁被修改導(dǎo)致非預(yù)期行為。
當(dāng) gup_flags 為 0 時(shí)則直接返回頁表遍歷的結(jié)果(P0) 對(duì)于這個(gè)漏洞而言,我們可以創(chuàng)建一個(gè) 這一原語要進(jìn)一步利用需要依賴操作系統(tǒng)的機(jī)制,首先介紹最簡(jiǎn)單的一種利用方式,Linux 內(nèi)核在處理磁盤中的文件系統(tǒng)時(shí),會(huì)對(duì)從磁盤中讀取的物理頁做緩存來加速文件訪問的性能,同時(shí)減少重復(fù)文件物理頁,減少開銷 如果所示:
具體來說,當(dāng)兩個(gè)進(jìn)程同時(shí)以只讀權(quán)限 mmap libc.so 文件時(shí),這兩個(gè)進(jìn)程的 VA 會(huì)指向同一個(gè)物理頁 這樣當(dāng)我們利用漏洞修改 Page Cache 中的物理頁后,其他進(jìn)程也會(huì)受到影響,因?yàn)槎际怯成涞耐粔K物理地址,因此攻擊思路就來了:
除了修改文件系統(tǒng)的 Page Cache 外,在 Android 平臺(tái)上還有一個(gè)非常好的目標(biāo),binder 驅(qū)動(dòng)會(huì)往用戶態(tài)進(jìn)程映射只讀 page,里面的數(shù)據(jù)結(jié)構(gòu)為 flat_binder_object,binder_transaction_buffer_release 里面會(huì)使用 flat_binder_object->handle,相關(guān)代碼如下: 首先通過 binder_get_node 查找 node,然后會(huì)調(diào)用 binder_put_node 減少 node 的引用計(jì)數(shù),當(dāng) node 引用為0時(shí)會(huì)釋放 node。 由于 flat_binder_object 所在物理頁用戶態(tài)無法修改,所以可以保證這個(gè)流程的正確性,當(dāng)我們只讀物理頁寫漏洞篡改 flat_binder_object->handle 指向另一個(gè) node 時(shí),觸發(fā) binder_transaction_buffer_release 就能導(dǎo)致 node 引用計(jì)數(shù)不平衡 最后可以將漏洞轉(zhuǎn)換為 binder_node 的UAF,然后采用 CVE-2019-2205 的利用方式進(jìn)行漏洞利用即可。 此外類似的漏洞在 2016 年就已經(jīng)出現(xiàn)在高通 GPU 驅(qū)動(dòng)中,CVE-2016-2067:
? CVE-2021-28663該漏洞是 Mali 驅(qū)動(dòng)在管理 GPU 物理頁映射時(shí)導(dǎo)致的物理頁 UAF 漏洞,為了能夠理解該漏洞,首先需要對(duì) Mali 驅(qū)動(dòng)的相關(guān)代碼有所了解,上節(jié)提到 Mali 使用 kbase_va_region 對(duì)象表示物理內(nèi)存資源,然后 CPU 用戶進(jìn)程 和 GPU 可以按需映射,對(duì)物理內(nèi)存進(jìn)行訪問。 kbase_va_region 的創(chuàng)建位于 kbase_api_mem_alloc 接口,其關(guān)鍵代碼如下:
對(duì)于 如果沒有設(shè)置
kbase_va_region 的釋放位于 kbase_api_mem_free 接口,其關(guān)鍵代碼如下:
這個(gè)的大體邏輯是先根據(jù) gpu_addr 找到 reg,然后釋放 reg 和 reg->xx_alloc 的引用,對(duì)于這種復(fù)雜的對(duì)象管理,可以先按照正常流程分析下對(duì)象之間的關(guān)系, kbase_va_region 中與生命周期相關(guān)的字段如下: 上圖表示的是 kbase_api_mem_alloc 創(chuàng)建非 SAME_VA 內(nèi)存的場(chǎng)景,kbase_gpu_mmap 執(zhí)行后會(huì)對(duì) gpu_mappings 加一,然后通過 kbase_api_mem_free 釋放時(shí),會(huì)將 kbase_va_region 和 kbase_mem_phy_alloc 的引用計(jì)數(shù)減成0,從而釋放兩個(gè)對(duì)象 如果是 SAME_VA 的情況如下,區(qū)別在于 SAME_VA 內(nèi)存在 kbase_api_mem_alloc 中會(huì)調(diào)用 vm_mmap 把 reg 同時(shí)映射到 CPU 和 GPU 側(cè),這就需要增加對(duì)應(yīng)的引用計(jì)數(shù)(va_refcnt、kref、gpu_mappings),然后在 munmap 進(jìn)程 VA 時(shí),減少對(duì)應(yīng)的引用計(jì)數(shù) 對(duì)驅(qū)動(dòng)的對(duì)象管理有大概的認(rèn)知后,具體看下漏洞相關(guān)的兩個(gè)接口 kbase_api_mem_alias 和 kbase_api_mem_flags_change,分別利用的功能:
kbase_api_mem_alias 的關(guān)鍵代碼如下:
主要是增加了 alloc 的引用計(jì)數(shù) (kref),然后將其放入 kctx->pending_regions,之后進(jìn)程再通過 mmap 完成 CPU 和 GPU 映射 (
創(chuàng)建別名映射進(jìn)程調(diào)用 mmap 前后, reg 對(duì)象相關(guān)引用情況如下: 在 kbase_api_mem_alias 里面增加 aliased[i]->kref 確保其在使用過程中不會(huì)被釋放,然后 kbase_mmap 映射內(nèi)存時(shí)增加 aliased[i]->gpu_mappings 記錄其被 GPU 映射的次數(shù),同時(shí)增加 reg->va_refcnt 記錄其被 CPU 映射的次數(shù),這個(gè)流程是沒有問題的,通過引用計(jì)數(shù)確保 aliased 中的對(duì)象不會(huì)釋放。 問題就出在 kbase_api_mem_flags_change 能在不釋放 alloc 時(shí)釋放其中的物理頁:
kbase_api_mem_flags_change 可以利用 kbase_mem_evictable_make 將 gpu_alloc 放到驅(qū)動(dòng)自己管理的鏈表中(
shrink 時(shí)釋放 kbase_mem_phy_alloc 物理頁的代碼:
kbase_mem_flags_change 在調(diào)用 kbase_mem_evictable_make 前會(huì)校驗(yàn) gpu_mappings ,大概意思是如果這個(gè) reg 被 GPU 多次映射了就不能執(zhí)行物理內(nèi)存釋放操作,但是回到 alias 的流程,在 kbase_api_mem_alias 結(jié)束后,aliased 數(shù)組中的 gpu_mappings 還是 1 此時(shí)調(diào)用 kbase_mem_flags_change 將 aliased[i] 放到 kctx->evict_list,此時(shí) alloc->pages 里面的值沒有變化 然后再調(diào)用 mmap 映射 kbase_mem_alias 創(chuàng)建的 reg 將 aliased[i] 中的物理頁(alloc->pages)映射到 GPU 側(cè),假設(shè)為映射的 VA 為 ALIAS_VA 最后觸發(fā) shrink 機(jī)制,釋放 aliased[i] 中的物理頁,之后 ALIAS_VA 還指向已經(jīng)釋放的物理頁,導(dǎo)致物理頁 UAF. 再次回顧漏洞根因,漏洞是驅(qū)動(dòng)在建立 別名映射時(shí)對(duì) gpu_mappings 的管理不當(dāng),結(jié)合 kbase_api_mem_flags_change 釋放物理頁的邏輯,達(dá)成物理頁 UAF,這種漏洞的挖掘個(gè)人理解需要先分析內(nèi)存對(duì)象(堆、物理內(nèi)存)的生命周期,然后組合各個(gè) API 的時(shí)序看是否會(huì)產(chǎn)生非預(yù)期行為,重點(diǎn)還是對(duì)象的釋放、申請(qǐng)、復(fù)制等邏輯。 物理頁 UAF 的漏洞利用技術(shù)目前已經(jīng)比較成熟,這里列幾個(gè)常用的方式:
? CVE-2022-46395前面兩個(gè)漏洞的利用路徑大概是:發(fā)現(xiàn)一個(gè)新漏洞,挖掘一種新漏洞利用方式完成利用,本節(jié)這個(gè)漏洞則是將漏洞轉(zhuǎn)換為 CVE-2021-28663 ,因?yàn)?28663 的能力確實(shí)太強(qiáng)大了,物理頁 UAF 的利用簡(jiǎn)單、直接,目前堆上的漏洞利用也逐步往物理頁UAF 轉(zhuǎn)換(Dirty Pagetable) 漏洞是一個(gè)條件競(jìng)爭(zhēng)漏洞,kbase_vmap_prot 后其他線程可以釋放 mapped_evt 對(duì)應(yīng)的物理頁
為了擴(kuò)大 race 的時(shí)間窗,作者利用 timerfd 時(shí)鐘中斷技術(shù)
大致思路就是在 kbase_vmap_prot 和 *mapped_evt 之間出發(fā)時(shí)鐘中斷,從而擴(kuò)大時(shí)間窗,在兩步之間釋放 mapped_evt 對(duì)應(yīng)的物理頁,就能夠達(dá)到物理頁 UAF 的能力。 mapped_evt 在頁內(nèi)的偏移可控,寫的內(nèi)容為 0 或者 1,總結(jié)下來漏洞的原語是物理內(nèi)存 UAF 寫,寫的值只能 0 或者 1
kbase_alloc_create 分配 kbase_mem_phy_alloc 時(shí)會(huì)調(diào)用 vzalloc 分配內(nèi)存,vzalloc 的邏輯是根據(jù)大小計(jì)算分配的物理頁數(shù)目,然后逐次調(diào)用 alloc_page 分配物理頁,利用這個(gè)邏輯可以比較快速的占位剛剛釋放的物理頁(slab cross cache 時(shí)間相對(duì)較長(zhǎng)) 根據(jù)之前的漏洞分析,我們知道 gpu_mappings 控制的物理頁的釋放,如果通過 UAF 將其修改為 0 或者 1,就能提前釋放一個(gè)被別名映射的 kbase_mem_phy_alloc 中的物理頁,導(dǎo)致物理頁UAF
實(shí)現(xiàn)無限制的物理頁 UAF 讀寫后,就是常規(guī)的漏洞利用流程了。這個(gè)漏洞利用的核心是利用 GPU 驅(qū)動(dòng)的物理內(nèi)存管理結(jié)構(gòu),將一個(gè)受限的 UAF 寫轉(zhuǎn)化為 不受限的 物理頁 UAF. ? 利用非GPU漏洞攻擊 GPU前面的案例都是利用 GPU 自身漏洞,這個(gè)案例則是將其他驅(qū)動(dòng)、模塊漏洞(攝像頭驅(qū)動(dòng)的 堆溢出漏洞) 的漏洞 轉(zhuǎn)換為 GPU 漏洞,進(jìn)而實(shí)現(xiàn)物理頁 UAF 漏洞,核心思路與 CVE-2022-46395 一致,就是篡改 kbase_mem_phy_alloc 的 gpu_mappings 為 0,構(gòu)造物理頁 UAF
一個(gè)比較有意思的點(diǎn)是研究員發(fā)現(xiàn)及時(shí)安卓?jī)?nèi)核啟用了 MTE,仍然有 50% 的概率能夠完成溢出而不被檢測(cè),且及時(shí) MTE 檢測(cè)到溢出,也不會(huì)導(dǎo)致內(nèi)核 Panic,只是殺掉用戶進(jìn)程,這樣就給了攻擊者無限嘗試的能力,相當(dāng)于 Bypass 了 MTE. 總結(jié)從 CVE-2021-28663/CVE-2021-28664 開始研究人員逐漸重視并投入到 GPU 驅(qū)動(dòng)安全領(lǐng)域,從一開始的挖掘 GPU 特有漏洞,到后面逐步將各種通用漏洞往 GPU 漏洞上轉(zhuǎn)換,核心原因在于 GPU 驅(qū)動(dòng)本身的能力太強(qiáng)大了,只要能夠控制 GPU硬件的頁表,就能實(shí)現(xiàn)任意物理頁的讀寫,而且由于是獨(dú)立的硬件,可以直接 Bypass 掉 CPU 側(cè)的安全特性(比如 KNOX、PAC、MTE),Patch 內(nèi)核代碼。 GPU 安全研究還帶來了另一個(gè)漏洞利用方向,GPU 驅(qū)動(dòng)由于要管理物理內(nèi)存,所以容易出現(xiàn)物理內(nèi)存 UAF,物理 UAF 的利用手段被發(fā)掘后,大家發(fā)現(xiàn)這個(gè)原語實(shí)在太強(qiáng)大了,后面涌現(xiàn)了很多將不同漏洞轉(zhuǎn)換為物理頁UAF的技術(shù),比如 Dirty Pagetable、USMA、 pipe_buffer->page 指針劫持等。 從 GPU 攻擊的路徑來看,也可以了解到一點(diǎn),即漏洞的修復(fù)并不代表漏洞生命的結(jié)束,如果一個(gè)漏洞的原語過于強(qiáng)大、好用,就可以考慮將其他漏洞往這上面轉(zhuǎn)換,從而復(fù)用歷史的漏洞利用經(jīng)驗(yàn)。 ? 參考鏈接
轉(zhuǎn)自博客園,作者h(yuǎn)ac425 該文章在 2024/12/16 9:37:05 編輯過 |
關(guān)鍵字查詢
相關(guān)文章
正在查詢... |