C#.NET dump解析入門-用VS解析dump文件進(jìn)行排障
當(dāng)前位置:點晴教程→知識管理交流
→『 技術(shù)文檔交流 』
突然有一天部署在服務(wù)器的一個應(yīng)用掛掉了,沒辦法只能進(jìn)入服務(wù)器打開
【事件查看器】查看下,好不容易找到了打開后一臉懵逼
事件查看器查到的內(nèi)容根本對我們排障沒有任何作用。 在這個時候如果有對應(yīng)的dump文件就能派上用場了, 只要有dump文件就能查到應(yīng)用掛掉那刻的一手情報,可能有人認(rèn)為分析dump文件是非常難的事情, 但是最近不斷有新的dump分析工具出來,例如用vs2017就能夠很簡單的分析dump文件。 接下來我們用幾個實際的例子來看看如何用vs2017來分析dump文件吧
dump文件的收集 應(yīng)用掛是一瞬間的事情,掛了之后就沒辦法生成dump文件了。所以首先要設(shè)置一下自動生成dump文件。 打開注冊表HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\Windows Error Reporting
在Windows Error Reporting下新建一個 LocalDumps文件夾 然后在這項里面新增 DumpCount DumpFolder DumpType 這三項
演示stackoverflow錯誤導(dǎo)致的crash 我們有創(chuàng)建一個簡單的console程序 class Program { static void HogeHoge(string s) { HogeHoge(s); } static void Main(string[] args) { HogeHoge("hoge-"); } }
編譯成exe 后運行 毫無疑問會出現(xiàn)如下錯誤
查看下dump文件果然生成了
那我們分析下這個dump文件,用VS2017打開它,會出現(xiàn)它的概要信息
你會發(fā)現(xiàn)異常信息處寫了 【該線程已用完其堆棧】就可以很明顯看出來是stackoverflow。 而且看右側(cè)【操作】處 有[使用 僅限托管 進(jìn)行調(diào)試] 和 [使用 混合 進(jìn)行調(diào)試] 和 [使用 僅限本機(jī) 進(jìn)行調(diào)試] 這里牽扯出3個名詞 托管 ======> 適用于在公共語言運行時下運行的代碼 所謂托管是指內(nèi)存管理由系統(tǒng)而不是由程序員管理 大家都知道c#有關(guān)內(nèi)存都是CLR來管理的 混合 ======>對托管代碼和非托管代碼都調(diào)用調(diào)試器 本機(jī) ======>適用于非托管代碼 如果你的代碼里面沒有調(diào)用非托管代碼的話 點擊 前面2個按鈕都可以的
點擊后會直接進(jìn)入
這樣錯誤源碼級別看的非常清楚了。因為是我們本機(jī)創(chuàng)建的工程 pdb 和 源碼都有。所以才能直接定位到。但是實際上crash都是發(fā)生在服務(wù)器上,把服務(wù)器上的dump文件打開的話還會是這樣嗎 下面我們來做一個模擬 用Relase編譯 然后把 Program.cs文件也給刪除掉。然后重新執(zhí)行crash生成dump文件 然后用同樣的步驟vs打開點擊調(diào)試就會提示找不到 Program.cs
這樣一來可供我們排障的情報就少了很多。在這種情況下 我們可以利用vs 提供的幾個窗口來觀察 分別是以下三個
第一個窗口:線程窗口
實際的程序往往有很多線程在運行,每個線程的切換等重要信息可以在這個窗口進(jìn)行觀察。
第二個窗口:調(diào)用堆棧窗口
調(diào)用堆棧窗口是和線程窗口聯(lián)動的。
第三個窗口也是最重要的窗口:并行堆棧
如圖所示,每個線程和它的堆棧內(nèi)容展示的很清楚。只不過本例子是比較簡單的,即使不看這個看前2個窗口就能知道原因了。 但是實際的應(yīng)用若超過運行上百個線程的話,將這些線程用圖形可視化出來對于我們排查復(fù)雜問題是非常有用的!
CPU100和死鎖導(dǎo)致的crash解析 由于系統(tǒng)可以配置crash自動生成dump文件。但是有些情況比如部署在iis上web服務(wù)cpu飆到100%下不來導(dǎo)致為web停止服務(wù)。這個時候就需要我們手動提取dump文件了。 下面我們來模擬一下這種場景: 新建一個asp.net mvc程序 public class HomeController : Controller { async Task<string> GetAsync() { var str = await new HttpClient().GetStringAsync("http://www.baidu.com/"); return str; } public ActionResult Index() { var s = GetAsync().Result; return View(); } }
以上代碼 async/await會造成死鎖 我們用iis來啟動這個web應(yīng)用后頁面圈圈一直在轉(zhuǎn)網(wǎng)頁空白一片 打開Windows任務(wù)管理器找到w3wp
用vs打開這個dump文件 點擊調(diào)試后后 打開并行堆棧這個窗口
大家看會有很多分支,該從哪個開始分析呢,教大家一個小技巧,不知道如何下手的時候就選分支越長的!
從HomeController.Index進(jìn)來,停止在ManualResetEventSlim.Wait 死鎖原因:
該文章在 2024/11/19 9:13:02 編輯過 |
關(guān)鍵字查詢
相關(guān)文章
正在查詢... |