自我監控分析與報告技術 代表自我監控、分析和報告技術。顧名思義,這是一種記錄硬碟(HDD)或固態硬碟(SSD)健康資料的工具。自我監控分析與報告技術 資料可以是寶貴的工具,如果硬碟出現問題或已達到其使用壽命,可以提前發出警告,以便在發生故障之前進行替代軟體。
輕鬆向使用者或系統管理員報告非常重要,因為硬碟本身無法對資料進行深入分析。只有當某些屬性超過預定的閾值,且只有在韌體中編程閾值時,硬碟才能報告。
自我監控分析與報告技術 已經存在多年,並早於 SSD 的誕生。自我監控分析與報告技術 最初在 HDD 上實施,當這項技術被發明為旋轉硬碟的插入式替代軟體時,就適用於 SSD。遺憾的是,無論儲存裝置技術如何,都沒有業界標準可以告訴您哪個編號的 自我監控分析與報告技術 屬性描述了硬碟的特定物理財產權。SSD 和 HDD 的屬性描述符會有所不同,甚至會因不同的 SSD 供應商而異。
有許多第三方公用程式可以擷取和報告硬碟的 自我監控分析與報告技術 資料,通常提供免費軟體和共享軟體。然而,除非第三方軟體供應商向硬碟供應商諮詢正確的 自我監控分析與報告技術 屬性,否則其定義和閾值(如適用)可能會誤貼屬性標籤,並可能導致偽陽性或偽陰性故障報告。
我們看到了「開機時間計數」屬性向公用程式報告號碼的範例,不相容的公用程式可能會錯誤地標示該號碼「程式失敗計數」或「回報的無法修正錯誤」。更糟糕的是,第三方公用程式可能有不適合相關 SSD 的故障閾值,因此 自我監控分析與報告技術 公用程式會在製造商知道可接受操作時報告故障。
由於這種潛在的混亂,Crucial 建議僅使用我們的 Storage Executive 軟體作為工具,以準確檢索和分析 Crucial SSD 上的 自我監控分析與報告技術 資料。Storage Executive 將始終以正確的屬性描述和閾值(如適用),為除最舊的舊版 Crucial SSD 以外的所有 SSD 進行程式設計。
Crucial SSD 會記錄數個不同的屬性,以供 Storage Executive 檢索。有些屬性會回報有關 SSD 的關鍵資訊,而其他屬性則僅提供資訊。
在此,我們將討論一些比較重要的屬性,如果 SATA 和 PCle 的屬性名稱不相同,則會顯示兩種名稱:
屬性 202:剩餘使用壽命百分比(PCIe 使用使用壽命百分比)
此屬性與名稱完全相同。這是衡量硬碟預計在任何時間點的剩餘使用壽命。當 SSD 是全新 SSD 時,屬性 202 將報告「100」,當達到其指定的壽命時,將顯示「0」,報告表示有 0% 的壽命仍然存在。
然而,重要的是要瞭解使用預計使用壽命的含義,這並不意味著當計數器達到零時硬碟將發生故障,而只需要很快更換您的 SSD。
NAND 快閃記憶體裝置的使用壽命由另一個特徵定義:資料保留。資料保留是裝置可以在未通電狀態下安全儲存並允許成功檢索使用者資料的時間。當 SSD 或其他 NAND 快閃記憶體裝置為全新裝置時,其未通電資料保留將長達數年。然而,幾乎就像人類記憶體一樣,寫入資料(資料讀取不會直接導致磨損),它在經歷耗損時變得越來越短。
聯合電子裝置工程委員會(JEDEC)是為半導體裝置和組件建立標準和規格的產業集團。美光是 JEDEC 的領先成員,該機構以特定方式定義資料保留:對於用戶端應用程式(如企業或個人電腦)中的 SSD,SSD 資料保留應為一年,處於未通電狀態,儲存於 30 °C(86 °F)。如有需要,這應該讓大多數電腦使用者有充裕時間從未使用的硬碟中擷取任何資料。
您或許能夠從此描述中看出,SSD 可預期運作相當順利,壽命計數器從 100% 下降。然而,隨著時間過去,資料保留將持續下降,從一年降至六個月再降至三個月,以此類推。最終,在硬碟的保固壽命之外,任何新的寫入在斷電時都無法保留。
然而,SSD 韌體將這一點納入考量。隨著 SSD 持續老化,錯誤更正碼 (ECC)、讀取重試、適應性讀取參數、背景資料維護,以及韌體中的其他調整,都可以修正因逐漸降低資料保留而產生的問題。隨著 NAND 資料區塊的劣化,可以用內建備件替換,並繼續進行正常營運。當然,所有這些背景營運都會在功耗開啟時進行,這就是為什麼資料保留是在未通電狀態下定義的。
此屬性在某些舊版 Crucial SSD 以及 NVMe 型號上也顯示為「已使用使用壽命百分比」,其運作方式與終身剩餘類似,但僅以相反方式進行。新 SSD 的屬性 202 將報告「0」,當達到其指定的壽命時,將顯示「100」,報告已使用 100% 的壽命。在這些模型中,隨著完成更多寫入營運,百分比可以超過 100,但資料保留問題是相同的。
屬性 5:已淘汰的 NAND 區塊
在 自我監控分析與報告技術 屬性 5 中追蹤透過持續評估 NAND 區塊品質程序而淘汰的區塊號碼。除了上述磨損和資料保留問題外,SSD 韌體還會因幾個原因淘汰 NAND 區塊。報廢的一個原因是在垃圾收集期間刪除資料或移動資料時未能清除區塊。由於相關資料已刪除或已成功複製到 SSD 上的新位置,因此此類故障對使用者資料的風險較低。
較新的 Crucial SSD 利用此屬性來測量超級區塊,這些屬性由許多個別區塊組成。當這是屬性 5 的測量結果時,在許多個別區塊停用之前,區塊總數將不會增加。
屬性 180:未使用的保留區塊計數(PCIe SSD 上的可用備用區塊)
同樣,顧名思義,這是在需要淘汰不良區塊時,可用的額外區塊數量。此號碼因底層 NAND 架構、韌體架構和硬碟的使用者容量而異,但通常以數千個開始。
隨著淘汰區塊數量的增加,這個數字號碼也會減少。當屬性 180 達到 0 時,韌體會將 SSD 置於唯讀模式。SSD 無法作為一般硬碟使用,但使用者應能夠檢索儲存資料並傳輸到新裝置。
與屬性 5 一樣,較新的 Crucial SSD 也測量此屬性的超級區塊,這意味著在許多個別區塊淘汰之前,此區塊總數不會減少,並且可以反映比舊版零件更小的現成價值。
屬性 210:RAIN 成功復原頁面計數
獨立 NAND 容錯陣列(RAIN)與在硬碟陣列中使用 RAID 獲得資料容錯非常相似。然而,RAIN 冗餘是在硬碟內完成,對使用者而言是顯而易見的。RAIN 是 SSD 用來保護使用者資料並延長硬碟使用壽命的一項功能。
RAIN 事件很少發生,因此如果此數量變大,該是檢查上述部分屬性並查看硬碟是否需要更換的時候了。頻繁的 RAIN 事件可能導致效能明顯下降。使用平等校驗冗餘恢復資料可以繼續正常的硬碟營運,但會消耗一些 I/O 頻寬。如果經常降低效能,RAIN 重建可能是原因,而且可能造成疑慮。
屬性 174:意外斷電計數(PCIe SSD 上不安全的關機計數)
在系統中正常功耗之前,會先從主機電腦向 SSD 發出訊息,表示功耗即將下降。此警告讓 SSD 有時間完成任何進行中的活動。完成後,SSD 會傳送「確認」訊息給主機,主機即 主機 完成關機。
在許多情況下,功耗突然斷電,這可能會為 SSD 建立問題。在幾乎所有情況下,SSD 都能彌補這一點,但下一次開機時間可能位元長一點(幾秒鐘,而不是數百毫秒),但系統再次啟動。
屬性 174 通常僅供參考。然而,號碼此類事件可能表示使用者需要接受適當的作業系統關機訓練,或者功耗或連線可能有問題。
屬性 194:機殼溫度(PCIe 裝置溫度)
Crucial Storage Executive 軟體將以攝氏為單位,回報 SSD 上的感應器所測量的目前溫度和最高使用壽命溫度。大多數 Crucial SSD 的作業範圍為 0 °C 至 70 °C(或 32 °F 至 158 °F)。任何溫度超過 70 °C 都可能導致產品保固失效,因此應定期監控溫度。如果溫度經常超過 65 °C,建議採取改善通風和風扇等糾正措施。
自我監控分析與報告技術 是監控 SSD 健康的實用工具。然而,自我監控分析與報告技術 並非全面的診斷工具。從 自我監控分析與報告技術 屬性收集的資訊以及系統診斷,可以為標準故障排除實務提供良好的起點。
錯誤報告或錯誤解讀的 自我監控分析與報告技術 資料可能導致錯誤結論,遺憾的是,這些結論可能導致返回功能完美的硬碟。因此,Crucial Storage Executive 軟體必須再次強調,Crucial Storage Executive 軟體只能用來讀取 Crucial SSD 的 自我監控分析與報告技術 資料。
©2019 美光 Technology, Inc. 保留所有權利。資訊、產品和/或規格若有變動,恕不另行通知。Crucial 或 Micron Technology, Inc. 對於排版或影像的疏失或錯誤概不負責。美光、美光 標誌、Crucial 和 Crucial 標誌是 美光 Technology, Inc. 的商標或註冊商標。 PCI Express 和 PCIe 是 PCI-SIG 的註冊商標。所有其他商標和服務標誌皆為其各自擁有者的財產權。