メインコンテンツへスキップ

UDMA CRCエラー

UDMA CRCエラーSMART 属性 199)は Unraid ユーザーに典型的で、ドライブの健全性レポートにしばしば表示されます。ほとんどのユーザーにとって、これらのエラーはドライブ自体の故障ではなく、ドライブとサーバー間の通信問題を示しています。

CRCエラー が発生すると、ドライブはホストからデータが正しく受信されなかったことを検出します。Unraid はデータを再送信して自動的に復旧を試みます。再送信が成功すれば処理は通常どおり続行されますが、再試行のために書き込み速度が低下する場合があります。これらのイベントは syslog に記録されます。

If recovery attempts fail after several retries, Unraid treats it as a read error. In parity-protected arrays, Unraid will attempt to rewrite the affected sector using parity and data from other drives. If this rewrite is successful, operation resumes; if not, the drive is disabled and marked with a red 'x' in the WebGUI.

CRC エラーとは何か?(技術的な説明) - クリックして展開/折りたたみ

cyclic redundancy check (CRC) は、転送中の生データの偶発的な変更を検出する数学的なチェックサムです。UDMA(ultra direct memory access)の文脈では、CRCエラー はドライブとコントローラー間で送信されたデータがこの整合性チェックに失敗したことを意味します。これは通常、ドライブのプラッタやフラッシュメモリの問題ではなく、緩んだケーブルや不良ケーブルなどの物理的な通信問題を示します。


UDMA CRCエラーの考えられる原因

UDMA CRCエラーは、ドライブとシステム間のデータ転送の問題を示します。これらのエラーを放置すると、データ破損、性能低下、ドライブ障害の原因になる可能性があります。根本原因を理解することで、場当たり的に解決策を探すのではなく、的を絞った修正を実施できます。

確認すべき一般的な原因

  • 緩んでいる、または差し込みが不十分な SATA ケーブル: SATA コネクターはそれほど堅牢ではなく、振動やケーブルの張力で簡単に緩むことがあります。ケーブルをきつく束ねるのは避けてください。クロストークや干渉の原因になります。
  • 不良な SATA ケーブル: 破損したケーブルや品質の低いケーブルは、CRCエラー の一般的な原因です。
  • 電力供給の問題: スプリッターケーブルや電源ユニットの過負荷が原因となることが多い、不十分または不安定な電力は、断続的なエラーを引き起こす可能性があります。
  • 未装着のディスクコントローラー: コントローラーカードがスロットに完全に差し込まれていない場合、通信エラーが発生することがあります。
  • ドライブのハードウェア障害: 頻度は低いものの、故障しかけているドライブでも CRC エラーが発生することがあります。
  • ケーブル管理の問題:
    • 結束バンド: ケーブル管理に結束バンドを使う場合は、きつく締めすぎず、ゆるめにしてください。できれば代わりにベルクロストラップを使用してください。
    • 電源ケーブルとデータケーブルの配線: 電源ケーブルを SATA データケーブルに沿って配線するのは避けてください。どうしても接触させるか、非常に近づける必要がある場合は、干渉を最小限にするため 90 度で交差させる必要があります。
    • SATA ケーブルの曲げ方: 90 度に曲げるために SATA ケーブルを無理に折り曲げないでください。ケーブルを損傷し、通信問題の原因になります。

復旧手順

CRCエラー に気付いたら、最初の手順として、各ドライブの SATA ケーブルと電源ケーブルを注意深く確認し、差し直してください。損傷している、またはしっかり固定できないケーブルは交換してください。エラーが続く場合は、電源ユニットとコントローラー接続を確認し、問題を切り分けるためにケーブルやポートの入れ替えを検討してください。

配線と電源を対処した後も CRCエラー が続く場合は、コントローラーまたはドライブの故障を除外するため、さらに調査が必要になることがあります。


CRC エラー表示の理解

たまに発生するエラーと頻繁に発生するエラー

クリックして展開/折りたたむ

CRCエラー の頻度とパターンを理解することで、対応の緊急度を判断できます。すべてのエラーに即時対応が必要なわけではありませんが、パターンから注意が必要な根本的問題が見えてくることがあります。

たまに発生するエラー(懸念は低い)

数週間または数か月の間に数回の CRCエラー が発生しても、通常は問題ありません。こうした単発の事象は、一時的な電力変動、メンテナンス中のケーブルの動き、または自動的に解消する一過性の問題が原因であることがあります。

頻繁に発生するエラー(懸念は高い)

毎日または毎週発生する CRCエラー、あるいはエラー数が急速に増加している場合は、すぐに調査が必要な継続的な問題を示しています。このパターンは、緩んだ接続、不良ケーブル、電源の問題など、時間とともに悪化するハードウェア問題を示すことがよくあります。

対処すべきタイミング

エラーが頻繁、または増加傾向にある場合は、すぐに調査してください。配線と電源構成を確認して断続的な問題がないかを調べ、エラー率を監視して悪化の兆候を特定してください。これらの問題は自然に解決することは少なく、より深刻な障害につながる可能性があるため、エラーが続く場合は予防保守を検討してください。

保留中セクター数

クリックして展開/折りたたむ

現在の保留中セクター数SMART 属性 197)は、CRCエラー と並んで表示されることの多い重要な指標です。この組み合わせは、早急な対応と慎重な監視を必要とする深刻な問題を示しています。

保留中セクターは、アクセスしても読み取れない可能性のある、信頼性の低いディスク領域を示します。これらは読み取りエラーを経験したセクターであり、現在はドライブのファームウェアによって問題のある可能性があるものとしてマークされています。保留中セクターが CRCエラー と一緒に現れる場合、通信問題が、データを確実に保存および取得するドライブの能力に物理的な損傷を引き起こしていることを示唆します。

この組み合わせが危険な理由

CRCエラー はドライブとコントローラー間の通信問題を示し、保留中セクターはディスクの一部が信頼性を失いつつあることを示します。この2つが重なると、データ保護が損なわれる可能性のある高リスクな状況になります。別のドライブが故障し、なおかつこのドライブに保留中セクターがある場合、データを復旧できる可能性は大幅に制限され、データ復旧 作業が危険にさらされることがあります。

この組み合わせを見たら、次の対応を行ってください:

  • 直ちに、まだ保護されていない重要なデータをバックアップしてください。
  • 拡張 SMART テストを使用してドライブの健全性を確認し、保留中セクターが増え続ける場合はドライブの交換を検討してください。
  • 追加の警告兆候がないか状況を注意深く監視し、ドライブが信頼できなくなった場合に備えて array の再構築ができるよう準備してください。

CRC カウントの持続性

クリックして展開/折りたたむ

ドライブの SMART データ における CRCエラー のカウントはリセットされることはなく、増える一方です。

この累積的な性質は、次のことを意味します:

  • このカウントは、そのドライブの生涯における総エラー数を表します
  • 悪化状況を特定するため、増加率を監視してください
  • 一度エラーが発生すると、恒久的に記録されます
  • 問題が深刻化する前に、カウントを使って予防保守の予定を立ててください

CRC エラーが少し見つかっても慌てないでください。ただし、増加率は必ず追跡してください。エラーが急増する場合は、すぐに対応が必要な新しい問題を示していることがよくあります。

ダッシュボードの警告アイコン

クリックして展開/折りたたむ

Unraid が CRCエラー を検出すると、Dashboard に影響を受けたドライブの横へ警告アイコンが表示されます。これは SMART の警告であり、内容を確認して対処する必要があります。

これが重要な理由

  • 潜在的なハードウェア問題を早期に知らせる警告システム
  • 問題を早期に見つけることでデータ損失の防止に役立つ
  • 予防保守が必要なタイミングを示す
  • Unraid のプロアクティブな監視システムの一部

警告アイコンをクリックすると、詳細な SMART 情報を表示し、警告を確認済みにできます。

SMART 警告の確認

クリックして展開/折りたたむ

SMART 警告を確認済みにして消去するには:

  1. 影響を受けたドライブの横にある オレンジ色の警告アイコン をクリックします
  2. オプションメニューから 確認済み を選択します
  3. 求められたら操作を確認します
  4. アイコンが 緑色 に変わり、確認済みであることを示します

確認済みの動作

  • 警告をすぐには表示しないようにします
  • 問題を見たことを記録します
  • エラー数がさらに増えた場合のみ再通知します
  • 根本的な問題の監視を維持します
important

警告を確認済みにしても根本的な問題は解決されません。Unraid に、その警告を認識したことを伝えるだけです。CRCエラー の根本原因は、引き続き調査して解決する必要があります。