跳到主要内容

阵列健康和维护

定期检查您的 Unraid 阵列对于保持数据完整性和在问题导致数据丢失之前识别潜在问题至关重要。本页面介绍了监控工具和故障排除程序,以保证您的阵列健康。

检查阵列设备

You can initiate a check using the Check button under Array Operations. Depending on your array's configuration, this button allows you to conduct either a parity check or a read check.

检查按钮可让您执行校验和读取
检查

为方便起见,您可以通过导航到设置 → 调度程序来安排这些检查以适合您的间隔自动运行。建议每月或每季度执行自动纠正检查,以确保数据的持续健康并修复发现的同步错误。

校验检查

当您的阵列中至少包含一个指定的奇偶校验设备时,进行 %%parity check|奇偶校验检查%% 是必不可少的。在此过程中,所有数据磁盘同时被读取。系统重新计算奇偶校验并将其与存储在您的 %%parity disk(s)|奇偶校验磁盘%% 上的信息进行比较。

深入:奇偶校验同步与奇偶校验检查 - 有何区别? - 点击展开/折叠

%%parity|奇偶校验%% 同步会读取所有数据磁盘并从零开始创建 %%parity|奇偶校验%% ,将结果保存到 %%parity drives|奇偶校验磁盘%% 上。通常在您添加或更换 %%parity drives|奇偶校验磁盘%% 或进行重大配置更改后,此过程会发生。

%%parity check|奇偶校验检查%% 会读取所有数据磁盘以及 %%parity drives|奇偶校验磁盘%% 。它重新计算 %%parity|奇偶校验%% 值并与存储值进行比较。有两种模式来运行 %%parity check|奇偶校验检查%%:

  • 修正 (CORRECT): 如果发现不匹配,它会更新 %%parity disk|奇偶校验磁盘%% 并记录事件。
  • 非校正(NOCORRECT): 仅记录发现的错误而不更新校验。

为避免过多日志记录,在 %%parity check|奇偶校验检查%% 过程中仅报告前 100 个错误地址。这些不匹配被称为 同步错误 ,表明奇偶校验与数据不一致,通常由于如突然断电或硬件问题所致。每个同步错误按 4KiB 块计数 - 这是系统的 I/O 单元大小(称为 Linux 页大小)。

深入:奇偶校验和阵列磁盘中的“有效”是什么意思? - 点击展开/折叠

有效的 %%parity disk|奇偶校验磁盘%% 表示在最后一次成功 %%parity|奇偶校验%% 同步后,Unraid 认定该 %%parity|奇偶校验%% 是 "好" 的,意味着如果磁盘出现故障,它适合数据恢复。"有效" 状态适用于阵列中的每个磁盘,而不仅仅是 %%parity|奇偶校验%% 。如果除一个之外的所有磁盘都是有效的,Unraid 可以使用 %%parity|奇偶校验%% 重建丢失或故障磁盘的数据。

即使在非修正检查后发生一些同步错误,Unraid 仍保持 %%parity disk|奇偶校验磁盘%% 的 "有效" 状态。这样您仍然可以恢复故障磁盘。如果 %%parity|奇偶校验%% 被标记为无效,您将在仅发生一次额外故障后面临两个无效磁盘的风险,从而导致潜在数据丢失。

在 %%parity check|奇偶校验检查%% 进行时,您仍然可以使用阵列。然而,请注意由于磁盘争用,性能可能会变慢,因为文件操作和检查都在争夺资源。

通常,如果 %%parity check|奇偶校验检查%% 识别到错误,Unraid 将更新 %%parity disk|奇偶校验磁盘%% 以与计算数据对齐并增加同步错误计数器。

提示

如果您希望在不进行更正的情况下运行检查,只需在开始前取消勾选将更正写入校验,这样错误会被报告,但不会被修复。

important

在发生"不安全关闭"后——即在没有正确停止的情况下重启阵列——Unraid 会自动启动parity check,使用在设置 → 调度器 → 奇偶校验下配置的模式(默认情况下是不更正的)。要更改自动检查的运行方式,请打开设置 → 调度器 → 奇偶校验并在那里调整选项。意外断电是不安全关闭的最常见触发因素,因此强烈建议使用不间断电源(UPS)来保护您的数据。

What to do if you encounter parity errors

Parity errors happen when the parity information your system calculates doesn't match what's stored on your parity drives. This mismatch can arise from several issues, including:

  • 调查问题: 首先检查SMART报告,它提供了关于您驱动器健康的详细信息。寻找任何磁盘或连接问题的迹象。
  • 从我们的论坛寻求帮助: 如果您无法自行解决问题,请考虑在 Unraid 论坛上寻求建议。社区可以根据他们的经验提供宝贵的见解和建议。
  • Run another check: After you've addressed any hardware issues, running another parity check is a good idea to ensure everything is back in order.
  • 不干净的关机或意外的系统崩溃

When parity errors occur, either the parity drives or the data disks could be out of sync. Ideally, a parity check should report zero errors so everything functions correctly.

What to do if you encounter parity errors

If your parity check reveals errors:

  1. 调查问题: 首先检查SMART报告,它提供了关于您驱动器健康的详细信息。寻找任何磁盘或连接问题的迹象。
  2. 从我们的论坛寻求帮助: 如果您无法自行解决问题,请考虑在 Unraid 论坛上寻求建议。社区可以根据他们的经验提供宝贵的见解和建议。
  3. Run another check: After you've addressed any hardware issues, running another parity check is a good idea to ensure everything is back in order.
Rebuild 时间

Remember that parity checks can take several hours, depending on the size of your disks and the activity level of your system. For the best results, schedule these checks during times of low system usage.

读取检查

在某些情况下,您应该执行读校验,以确保存储阵列的健康状况。此检查是必要的,特别是在您的阵列没有分配任何校验设备禁用的驱动器多于可用的校验驱动器时。

读校验过程中,阵列中每个磁盘的每个扇区都会被检查。其目的是验证所有数据是否可以访问并识别任何无法恢复的读错误。

历史记录让您查看读取检查操作的统计数据

为何读取检查很重要

读校验对于监控磁盘健康至关重要,特别是在没有校验保护的配置中。如果磁盘在校验过程中遇到无法恢复的读错误,受影响的数据将无法恢复,这可能导致数据丢失。因此,关注这些校验的结果是很重要的,并且在报告错误时及时采取措施是必要的。

You can also review the history of read check operations in the Unraid interface, which helps you spot trends or recurring issues over time.

何时使用读取检查

请在以下情形中考虑执行读取检查

  • 未分配校验设备时: 当阵列缺乏校验保护时。
  • 验证磁盘完整性: 在不进行任何修正的情况下确认每个磁盘的完整性。
  • 解决硬件问题后: 在修复硬件问题后确保所有磁盘健康。

如果发现错误该怎么办

如果您的读取检查报告错误,请按以下步骤操作:

  1. 查看SMART报告: 检查受影响磁盘的SMART报告以了解其健康状态。
  2. 检查连接: 确保物理连接和电缆是安全的。
  3. 考虑更换: 如果磁盘显示持久错误,请考虑更换它。
  4. 备份关键数据: 尽快将错误报告的磁盘上的重要数据转移,以防止数据丢失。
警告

没有校验保护,任何不可恢复的读取错误都将导致受影响文件或扇区的永久数据丢失。

提示

为了维护磁盘的健康,尤其是在阵列没有奇偶保护的情况下,建议定期安排读取检查|read-check。这种积极的措施有助于您及早发现潜在问题,以保护您的数据。

检查历史

Whenever the system performs a parity check or a read check, it keeps a record of what happened. You can view these details easily by clicking the History button found under Array Operations in the interface.

Unraid 提供多种写入模式用于管理阵列操作,每种模式在速度、电量消耗和磁盘损耗方面各有优劣。了解这些模式的工作原理以及缓存盘或缓存池的作用,有助于根据您的需求优化服务器。

磁盘升降速操作

Unraid 允许您控制硬盘的电源状态。您可以轻松地 %%spin them up or down|电源状态%%,并管理 SSD 处于活动或待机状态。这有助于省电,延长硬盘寿命,并在磁盘未使用时降低噪音。

为什么要启动或停止?

旋转关闭不常用的驱动器可以节省能源并延长它们的寿命。提前旋转驱动器可以减少您需要尽快获取文件时的等待时间。

如何控制启动状态

通过 Main 选项卡控制磁盘旋转状态:

  1. 转到 Main 选项卡并找到您的阵列设备。
  2. 每个磁盘都有旋转控制按钮:
    • 🔘 按钮 - 启动 (如果当前已停止)
    • 🟢 按钮 - 停止 (如果当前正在旋转)
  3. 点击适当的按钮来执行您想要的操作。

请记住,如果磁盘被访问(例如打开文件),它将保持活动并忽略任何停止请求。

当磁盘不转时,其温度将不会在WebGUI中显示。然而,一旦任何应用程序或用户访问它,它将自动开始转动。

提示

使用旋转控制来节省电力并减少对驱动器的损耗。请记住,正在被使用的磁盘将保持开启状态,直到所有任务完成。

重置阵列配置

重置阵列配置是一个需要谨慎对待的重要步骤。此过程通常在移除磁盘、以新阵列布局重头开始或修复磁盘分配问题时是必要的。请注意,此操作可能会影响数据保护和校验,因此请确保只有在确有必要时才继续进行。

在以下情况下重置您的阵列:

  • 移除或替换磁盘
  • 以新的阵列布局重新开始
  • 修复磁盘分配错误
  • 从配置问题中恢复

可以通过新配置页面重置您的磁盘配置

要重置阵列配置:

  1. 转到 工具 → 新配置
  2. 可选地保留某些现有磁盘分配以进行小的调整。
  3. 选中确认框并点击 应用
  4. 返回 Main 选项卡。
  5. 根据需要分配或解除磁盘。
  6. 在正常模式或 维护模式 下启动阵列。
important
  • Unraid 尝试识别以前使用的驱动器并在可能的情况下保留数据。
  • 移除数据盘会导致奇偶校验失效,除非该盘在移除前被清零。
  • 更改磁盘顺序不会影响 Parity1,但可能使 Parity2 失效。
注意

当您看到开始按钮时,有一个标记为奇偶有效的复选框。只有在您确定其正确或经验丰富的 Unraid 用户建议您在恢复期间这样做时,才选中此框。不正确地选中此选项可能导致数据丢失。

如果您的目标是重建磁盘,请勿使用新配置。执行新配置会清除重建所需的阵列历史记录,而且 Unraid 将不会提供重建磁盘的选项。请按照磁盘重建程序进行操作。

撤销重置

要撤销重置:

  1. **无奇偶校验保护:**在移动到数组之前,数据未受保护。
  2. 打开 config 文件夹。
  3. super.old 重命名为 super.dat
  4. 重启您的服务器以恢复之前的配置。

状态报告

Unraid 提供状态报告,帮助您跟踪存储阵列的健康状况。这些报告是快速检查任何磁盘是否禁用或在读取或写入数据时出现问题的快捷方式。

  • **当前状态:**状态报告显示您的阵列当前情况。重要的是要注意,这些信息在系统重新启动后将被重置,因此不会保留过去的历史问题。

  • **无历史数据:**如果您想查看重启前发生了什么,您需要去其它地方查看,因为这些报告不保存过去的状态。

important

请记住,状态报告不包括SMART数据。SMART报告为您提供了单个磁盘健康的更详细视图。因此,即使您的状态报告显示一切正常,定期检查SMART报告以尽早发现任何潜在问题仍然是个好主意。

故障排除数组启动失败

如果您的数组无法启动,请按照这些步骤识别和修复常见问题。在主菜单 → 数组操作下查找错误消息。

缺少磁盘

信息: 磁盘过多错误或丢失!

单一奇偶校验错误

使用 一个 %%parity drive|冗余盘%%,您只能丢失 一个 磁盘。使用两个 %%parity drives|冗余盘%%,可以丢失 两个 磁盘,且仍能启动数组,依此类推。冗余可以帮助您,直到能更换丢失的磁盘。

操作步骤: 更换丢失的磁盘。在双冗余配置中,一次更换一个丢失的磁盘。 如果无法恢复数据(或在双冗余设置中有超过 2 个磁盘故障),请转到 工具 → 新配置 执行新配置程序。

设备限制

消息: 设备过多。 请考虑升级您的注册密钥。

设备限制错误

连接存储的规则仅在启动阵列之前适用。 启动阵列后,您可以添加更多存储,包括用于虚拟机的 USB 驱动器。 不过,请注意 Unraid 当前仅限制在 入门许可级别(最多 6 个设备)。

提示

最大限制适用于除启动USB外的所有设备。

要解决此错误:

  1. 停止数组。
  2. 移除任何不必要的存储设备。
  3. 启动数组。
  4. 之后重新连接设备以供未分配设备使用。

许可问题

信息:
注册密钥无效或丢失。

密钥丢失

需要有效的注册密钥才能启动阵列。要购买或获取试用密钥:

  1. 转到 Tools → Registration
  2. 点击获取试用密钥购买密钥
  3. 通过返回到注册,在字段中粘贴并点按安装密钥按钮安装密钥。
Trial 试用与付费许可证
  • 试用许可证: 提供30天的完整Unraid访问权限,与更高级别的许可证相同。你可以使用无限的存储设备,但你需要连接互联网以启动它。在这里开始新的试用。
  • 付费许可证:这是您可以永久保留的!然而,您可以根据所选择的计划(入门版全面版终身版)设备数量会有限制。在激活后,您无需再连接到互联网。
提示

如果您看到 "无效密钥" 错误,可能意味着您的试用已过期。要继续使用 Unraid 您可以 在这里购买许可证

Blacklisted USB闪存设备

如果您的服务器在线并且试用未结束,但您的 USB 闪存驱动器可能有一个无法注册密钥的 GUID。这可能会发生在 GUID 不唯一或已被他人注册的情况下。使用通过 USB 的 SD 卡读卡器也可能导致此问题,因为它通常具有通用 GUID。 如果您的 USB 闪存驱动器被黑名单禁止使用,则它将无法再使用,您需要找到其他的设备来安装 Unraid 服务器操作系统。

密钥服务器连接

消息: 无法联系密钥服务器

If you have a Trial license, you'll see a message indicating that you need to contact the Unraid license server to start your array. However, if you have a paid license, you can start the array without any extra steps.

对于试用用户,服务器在首次启动时会尝试连接到许可证密钥服务器以检查您的许可证。如果无法在30秒内连接,阵列将不会启动。但别担心!每次您刷新或导航到 WebGUI,它会再次快速尝试验证您的许可证。一旦成功验证,除非重启,否则服务器不需要再次检查。

撤回发布

消息: 该 Unraid 版本已被撤回。

如果您看到此消息,说明您正在使用未授权用于正常使用的测试版或候选发布版的 Unraid。

要解决此问题:

  1. 打开 Unraid。
  2. 转到 Tools → Update OS
  3. 安装最新的稳定版本。

更新完成后,重启您的服务器以启动数组。

重建期间的磁盘故障

如果在重建另一个磁盘时发生第二个磁盘故障,您能做的将取决于您的奇偶校验设置。

单个奇偶盘

如果在重建另一个磁盘时一个磁盘故障,重建将停止,因为数据无法准确恢复。

双奇偶盘

如果您有两个 %%parity drives|校验盘%%,您有更多的选择:

  • 您可以等待第一个重建完成,然后再处理第二个故障磁盘。
  • 或者,您可以停止当前重建,替换第二个故障磁盘,然后启动阵列以同时重建两个磁盘。

如果第一次重建快要完成,通常最好让它完成。如果刚开始,重建两个可能会更快。

警告

重建磁盘会给所有驱动器带来很大压力,从而增加新故障的概率。在开始重建前,请使用SMART报告检查磁盘健康。

Rebuild 时间

要准备好重建过程可能需要几个小时。时间可能因磁盘大小和系统忙碌程度而异。较大的磁盘和繁忙的系统可能需要更长时间。