обновление версии прошивки схд

Применимость:

Слова для поиска:


Задача:

Обновление прошивки системы хранения данных должно быть произведено без перерыва в работе клиентов.

Как заранее убедиться в возможности такого безболезненного обновления?

Решение:

Для оценки возможности предварительно требуется собрать информацию о текущем состоянии и параметрах всего оборудования и ПО взаимодействующего с системой хранения.

Мы передадим вам необходимый инструментарий, подробные инструкции и окажем помощь, если будет необходимо.

Проверке подлежат все хосты подключенные к системе хранения данных, базы данных Oracle на хостах (включая базы данных на виртуальных машинах) и FC коммутаторы которые используются для доступа к СХД.

Оценка рисков связанных с обновлением прошивки

Касательно среднего показателя успеха самой процедуры прошивки контроллера нет официальной статистики, но инженеры службы поддержки Huawei по своему опыту говорят, что это выглядит примерно так:

Обновление до самой стабильной версии из предыдущей версии (наш случай)

  • Offline upgrade: 100%
  • Online upgrade: 99%

Offline upgrade - обновление с отключением сервиса и временным отключением всех клиенских хостов. (продолжительность 2-4 часа)

Online upgrade - обновление без прерывания сервисов.

Здесь исключены случаи, когда не проводился анализ риска перед онлайн-обновлением (для онлайн-апгрейда некоторые параметры должны быть изменены). Кроме того, исключены случаи, когда обновление не удалось из-за неправильной процедуры или были пропущены некоторые критические шаги.

Методы устранения рисков

Чтобы максимально снизить вероятность проблем, сценарий обновления предусматривает последовательную модернизацию прошивки и перезагрузку двух контроллеров. Если мы увидим какие-либо проблемы при обновлении 1-го контроллера, у нас будет возможность исправить их, не прерывая обслуживание, потому что второй контроллер в это время обслуживает клиентов.

И пока мы не завершим обновление 1-го контроллера успешно, мы не коснемся второго. И когда мы увидим, что обновленный контроллер полностью работоспособен, мы начинаем обновление второго контроллера.

Перед обновлением сценарием предусмотрен процесс предварительной проверки, который будет анализировать все параметры, версии, патчи и так далее. Таким образом, процесс обновления исключает любую проблему, или человеческий фактор, который может вызвать проблему во время обновления.

В худшем случае, если обновление таки завершится неудачно, это не повлияет на доступность сервиса ибо второй контроллер будет исправен и не прервет сервис. Установленная версия прошивки при такой ситуации может быть отброшена.

Кроме того, перед обновлением система выполнит резервное копирование прошивки и резервное копирование конфигурации. Поэтому, в случае проблем, мы будем в безопасности.

Таким образом, мы минимизируем риски на стороне системы хранения, и чтобы избежать проблем на стороне хостов, нам нужно собрать подробную информацию об их параметрах.

Прежде чем мы начнем обновление, мы должны быть уверены, что каждый хост имеет правильные параметры, версии программного обеспечения не вызывают проблем, в случае перезагрузки одного контроллера ваш хост не потеряет соединение с системой хранения, работа вашего хоста и ваши услуги, связанные с системой хранения, не будут прерваны.

Если проверка хостов выявит какие либо параметры которые следует изменить или обновить версии драйверов и программ мы предложим каждому клиенту инструкции по исправлению.

Кроме того очень важно убедиться, что при перезагрузке одного из контроллеров хост не потеряет доступ к сервису, что автоматически сработает многопутевой доступ и обеспечит непрерывность сервиса, что используемая версия UltraPath или MultiPath совместима с новой прошивкой СХД.

Стоит предупредить, что в ходе операций обновления СХД будет работать около 2 часов с одним контроллером, и это может вызвать некоторое снижение производительности.

Обновление без прерывания сервиса в режиме онлайн допустимо только в случае наличия у нас подробных сведений о состоянии и параметров всех подключенных к СХД хостов, FC коммутаторов и Субд Oracle (включая базы данных на виртуальных машинах).

В сценарии обновления хранилища оценка возможности безболезненного обновления может выполняться только после получения всей информации Если какой-либо хост, коммутатор или база данных Oracle не включена в отчет, результат оценки статуса систем может быть недостоверным. В результате после обновления могут возникнуть проблемы несовместимости и прерывание доступа к СХД.

Сбор информации о хостах

Сбор информации о конфигурации производится с ПК под ОС Windows имеющего доступ по сети к Internet и к серверам подключенным к СХД.

Мы можем предложить вам три варианта решения задачи сбора информации на стороне хостов.

  1. Мы можем собрать необходимую информацию самостоятельно, но для этого вам следует предоставить нам доступ в вашу сеть и данные доступа к хостам, FC коммутаторам и СУБД Oracle.
  2. Для варианта когда это невозможно по причинам конфиденциальности и т.п., мы предложим вам самостоятельно выполнить операции по сбору информации и передать нам отчеты, проверив содержимое отчетов на наличие конфиденциальной информации. Мы передадим вам необходимый инструментарий, подробные инструкции и окажем помощь, если будет необходимо.
  3. Если этот вариант окажется сложным, мы предложим провести работы с участием наших специалистов. Для этого на компьютер вашего администратора должен быть установлен Teamviewer, через него вы предоставите доступ к вашему рабочему столу, наш специалист под наблюдением вашего администратора выполнит необходимые действия, необходимые пароли и другие параметры доступа будет вводить ваш администратор невидимо для нашей стороны. Затем ваш администратор сможет проверить содержимое логов которые мы заберем для анализа.

После сбора информации до получении сообщения о завершении обновления не меняйте без предупреждения оборудование и параметры связанные с СХД.

OceanStor Smartkit

Функции сбора необходимой информации предусмотрены инструментарием OceanStor Smartkit

Инструментарий только собирает информацию о версиях драйверов и ПО и параметрах способных повлиять на ход операции. Не производится никаких изменений в системе.

Список команд сбора информации для каждого из вариантов проверки.

Установка ПО и подготовка

Установите OceanStor Smartkit: OceanStor_Toolkit_V2R5C00RC11 (400MB)

Для установки используйте компьютер под Windows имеющий доступ ко всем проверяемым системам по сети.

После установки вам будет предложено запустить приложение.

При запуске вам потребуется пройти несколько диалогов

Установка InfoGrab

Для сбора информации о хостах, субд Oracle и коммутаторах потребуется установить модуль InfoGrab.

Действия для установки функциональных модулей …

После верификации нажмите Install

Сбор информации

Для запуска Infograb последовательно нажмите на линки и кнопки согласно этим картинкам

Инструмент InfoGrab прекращает сбор информации когда устройство занято (использование CPU больше 80%, или IOWait больше 20%).

Добавление хостов

После создания задачи сбора информации следующий шаг - добавление хостов, баз данных и коммутаторов.

Укажите соответствующую операционную систему и на втором шаге - имя и пароль администратора хоста. Вы можете указать диапазон адресов в котором работают хосты подключенные к СХД и в итоге они все будут добавлены в список за один шаг. Разумеется для этого хосты должны иметь одинаковую операционную систему и одно имя / пароль.

Убедитесь, что вы добавили в задачу все хосты подключенные к СХД и коммутаторы использующиеся для доступа. Очень важно не пропустить ни одного.

Добавление Oracle

Для базы данных, развернутой на одном хосте, введите IP-адрес хоста. Для кластерной базы данных введите IP-адрес, используемый для предоставления службы.

Добавление коммутатора

При добавлении коммутатора доступно только два варианта Cisco и Brocade.

Например для HP5900CP рекомендовано использовать тип Brocade

Выполнение сбора информации

По нажатию на Modify Result Directory определите в каком месте будут сохранены отчеты проверок.

Кнопка Grub запускает процесс сбора информации.

Для хостов Windows без UltraPath

Актуально для Windows 2019

Для хостов Windows с MPIO без Ultrapath соберите информацию MPIO путем следующих действий:

Запустите PowerShell и выполните команду проверки статуса MPIO

dism /online /get-features

Запустите команду mpclaim –v для проверки конфигурации MPIO.

Если используется конфигурация по умолчанию, то ответ может быть пустым.

В PowerShell выполните команду mpclaim –s –d для информации о MultiPath дисках.

Затем выполните команду mpclaim –s –d 1 чтобы увидеть состояние пути к диску (в качестве примера используется диск 1). Если у вас multipath дисков больше чем один, то выполните эту команду для каждого mpclaim –s –d 2 и так далее.

Выполните еще раз эти команды с перенаправлением вывода в файл который вы затем передадите в службу поддержки.

dism /online /get-features >> mpio.log
mpclaim –v >> mpio.log
mpclaim –s –d >> mpio.log
mpclaim –s –d 1 >> mpio.log

Передача информации

Используйте рекомендации статьи проверка oceanstor ultrapath для проверки многопутевого доступа. Убедитесь, что ваш сервер подключен разными путями к каждому контроллеру СХД.

Упакуйте все отчеты в zip-архив.

По готовности отчетов сообщите в нашу службу поддержки о завершении проверок и приложите к сообщению архивы отчетов.

Если будут проблемы с пересылкой отчетов по почте или в тикетной, используйте сервис https://send.firefox.com/ для передачи файлов и пришлите ссылки для скачивания

До получении сообщения о завершении обновления не меняйте без предупреждения оборудование и параметры связанные с СХД.

Смотрите также: