• Nenhum resultado encontrado

OPERAÇÕES DE MONITORAMENTO DE RECURSOS

No documento Red Hat Enterprise Linux 8 (páginas 187-192)

Eliminação de um recurso configurado

CAPÍTULO 20. OPERAÇÕES DE MONITORAMENTO DE RECURSOS

Para garantir que os recursos permaneçam saudáveis, você pode acrescentar uma operação de monitoramento à definição de um recurso. Se você não especificar uma operação de monitoramento para um recurso, por padrão o comando pcs criará uma operação de monitoramento, com um intervalo que é determinado pelo agente do recurso. Se o agente de recursos não fornecer um intervalo de monitoramento padrão, o comando pcs criará uma operação de monitoramento com um intervalo de 60 segundos.

Tabela 20.1, “Propriedades de uma operação” resume as propriedades de uma operação de monitoramento de recursos.

Tabela 20.1. Propriedades de uma operação

Campo Descrição

id Nome único para a ação. O sistema atribui isto quando você configura uma operação.

name A ação a realizar. Valores comuns: monitor, start, stop

interval Se definido para um valor diferente de zero, é criada uma operação recorrente que se repete nesta freqüência, em segundos. Um valor diferente de zero só faz sentido quando a ação name é definida para monitor. Uma ação de

monitoramento recorrente será executada imediatamente após o início de um recurso, e as ações de monitoramento subseqüentes são programadas a partir do momento em que a ação de monitoramento anterior for concluída. Por exemplo, se uma ação de monitoramento com interval=20s for executada à 01:00:00, a próxima ação de monitoramento não ocorrerá à 01:00:20, mas aos 20 segundos após a conclusão da primeira ação de monitoramento.

Se definido como zero, que é o valor padrão, este parâmetro permite fornecer valores a serem usados para operações criadas pelo cluster. Por exemplo, se o interval for definido como zero, o name da operação é definido como start, e o valor timeout é definido como 40, então o Pacemaker usará um timeout de 40 segundos ao iniciar este recurso. Uma operação monitor com intervalo zero permite definir os valores de timeout/on-fail/enabled para as sondas que o Pacemaker faz na inicialização para obter o status atual de todos os recursos quando os padrões não são desejáveis.

timeout Se a operação não for concluída no tempo definido por este parâmetro, abortar a operação e considerá-la fracassada. O valor padrão é o valor de timeout se configurado com o comando pcs resource op defaults, ou 20 segundos se não estiver configurado. Se você descobrir que seu sistema inclui um recurso que requer mais tempo do que o sistema permite para realizar uma operação (como start, stop, ou monitor), investigue a causa e se o longo tempo de execução é esperado, você pode aumentar este valor.

O valor timeout não é um atraso de nenhum tipo, nem o cluster espera todo o período de timeout se a operação retornar antes que o período de timeout tenha terminado.

on-fail A ação a ser tomada se esta ação falhar. Os valores permitidos: * ignore - Finja que o recurso não falhou

* block - Não realizar nenhuma outra operação sobre o recurso * stop - Pare o recurso e não o inicie em outro lugar

* restart - Pare o recurso e inicie-o novamente (possivelmente em um nó diferente)

* fence - STONITH o nó sobre o qual o recurso falhou

* standby - Afastar all recursos do nó em que o recurso falhou

* demote - Quando uma ação promote falha para o recurso, o recurso será rebaixado, mas não será totalmente interrompido. Quando uma ação monitor falhar para um recurso, se interval estiver definido para um valor diferente de zero e role estiver definido para Master, o recurso será rebaixado, mas não será totalmente interrompido.

O padrão para a operação stop é fence quando a STONITH está habilitada e block caso contrário. Todas as outras operações são padrão para restart. enabled Se false, a operação é tratada como se ela não existisse. Valores permitidos: true,

false

Campo Descrição

20.1. CONFIGURAÇÃO DE OPERAÇÕES DE MONITORAMENTO DE

RECURSOS

Você pode configurar as operações de monitoramento ao criar um recurso, usando o seguinte comando. pcs resource create resource_id standard:provider:type|type [resource_options] [op operation_action operation_options [operation_type operation_options ]...]

Por exemplo, o seguinte comando cria um recurso IPaddr2 com uma operação de monitoramento. O novo recurso é chamado VirtualIP com um endereço IP de 192.168.0.99 e uma máscara de rede de 24 em eth2. Uma operação de monitoramento será realizada a cada 30 segundos.

# pcs resource create VirtualIP ocf:heartbeat:IPaddr2 ip=192.168.0.99 cidr_netmask=24 nic=eth2 op monitor interval=30s

Alternativamente, você pode adicionar uma operação de monitoramento a um recurso existente com o seguinte comando.

pcs resource op adicionar resource_id operation_action [operation_properties] Use o seguinte comando para excluir uma operação de recurso configurado.

NOTA

Você deve especificar as propriedades exatas da operação para remover corretamente uma operação existente.

Para alterar os valores de uma opção de monitoramento, você pode atualizar o recurso. Por exemplo, você pode criar um VirtualIP com o seguinte comando.

# pcs resource create VirtualIP ocf:heartbeat:IPaddr2 ip=192.168.0.99 cidr_netmask=24 nic=eth2

Por padrão, este comando cria estas operações.

Operations: start interval=0s timeout=20s (VirtualIP-start-timeout-20s) stop interval=0s timeout=20s (VirtualIP-stop-timeout-20s)

monitor interval=10s timeout=20s (VirtualIP-monitor-interval-10s) Para alterar a operação de parada, execute o seguinte comando.

# pcs resource update VirtualIP op stop interval=0s timeout=40s

# pcs resource show VirtualIP

Resource: VirtualIP (class=ocf provider=heartbeat type=IPaddr2) Attributes: ip=192.168.0.99 cidr_netmask=24 nic=eth2

Operations: start interval=0s timeout=20s (VirtualIP-start-timeout-20s) monitor interval=10s timeout=20s (VirtualIP-monitor-interval-10s)

stop interval=0s timeout=40s (VirtualIP-name-stop-interval-0s-timeout-40s)

20.2. CONFIGURAÇÃO DE PADRÕES DE OPERAÇÃO DE RECURSOS

GLOBAIS

A partir do Red Hat Enterprise Linux 8.3, você pode alterar o valor default de uma operação de recurso para todos os recursos com o comando pcs resource op defaults update. O seguinte comando define o valor default global de um timeout de 240 segundos para todas as operações de monitoramento.

# pcs resource op defaults update timeout=240s

O original pcs resource op defaults name=value que define os padrões de operação de recursos para todos os recursos em versões anteriores do RHEL 8, continua sendo suportado, a menos que haja mais de um conjunto de padrões configurado. Entretanto, pcs resource op defaults update é agora a versão preferida do comando.

20.2.1. Valores de operação superiores aos recursos específicos

Observe que um recurso de cluster usará o padrão global somente quando a opção não estiver especificada na definição do recurso de cluster. Por padrão, os agentes de recursos definem a opção

timeout para todas as operações. Para que o valor de timeout global da operação seja honrado, você

deve criar o recurso de cluster sem a opção timeout explicitamente ou deve remover a opção timeout atualizando o recurso de cluster, como no seguinte comando.

Por exemplo, após definir um valor padrão global de 240 segundos para timeout para todas as

operações de monitoramento e atualizar o recurso de cluster VirtualIP para remover o valor de timeout para a operação monitor, o recurso VirtualIP terá então valores de timeout para start, stop e monitor operações de 20s, 40s e 240s, respectivamente. O valor padrão global para operações de timeout é aplicado aqui apenas na operação monitor, onde a opção padrão timeout foi removida pelo comando anterior.

# pcs resource show VirtualIP

Resource: VirtualIP (class=ocf provider=heartbeat type=IPaddr2) Attributes: ip=192.168.0.99 cidr_netmask=24 nic=eth2

Operations: start interval=0s timeout=20s (VirtualIP-start-timeout-20s) monitor interval=10s (VirtualIP-monitor-interval-10s)

stop interval=0s timeout=40s (VirtualIP-name-stop-interval-0s-timeout-40s)

20.2.2. Alteração do valor padrão de uma operação de recurso para conjuntos de

recursos (RHEL 8.3 e posteriores)

A partir do Red Hat Enterprise Linux 8.3, você pode criar múltiplos conjuntos de padrões de operação de recursos com o comando pcs resource op defaults set create, que lhe permite especificar uma regra que contém resource e expressões de operação. Somente resource e expressões de operação, incluindo and, or e parênteses, são permitidas nas regras que você especificar com este comando. Com este comando, você pode configurar um valor padrão de operação de recursos para todos os recursos de um determinado tipo. Por exemplo, agora é possível configurar os recursos implícitos

podman criados pela Pacemaker quando os pacotes estão em uso.

O seguinte comando estabelece um valor de tempo limite padrão de 90s para todas as operações para todos os recursos podman. Neste exemplo, ::podman significa um recurso de qualquer classe, de qualquer fornecedor, do tipo podman.

A opção id, que nomeia o conjunto de recursos padrão de operação, não é obrigatória. Se você não definir esta opção, pcs irá gerar uma identificação automaticamente. A definição deste valor permite que você forneça um nome mais descritivo.

# pcs resource op defaults set create id=podman-timeout meta timeout=90s rule resource ::podman

O seguinte comando estabelece um valor padrão de tempo limite de 120s para a operação stop para todos os recursos.

# pcs resource op defaults set create id=stop-timeout meta timeout=120s rule op stop

É possível definir o valor padrão de timeout para uma operação específica para todos os recursos de um determinado tipo. O exemplo a seguir define um valor de timeout padrão de 120s para a operação stop para todos os recursos podman.

# pcs resource op defaults set create id=podman-stop-timeout meta timeout=120s rule resource ::podman and op stop

20.2.3. Exibição dos valores padrão de operação dos recursos atualmente

configurados

O comando pcs resource op defaults exibe uma lista de valores padrão configurados atualmente para operações de recursos, incluindo quaisquer regras que você especificou.

O seguinte comando exibe os valores padrão de operação para um cluster que foi configurado com um valor de timeout padrão de 90s para todas as operações de todos os recursos podman, e para o qual foi definido um ID para o conjunto de padrões de operação de recursos como podman-timeout.

# pcs resource op defaults

Meta Attrs: podman-timeout timeout=90s

Rule: boolean-op=and score=INFINITY Expression: resource ::podman

O seguinte comando exibe os valores padrão de operação para um cluster que foi configurado com um valor de timeout padrão de 120s para a operação stop para todos os recursos podman, e para o qual foi definido um ID para o conjunto de recursos padrão de operação como podman-stop-timeout.

# pcs resource op defaults

Meta Attrs: podman-stop-timeout timeout=120s

Rule: boolean-op=and score=INFINITY Expression: resource ::podman Expression: op stop

20.3. CONFIGURAÇÃO DE MÚLTIPLAS OPERAÇÕES DE

MONITORAMENTO

Você pode configurar um único recurso com tantas operações de monitoramento quanto um agente de recursos suporta. Desta forma, você pode fazer um exame de saúde superficial a cada minuto e

progressivamente mais intenso em intervalos maiores.

NOTA

Ao configurar várias operações de monitoramento, você deve garantir que não sejam realizadas duas operações no mesmo intervalo.

Para configurar operações de monitoramento adicionais para um recurso que suporte verificações mais profundas em diferentes níveis, você adiciona um OCF_CHECK_LEVEL=n opção.

Por exemplo, se você configurar o seguinte recurso IPaddr2, por padrão isto cria uma operação de monitoramento com um intervalo de 10 segundos e um valor de timeout de 20 segundos.

# pcs resource create VirtualIP ocf:heartbeat:IPaddr2 ip=192.168.0.99 cidr_netmask=24 nic=eth2

Se o IP Virtual suporta uma verificação diferente com uma profundidade de 10, o seguinte comando faz com que o Pacemaker realize a verificação de monitoramento mais avançada a cada 60 segundos, além da verificação IP Virtual normal a cada 10 segundos. (Como observado, não se deve configurar a

operação de monitoramento adicional com um intervalo de 10 segundos também) # pcs resource op add VirtualIP monitor interval=60s OCF_CHECK_LEVEL=10

CAPÍTULO 21. PROPRIEDADES DO CONJUNTO DO

No documento Red Hat Enterprise Linux 8 (páginas 187-192)