Os modelos probabil´ısticos baseados em compara¸c˜oes foram primeiramente apresentados por Dahbura, Sabnani e King [46]. Todos estes modelos assumem uma probabilidade de falhas, isto ´e, a probabilidade de uma unidade produzir a sa´ıda incorreta; a diagnostica-bilidade ´e calculada com base nesta probadiagnostica-bilidade. Portanto, estes modelos n˜ao imp˜oem um limite superior sobre o limite de unidades falhas no sistema.
Existem duas abordagens probabil´ısticas b´asicas para resolver o problema do diagn´osti-co. Estas abordagens foram propostas inicialmente para o diagn´ostico cl´assico em n´ıvel de sistema; o diagn´ostico probabil´ıstico baseado em compara¸c˜oes apareceu posteriormente. A primeira abordagem ´e restringir o diagn´ostico a um conjunto de unidades falhas, com uma probabilidade suficientemente alta [87, 142]. A outra abordagem ´e realizar o diagn´ostico
para todo o sistema, e ent˜ao provar que o diagn´ostico ´e correto com uma alta probabilidade [24, 24, 25, 46, 163]. Em muitos casos, estes modelos refletem o ambiente real de falhas de uma maneira mais precisa, mas eles s˜ao geralmente mais dif´ıceis de analisar.
No modelo de diagn´ostico probabil´ıstico baseado em compara¸c˜oes proposto por Dahbura, Sabnani e King [46], o sistema ´e tamb´em representado por um grafoG= (V, E).
Tarefas tamb´em s˜ao enviadas para pares de unidades e as sa´ıdas das tarefas s˜ao compara-das para identificar as unidades falhas. A cole¸c˜ao de tocompara-das as sa´ıcompara-das ´e tamb´em chamada de s´ındrome do sistema. As asser¸c˜oes b´asicas do sistema s˜ao:
— m ´e o n´umero total de diferentes poss´ıveis sa´ıdas incorretas que um pro-cessador falho pode produzir para uma tarefa;
— Wi | 1≤i≤m´e uma das m poss´ıveis sa´ıdas incorretas para uma tarefa;
— P(Wi) ´e a probabilidade de que uma unidade falha produza a sa´ıda in-correta Wi para uma tarefa; e,
— p ´e a probabilidade de que uma unidade falha produza a sa´ıda correta para uma tarefa.
Os seguintes resultados s˜ao obtidos a partir da avalia¸c˜ao deste modelo [46]:
1. a probabilidade P1,0, de que a compara¸c˜ao de duas sa´ıdas indique igual-dade, ´e igual a pquando uma das unidades que produziu a sa´ıda ´e falha, e
2. a probabilidade P2,0, de que a compara¸c˜ao de duas sa´ıdas indique igual-dade, ´e igual a p2 +P(W1)2+...+P(Wm)2 quando ambas as unidades que produziram as sa´ıdas s˜ao falhas.
Os autores assumem que a distribui¸c˜ao de probabilidades para uma unidade produzir resultado incorreto ´e uniforme; ent˜ao ∀i, P(Wi) = (1−p)/m. Assim, a probabilidade de que a compara¸c˜ao das sa´ıdas de duas unidades falhas resulte em igualdade ´e P2,0 = p2+ ((1−p)2/m). Al´em disso, assume-se que m´e extremamente grande, ent˜aoP2,0 ≈p2.
Outro modelo probabil´ıstico e baseado em compara¸c˜oes foi proposto por Pelc em [156].
Neste modelo, tamb´em chamado de modelo (p, k)-probabil´ıstico, a mesma tarefa com k sa´ıdas poss´ıveis ´e enviada `as unidades. Cada unidade possui a mesma probabilidade p <1/2 de se tornar falha e a falha de unidades distintas ocorre de forma independente.
Este modelo assume que:
— unidades sem-falha sempre retornam sa´ıdas incorretas; e,
— unidades falhas retornam sa´ıdas incorretas de forma independente, com uma probabilidade uniforme 1/k para cada uma, mas eventualmente as sa´ıdas de duas unidades falhas podem ser idˆenticas.
Assim como nos primeiros modelos baseados em compara¸c˜oes, as sa´ıdas das tarefas s˜ao comparadas e o resultado, igualdade (0) ou diferen¸ca (1), ´e ent˜ao usado para identificar as unidades falhas no sistema. A probabilidade de uma igualdade ser o resultado da compara¸c˜ao das sa´ıdas produzidas por duas unidades, uma sem-falha e outra falha, ou ent˜ao por duas unidades falhas, ´e q = 1/k. Esta ´e a diferen¸ca deste modelo para o modelo proposto por Dahbura, Sabnani e King, no qual a probabilidade de se obter uma resposta incorreta de um processador falho ´e muito menor do que a da resposta correta.
Assim, no modelo de Dahbura, Sabnani e King, a probabilidade da compara¸c˜ao resultar em igualdade para a compara¸c˜ao de duas unidades falhas ´eq2.
No modelo de Pelc um sistema ´e chamado de diagnostic´avel se para qualquer s´ındrome poss´ıvel, existe um ´unico conjunto mais prov´avel de unidades falhas gerando esta s´ındrome. Se este conjunto existe, ele ´e diagnosticado como as unidades falhas do sistema. Considerando o modelo (p, k)-probabil´ıstico, os autores provam que:
1. Um sistema com duas unidades (N = 2) n˜ao ´e diagnostic´avel.
2. Assumindo que p < 1/(k + 1), um sistema ´otimo diagnostic´avel com N >2 unidades possui N −[N/3] arestas ou links de conex˜ao.
3. Os problemas dodiagn´osticoe dadiagnosticabilidades˜ao NP-dif´ıceis (NP-hard), neste modelo, para sistemas de topologias arbitr´arias.
Blough e Pelc em [23] apresentam um algoritmo polinomial de diagn´ostico para o modelo de Pelc [156], considerando uma grande classe de sistemas representados por grafos bipartidos, que incluem hipercubos, grades e florestas. Eles tamb´em mostram que o diagn´ostico ´otimo para sistemas de topologia geral ´e NP-dif´ıcil. Um algoritmo de tempo linear para realizar o diagn´ostico ´otimo em um anel tamb´em ´e apresentado.
Outro modelo probabil´ıstico baseado em compara¸c˜oes ´e apresentado por Rangarajan e Fussel em [163] e ´e baseado na avalia¸c˜ao de m´ultiplas s´ındromes, ao inv´es de apenas uma. Em [89] os mesmos autores prop˜oem um algoritmo para este modelo, no qual a probabilidade do diagn´ostico correto se aproxima de 1 quando o n´umero de testes realizados em cada processador ´e ligeiramente maior que log2N. Em [128] um algoritmo
´otimo para o mesmo modelo ´e apresentado. Uma solu¸c˜ao para o diagn´ostico probabil´ıstico de sistemas esparsamente interconectados ´e apresentada em [38].