Injecç ão de SQL - Detecç ão de vulnerabilidades espec´ıficas de aplicaç ões web

2.4 Detecç ão de vulnerabilidades espec´ıficas de aplicaç ões web

2.4.1 Injecc¸ ˜ao de SQL

Umainjecç ão de SQL[18] é uma vulnerabilidade do tipo de injecç ão de c ódigo (A1) [7] onde o atacante usainputsespecialmente criados de forma a enganar a base de dados para consequentemente poder executar instruç ões n ão pretendidas pela aplicaç ão.

Assim, um ataque de injecç ão de SQL ocorre quando um atacante altera a sintaxe e/ou sem ântica de umaquery inserindo operadores ou palavras chave SQL. Uma vulnerabilidade deste tipo tira partido da falta de validaç ão, sanitizaç ão ou codificaç ão doinputdo utilizador. Os ataques sobre este tipo de vulnerabilidade que t êm efeito imediato sobre o comportamento do alvo s ão designados de primeira ordem. Nos ataques de segunda ordem, primeiro o atacante fornece à aplicaç ão um input que é armazenado na base de dados e posteriormente, o atacante fornece um segundoinput que cria uma query para extrair aquele que estava armazenado, criando uma segundaquery modificada.

Um exemplo de um ataque de injecç ão de SQL de primeira ordem é o seguinte: uma aplicaç ão webfaz um acesso a base de dados de forma a aceitar as credenciais (utilizador, pin) fornecidas pelo utilizador sendo o pedido à base de dados o seguinte:

SELECT info FROM users WHERE login=’$utilizador’ AND pin=$pin

Um caso normal de funcionamento é o utilizador definir, por exemplo, o utilizador=Miguel e pin=1234sendo a interpretaç ão feita pela base de dados a seguinte:

SELECT info FROM users WHERE login=’Miguel’ AND pin=1234

Pelo contr ário, caso o atacante forneça oinput: utilizador= ’ OR 1=1 - - e qualquerpin, a instruç ão que vai ser interpretada na base de dados é:

SELECT info FROM users WHERE login=’’ OR 1=1 -- AND pin=1234

Isto vai fazer com que a base de dados interprete tudo ap ós otokenWHEREcomo uma condiç ão e com a inclus ão deOR 1=1na cl áusula vai tornar esta condiç ão uma tautologia. Como a parte posterior

est á comentada atrav és dos caracteres- - , faz com que a base de dados devolva toda a informaç ão correspondente a tabelausers.

Apesar dos ataques de injecç ão de SQL serem populares h á quase uma d écada, recentementeRay e Ligatti argumentaram que a definiç ão de ataques de injecç ão de c ódigo como os de injecç ão de SQL é problem ática, introduzindo o conceito de CIAO (Code-Injection Attacks on Outputs) [6].

Normalmente, uma injecç ão de SQL ocorre sempre que uminputde um utilizador modifica a estrutura sint áctica dooutput de determinada aplicaç ão. No entanto, os autores referem que esta definiç ão tem alguns problemas, pois existem casos que este tipo de ataques n ão alteram a estrutura, enquanto que h á casos de n ão-ataques que alteram essa estrutura.

De forma a resolver esta situaç ão,Ray e Ligatti definiram a noç ão de injecç ão de c ódigo atrav és de 11 exemplos de injecç ões definindo quais delas s ão consideradas como c ódigo e quais n ão. De seguida s ão apresentados os exemplos (elementos que foram injectados naquery a sublinhado) que permitiram definir a noç ão de injecç ão de c ódigo. Tamb ém se pode observar na Tabela 2.1 quais dos exemplos cont êm injecç ões de c ódigo.

1. SELECT balance FROM acct WHERE password=’’ OR 1=1 --2. SELECT balance FROM acct WHERE pin = exit();

3. ...WHERE pin = 1000>GLOBAL;

4. SELECT * FROM properties WHERE filename=’f.e’

5. ...WHERE pin = exit();

6. ...WHERE pin = aaaa();

7. SELECT * FROM t WHERE flag= TRUE;

8. SELECT * FROM t WHERE flag= aaaa;

9. SELECT * FROM t WHERE password= password;

10. CREATE TABLE t (name CHAR(40)) 11. SELECT * FROM t WHERE name=’x’

1 2 3 4 5 6 7 8 9 10 11

Ray e Ligatti Sim Sim Sim N ão Sim Sim N ão Sim Sim Sim N ão

Tabela 2.1: Definiç ão de injecç ão de c ódigo segundo Ray e Ligatti atrav és de 11 exemplos explicitando em quais destes o conte údo injectado é c ódigo (casos com Sim) ou n ão (casos com N ão).

Para a detecç ão deste tipo de vulnerabilidade existem duas formas gen éricas de a efectuar que s ão as seguintes [18, 19, 20, 21, 22, 23]:

1. Verificaç ão se s ão utilizados operadores ou caracteres especiais da linguagem devido a falta de validaç ão doinput [22];

2. Verificaç ão se existe uma alteraç ão da estrutura l ógica da instruç ão de SQL da estrutura pretendida pelo programador com o uso deinput correcto [18, 19, 20, 21, 23].

Em relaç ão ao primeiro ponto, em [22] utilizam-se express ões regulares de forma a detectar este tipo de vulnerabilidade atrav és da t écnica detaintingpositivo. Esta t écnica consiste na identificaç ão e marcaç ão de caracteres definidos como seguros, ao inv és de outras soluç ões que marcam os caracteres perigosos e que devem ser rejeitados. A soluç ão faz uma avaliaç ão da sintaxe dasqueriesantes de serem processadas pela base de dados e bloqueia todas as que contenham pelo menos um caracter sem estar marcado. Nesta soluç ão utilizou-se um sistema de detecç ão de intrus ões baseado na rede (NIDS) de forma a escutar os pacotes enviados e verificar a exist ência das express ões regulares no conte údo destes.

A soluç ão proposta em [22] n ão é eficiente dado que esta soluç ão utiliza um NIDS de forma a escutar os pacotes observados e detectar se estes podem causar uma injecç ão de SQL. A soluç ão proposta n ão garante que a aplicaç ão n ão possui mecanismos de validaç ão e sanitizaç ão no momento em que processa os pedidos de forma a evitar que um ataque destes ocorra e como tal n ão seria vulner ável.

Assim, esta soluç ão poderia identificar que determinado pedido é pass´ıvel de um ataque de injecç ão de SQL quando na verdade seria sanitizado pela aplicaç ão j á n ão sendo perigoso para esta.

Em relaç ão ao segundo ponto, existem v árias alternativas de detecç ão. A soluç ão apresentada por Halfond e Orso [18, 19], o sistemaAMNESIA, pretende detectar estes ataques atrav és de an álise est ática de c ódigo e da monitorizaç ão da aplicaç ão em tempo de execuç ão. Esta an álise est ática consiste na identificaç ão de pontos no c ódigo onde se efectuamqueriesSQL de uma forma autom ática. De seguida para cada ponto referido anteriormente constr ói-se um modelo que representa todas asqueriesSQL que podem ser geradas naquele ponto atrav és de um aut ómato finito n ão-determinista cujas transiç ões s ãotokensSQL: operadores ou caracteres da linguagem. Em tempo de execuç ão, a t écnica monitoriza asqueriesgeradas dinamicamente e verifica se est ão de acordo com o modelo est ático. Caso sejam diferentes, indica que o modelo gerado foi violado e como tal, classifica o pedido como um ataque.

Esta soluç ão, n ão pode ser utilizada neste trabalho dado que efectua a detecç ão recorrendo a estrutura interna da aplicaç ão, atrav és da an álise do c ódigo, inserindo-se na categoria de teste white-box.

A soluç ão apresentada em [23], difere apenas da anterior em relaç ão a estrutura de dados escolhida para fazer a comparaç ão que ao inv és de utilizar um aut ómato, efectua uma comparaç ão entre árvores que representam a estrutura dasqueries.

A soluç ão proposta por Huang, Huang e Lin [20], pretende detectar vulnerabilidades sem aceder à estrutura interna da aplicaç ão alvo de teste, utilizando apenas engenharia reversa para a identificaç ão dos pontos de entrada deinputpara a base de dados. Esta soluç ão baseia-se na an álise das respostas da aplicaç ãowebtendo em conta os seguintes aspectos:

• Exist ˆencia de erros provenientes da base de dados;

• Comparaç ão da resposta proveniente da aplicaç ão com outras duas: resposta proveniente de um pedido inv álido; resposta proveniente de um pedido ”v álido”, isto é, um pedido que contorne

todos os mecanismos de validaç ão por parte da aplicaç ão atrav és doInjection Knowlegde Manager (IKM).

O IKM é uma estrutura que cont ém informaç ão relativa aos pontos de entrada deinput para a base de dados, as vari áveis alvo doinput do utilizador como as suas restriç ões, por exemplo, n úmero de caracteres que uma determinada vari ável pode conter. Dado que o IKM cont ém essas informaç ões, consegue gerar pedidos que contornem essas restriç ões.

Esta soluç ão n ão é eficiente, dado que existem casos que a comparaç ão das respostas pode ser inconclusiva em termos da exist ência ou n ão de vulnerabilidades, situaç ão que se pretende evitar como soluç ão deste trabalho.

Por fim, o mecanismo de detecç ão proposto em [21] tamb ém baseia-se no princ´ıpio de que uma injecç ão de SQL altera as estrutura dasqueriessolicitadas, como nos sistemas propostos em [18, 19, 23].

Esta t écnica implementada pelo sistemaCANDIDpretende comparar a estrutura dasqueriesatrav és de inputscandidatos. Estesinputscandidatos s ão benignos e pretendem deduzir de forma din âmica qual é a estrutura pretendida dasqueriespelo programador da aplicaç ão num determinado ponto que recebe input proveniente do utilizador. Esta an álise da estrutura dasqueries é feita a partir da instrumentaç ão da aplicaç ãowebpara que intercepte o processamento destes pedidos SQL.

De forma a poder-se inferir a exist ência de um ataque é necess ário comparar a estrutura obtida atrav és doinput candidato e oinput enviado que pretende testar a aplicaç ão. Caso a estrutura seja igual, pode-se concluir que oinput é v álido e seguro para a base de dados. Caso contr ário, pode indicar a possibilidade daqueleinput despoletar um ataque à aplicaç ão.

O sistema CANDID proposto em [21] parece ser uma soluç ão apropriada para o trabalho em quest ão dado que efectua uma comparaç ão dasqueriesbenignas e as que se pretendem testar e porque utiliza um mecanismo de instrumentaç ão para analisar a estrutura queries de SQL a serem processadas na aplicaç ão. No entanto, esta abordagem necessita que se altere a aplicaç ão alvo e al ém disso, a extracç ão das estruturas dasqueries é efectuada por uma ferramenta deparsingexterna ao sistema de gest ão de base de dados podendo assim falhar na extracç ão da estrutura.

No documento Framework para Detecção Automática de Vulnerabilidades em Aplicações Web usando Fuzzing (páginas 32-35)