• Nenhum resultado encontrado

O Sistema SAS 1. I - O ambiente SAS:

N/A
N/A
Protected

Academic year: 2021

Share "O Sistema SAS 1. I - O ambiente SAS:"

Copied!
9
0
0

Texto

(1)

1

Este tutorial foi escrito para versões mais antigas do SAS, por isso pode apresentar algumas diferenças visuais e funcionais com as versões atuais. De qualquer forma, todos as instruções aqui presentadas funcionam normalmente.

O Sistema SAS

I - O ambiente SAS:

O Sistema SAS é um sistema integrado de software que permite o desenvolvimento de entradas, recuperação e manipulação de dados, análises estatísticas e matemáticas, relatórios, entre outros. Seu ambiente é formado por três janelas principais:

a) PROGRAM EDITOR: editor de programas.

b) LOG: janela de avisos e mensagens de erros durante a execução dos programas. c) OUTPUT: janela com saídas de programas.

Obs: 1) Logo abaixo da linha de menu, existe uma caixa de comando para a execução direta de comandos específicos, válidos sempre para a janela ativa.

 

II - Criando um programa SAS:

Os programas SAS podem ser criados através do editor SAS (janela PROGRAM EDITOR) ou de qualquer outro editor de texto que grave arquivos no formato ASCII.

Um programa SAS é formado basicamente por dois módulos:

i) DATA: destina-se à declaração e manipulação dos dados aceitando comandos de programação (tipo turbo pascal).

ii) PROC: com procedimentos para análise de dados, gráficos e relatórios. Na janela PROGRAM EDITOR, um programa SAS é composto pelos comandos:

data Exemplo;

input var1 var2 ... vark ; cards;

 identifica o conjunto de dados  declaração das variáveis

 identifica o início do conjunto de dados ...

...

dados ...

 entrada de dados

;  o ; finaliza o conjunto de dados. ...

...

procedimentos ...

(2)

que • identificado por SASdataset, o qual ser‚ analisado atrav•s dos prodecimentos definidos a partir do final do conjunto de dados, indicado pelo ponto e vƒrgula.

Obs: 1) Cada linha de comando deve ser encerrada por um ponto-e-vƒrgula “ ; ”. As linhas de dados n†o devem ser encerradas por e-vƒrgula. Um ‡nico ponto-e-vƒrgula deve ser colocado apˆs a ‡ltima observa‰†o, indicando o final dos dados.

Regras para nomes no SAS:

Os nomes no SAS s†o usados para denominar conjuntos de dados, vari‚veis e outros ƒtens. Um nome SAS pode ter de 1 a 8 caracteres sendo que o 1o caracter deve ser uma letra ou um “underscore” ( _ ). Brancos n†o podem ocorrer em nomes SAS.

Var‚veis alfanum•ricas s†o identificadas atrav•s do sƒmbolo " $ " apˆs o nome. Por exemplo: INPUT nome $ sexo $ idade altura peso. Neste caso as vari‚veis nome e sexo s†o alfanum•ricas.

III - Lendo um arquivo de dados externo:

Acrescentando o comando INFILE antes do INPUT, podemos usar um arquivo de dados externo.

Exemplo:

DATA Exemplo;

INFILE 'C:\...caminho...\nome.ext'; INPUT var1 var2;

...

...

procedimentos ...

Obs: 1) Note que agora n†o precisamos do comando CARDS.

2) O arquivo nome.ext deve estar no formato ASCII e n†o deve conter os nomes das vari‚veis, ou seja, deve conter apenas as observa‰Šes.

3) Tamb•m podemos utilizar um arquivo de dados atrav•s do comando INCLUDE.

IV - Executando um programa SAS:

Clicar no bot†o Submit ou pressionar a tecla F8.

Obs: 1) Pode-se ainda, executar o comando SUBMIT na caixa de comandos, com a janela PROGRAM EDITORativa).

2) Pode-se executar o programa todo, ou partes deste, desde que sejam devidamente marcadas.

(3)

V - Principais comandos do SAS:

No Sistema SAS existem algums comandos específicos que podem ser utilizados diretamente através da caixa de comandos ou mesmo através de teclas de atalho (F-Keys). Alguns comandos são relacionados abaixo:

Comando Tecla de atalho

(F-Key) Descrição

HELP F1 Aciona a janela HELPdo SAS

PGM F5 Move o cursor para a janela PROGRAM EDITOR LOG F6 Move o cursor para a janela LOG

OUTPUT F7 Move o cursor para a janela OUTPUT ZOOM OFF;

SUBMIT F8

Restaura a janela ativa ao tamanho original;

Executa os comandos selecionados quando a janela PROGRAM EDITORestiver ativa

KEYS F9 Edita as teclas de atalho2

2

Podemos editar as teclas F-keys e reconfigurá-las.

Existem, ainda, outros comandos, dos quais destacamos: - CLEAR: limpa a janela ativa (ou ctrl+E).

- TILE: organiza lado-a-lado as janelas PROGRAM EDITOR, LOGe OUTPUT. - NEXT: move o cursor para a janela seguinte.

- BYE / ENDSAS: encerra o programa SAS.

- FILE: grava o conteúdo de uma janela ativa num arquivo.

- INCLUDE: abre um programa SAS na janela EDITOR ou incluí um conjunto de dados no corpo de um programa.

- LINESIZE = n (ou LS = n): 64n132, define o comprimento da linha*. default LS = 132.

- PAGESIZE = n (ou PS = n): especifica o número de linhas da página*. default PS = 60.

- MISSING = 'caracter' : especifica caracter como valor perdido (missing value). * Os comandos PS e LS devem aparecer de preferência no início do programa.

(4)

VI - Principais procedimentos do SAS:

Todo procedimento SAS vem identificado pela palavra PROC e pode apresentar diversas op‰Šes e subcomandos especƒficos. A estrutura dos PROC’s s†o basicamente a mesma para todos, conforme descri‰†o abaixo:

Sintaxe: PROC NOME opções; <declarações>;

VI.I - A seguir, apresentaremos os principais procedimentos do SAS: A) Procedimentos de estatƒsticas descritivas :

PROC CORR– fornece correla‰Šes e medidas de associa‰†o. PROC MEANS– estatƒsticas descritivas.

PROC UNIVARIATE– estatƒsticas descritivas, incluindo quantis e plots descritivos.

PROC CHART– histogramas e gr‚ficos.

PROC TABULATE– tabelas com estatƒsticas descritivas.

PROC TTEST– compara m•dias de dois grupos de vari‚veis atrav•s do teste t. B) Procedimentos para impress†o:

PROC PRINT– mostra o conte‡do de SASdataset na janela OUTPUT. PROC FORMS–formas padrŠes, por exemplo mala direta.

PROC PLOT– para construir gr‚ficos.

PROC TIMEPLOT– para gr‚ficos de uma ou mais vari‚veis na ordem temporal. PROC CALENDAR– para construir calend‚rios.

C) Procedimentos de regress†o e an‚lise de vari•ncia:

PROC REG – ajusta uma regress†o linear com v‚rias op‰Šes de diagnˆsticos e diversos m•todos para sele‰†o de modelos.

PROC NLIN– ajusta modelos de regress†o n†o lineares.

PROC ANOVA – para an‚lise de vari•ncia, an‚lise de vari•ncia multivariada, an‚lise de vari•ncia com medidas repetidas em experimentos balanceados, compara‰Šes m‡ltiplas.

PROC GLM – ajusta modelos lineares gerais (regress†o simples, m‡ltipla, polinomial e ponderada, faz an‚lise de vari•ncia para dados desbalanceados).

PROC VARCOMP– para componentes de vari•ncia.

PROC LIFEREG– ajusta modelos param•tricos para dados de tempos de vida. D) Procedimentos para dados multivariados:

PROC PRINCOMP– faz an‚lise de componentes principais. PROC CANCORR– faz an‚lise de correla‰†o canŽnica.

PROC FACTOR– faz an‚lise de fatores ortogonais com rota‰Šes. PROC CLUSTER– faz an‚lise de cluster (ou agrupamentos ).

(5)

E) Procedimentos n†o param•tricos e para dados categˆricos:

PROC NPAR1WAY– an‚lise n†o param•trica one-way para ranks. PROC CATMOD – para tabelas de conting€ncia.

PROC FREQ – faz distribui‰Šes de frequ€ncia para vari‚veis categˆricas e tabelas cruzadas.

PROC LOGIST– ajusta modelos logƒsticos.

PROC PROBIT– faz regress†o probit, logƒstica e logƒstica ordinal. F) Procedimentos Utilit‚rios:

PROC APPEND– anexa dados de um data set no fim de um outro data set. PROC COMPARE – compara os conte‡dos de dois data set's.

PROC FORMAT – define formatos de saƒda e de leitura de dados. PROC SORT– ordena os dados de um SASdataset.

(6)

VII - O procedimento PROC UNIVARIATE: Estatísticas descritivas, incluindo quantis e plots descritivos para variáveis numéricas.

Sintaxe: PROC UNIVARIATE opções; var <variáveis>;

by <variáveis>; freq <variáveis>; weight<variáveis>; id <variáveis>;

output out=SASdataset Keyword=<nomes>;

onde: 1) Opções:

DATA=SASdataset – especifica o conjunto de dados. NOPRINT – não mostra as saídas.

PLOT – opções de gráficos (ramos-folhas, box-plot, normal-plot). FREQ – faz tabela de frequência.

NORMAL – faz teste de normalidade dos dados, se n<51 faz o teste de Shapiro-Wilks, se n51 faz o teste de Kolmogorov-Sirnov. PCTLDEF=k – especifica o método para o cálculo dos quartis,

k = 1, 2, 3, 4 ou 5 (default k = 5).

VARDEF=df/weight/n/wdf – especifica o divisor para o cálculo da variância (default =df), onde:

df = graus de liberdade, weight = soma dos pesos, n = número de observações,

wdf = soma dos pesos menos 1 (w-1).

ROUND=n – especifica as unidades para arredondamento

2) Descrição das declarações:

var –lista de variáveis para o PROC UNIVARIATE (default = todas). * usar sempre após uma declaração de output.

by –separa as análises em subgrupos definidos pela variável declarada.

* os dados devem estar ordenados em ordem crescente pela variável em questão.

freq –considera os valores da variável como frequências. * se os dados não são inteiros, os valores são truncados.

weight –variável com pesos para o cálculo da média e variância ponderadas ( xW e sW2).

* – valores negativos são considerados como zero. só para calcular xW e sW2 .

id –usado para identificar as observações (ou casos). * Considera os 8 primeiros caracteres.

(7)

output – requisita um arquivo interno de saƒdas.

out = SASdataset – define o nome do arquivo interno de saƒdas. keyword = nomes – identifica as estatƒsticas desejadas.

* o comando OUTPUT grava o conte‡do da memˆria RAM num arquivo SASdataset. Gravar as saƒdas num SASdataset n†o • o mesmo que salvar num arquivo definitivo, o que pode ser obtido atrav•s do comando FILE. Os conte‡dos dos SASdataset se perdem quando ao sair do SAS. Os nomes definidos atrav•s da op‰†o keyword podem ser:

N – n‡mero de observa‰Šes consideradas para os c‚lculos (menos MISSING). NMISS – n‡mero de valores perdidos.

NOBS – n‡mero total de observa‰Šes. MEAN – m•dia aritm•tica.

SUM – soma das observa‰Šes. STD – desvio padr†o.

VAR – vari•ncia.

SKEWNESS – medida de simetria. KURTOSIS – curtosi.

SUMWGT – soma dos pesos. MAX – valor m‚ximo.

MIN – valor mƒnimo.

RANGE – amplitude amostral (MAX-MIN). Q3 – terceiro quartil.

MEDIAN – mediana. Q1 – primeiro quartil.

QRANGE – amplitude interquartil (Q3-Q1). P1 – 10percentil (quantil 0.01). P5 – 50percentil (quantil 0.05). P10 – 100percentil (quantil 0.10). P90 – 900percentil (quantil 0.90). P95 – 950percentil (quantil 0.95). P99 – 990percentil (quantil 0.99).

(8)

VIII - O procedimento PROC MEANS: Estatƒsticas descritivas para vari‚veis num•ricas. Sintaxe: PROC MEANS opções;

var <variáveis>; by <variáveis>; class <vari‚veis>; freq <variáveis>; weight <variáveis>; id <variáveis>;

output out=SASdataset Keyword=<nomes>;

Principais op‰Šes:

DATA=SASdataset – especifica o conjunto de dados. NOPRINT – n†o mostra as saƒdas.

MAXDEC – n‡mero de casas decimais para os resultados (0 a 8). FW – tamanho do campo para impress†o.

Declara‰Šes:

var – lista de vari‚veis para o PROC MEANS (default = todas). by – especifica subgrupos.

class – especifica as vari‚veis que definem subgrupos. freq – considera os valores da vari‚vel como frequ€ncias.

weight –vari‚vel com pesos para o c‚lculo da m•dia e vari•ncia ponderadas. id – usado para identificar as observa‰Šes (casos).

output – requisita um arquivo interno de saƒdas.

out = SASdataset – define o nome do arquivo interno de saƒdas. keyword = nomes – identifica as estatƒsticas desejadas.

Os nomes definidos atrav•s da op‰†o keyword podem ser:

MEAN RANGE

MAX STD

MIN SUM

N SUMWGT

NMISS VAR

CV – coeficiente de varia‰†o (porcentagem). STDERR – erro padr†o da m•dia.

USS – soma de quadrados n†o corrigida. CSS – soma de quadrados corrigida.

T – valor tpara testar se a m•dia da popula‰†o • zero. PRT –P T

t

, onde T ~ t-Student.

(9)

IX - O procedimento PROC PRINT: Imprime os valores das variáveis de um arquivo de dados na janela OUTPUT.

Sintaxe: PROC PRINT data=nome;

var <variáveis>;  seleciona variáveis. by <variáveis>;  especifica subgrupos.

sum <variáveis>;  apresenta a soma das variáveis selecionadas.

* A opção data=nome define o SASdataset a ser impresso. Se este não for definido, o último SASdataset utilizado pelo SAS será considerado.

Referências

Documentos relacionados

A análise da variação mensal do saldo das vagas de trabalho das grandes empresas localizadas nos municípios de Canoas e Horizontina aponta que o crescimento do emprego na

• CCR MSVia e ANTT apoiam o Projeto Policiais Contra o Câncer Infantil em MS 6 InStItuCIonAl • Campanha: Estrada para a Saúde em Campo Grande • De casa nova 7 novEMBro Azul

IMPORTANTE Para usar o relógio de forma efeciente ao exercitar, ou seja, para calcular as calorias consumidas e o índice de aptidão, É NECESSÁRIO ajustar os limites

Pressione ST/SP/+ ou MODE/- para inserir o limite superior de frequência cardíaca e, a seguir, pressione SET/LAP para confirmar.. Continue a definir as seguintes opções

Foi instalado um Datalogger modelo Multilog LX GPRS número 7382 com 1 canal de pressão analógico e 1 canal de vazão digital pulso seco, equipado com chip da operadora

Este estudo objetivou comparar dados da atenção em saúde bucal do município de Matozinhos (MG), ainda não inserida na Estratégia de Saúde da Família - ESF com os mesmos dados

De volta à página “Meus Projetos”, você pode acompanhar o andamento de todos os seus projetos inscritos – inclusive editar a ficha de projeto e acompanhar o envio de

Nas se¸c˜oes anteriores n´os usamos o princ´ıpio da equivalˆencia para obter os efeitos da gravidade em sistemas f´ısicos de acordo com o seguinte m´etodo: escrevemos as