MODELAGEM DO CUSTO DO TRANSPORTE RODOVIÁRIO DE MADEIRA UTILIZANDO REGRESSÃO LINEAR MÚLTIPLA
Vitória Castro Santos Barreto1, Gislaine Cristina Batistela2, Rogério Antonio de Oliveira3, Danilo Simões4
1Discente em Tecnologia em Produção Industrial - FATEC Botucatu, vitoriabarreto28@gmail.com 2Professora Doutora do Departamento de Engenharia de Produção – UNESP Itapeva
3Professor Doutor do Departamento de Bioestatística – UNESP Botucatu 4 Professor Doutor do Departamento de Engenharia de Produção – UNESP Itapeva
1 INTRODUÇÃO
No cenário econômico atual, segundo Scandolara et al. (2013) as indústrias florestais atuam em um ambiente competitivo e instável, tais contingências revelam cenários de imprevisibilidade e por consequência há um estudo constante para a otimização nas atividades que envolvem o processo, cujo o transporte se destaca em relação aos altos custos promovidos.
O transporte de madeira, dá-se principalmente pelo modal rodoviário sendo um dos processos de destaque nos dias atuais, pela sua alta flexibilidade na interligação entre origem e destino da carga e por outros modais não apresentarem infraestrutura suficientemente desenvolvida (MACHADO et al., 2009).
Para a otimização do custo, pode-se utilizar a análise de regressão linear múltipla que é um método estatístico que estuda o relacionamento entre variáveis dependentes e independentes e é representado por um modelo matemático para descrever a possível relação entre as variáveis. Esta metodologia, segundo Sassi et al. (2012) reduz o grande número de variáveis para poucas dimensões com o mínimo de perda de informação, permitindo a detecção dos principais padrões de similaridade, associação e correlação entre as variáveis, podendo assim estabelecer quais apresentam maior peso no custo.
Neste estudo, objetiva-se estimar o custo do transporte rodoviário de madeira para duas indústrias de base florestal localizadas no Estado de São Paulo, utlizando a técnica de regressão linear múltipla.
2 MATERIAL E MÉTODOS
A regressão linear múltipla de acordo com Sassi et al. (2012) é uma técnica utilizada quando se deseja analisar o comportamento de uma variável dependente em relação a outras
variáveis que são responsáveis pela variabilidade das observações. Assume-se que há uma relação linear entre a variável Y (variável dependente) e k variáveis independentes,
k i
Xi, 1,..., . As variáveis independentes são também chamadas variáveis explicativas ou regressoras, uma vez que são empregadas para demonstrar a variação de Y.
As fases para a construção de um modelo de regressão linear múltipla são representadas por Gazola (2002): identificação das variáveis independentes; levantamento de dados; transformação de variáveis; análise explanatória; construção do modelo; análise crítica das variáveis; análise dos resíduos e verificação da aplicabilidade do modelo.
Tem-se uma regressão linear múltipla quando se pode considerar que o valor da variável dependente é função linear de duas ou mais variáveis explanatórias (HOFFMANN, 2006). O modelo estatístico de uma regressão linear múltipla com k variáveis explanatórias é: X X kXk Y 0 1 1 2 2 ... , (1)
em que Y é a variável dependente, Xi são as variáveis independentes, i são os parâmetros do modelo (ou coeficientes de regressão) e o
é o erro aleatório do modelo.Um dos propósitos da análise de regressão, segundo Coelho-Barros (2008) é estimar os parâmetros desconhecidos do modelo. Existem diversas técnicas de estimação desses parâmetros, como, o método dos mínimos quadrados (BUSSAB; MORETTIN, 2012), o método bayesiano (BOX; TIAO, 1973), o método bootstrap (EFRON; TIBSHIRANI, 1993), entre outros.
A madeira movimentada foi procedente de três reflorestamentos de Eucalyptus spp., destinada à duas indústrias de base florestal localizadas no Estado de São Paulo que foram caracterizadas como: Indústria 1 - processa toras com 6,0 metros de comprimento e que possui uma distância média até os povoamentos florestais de 62 km; Indústria 2 - processa toras com 2,8 metros de comprimento e com distância média até os povoamentos florestais de 170 km.
Para se procederem às análises, foram considerados dois modelos de Composições Veiculares de Carga (CVC) caracterizados como: Bitrem - caminhão trator trucado com um eixo simples e um conjunto de eixos em tandem duplo, com dois semirreboques e Peso Bruto
Total Combinado (MBTC) de 57 toneladas; Tritrem - caminhão trator trucado com um eixo simples e um conjunto de eixos em tandem duplo, com três semirreboques e MBTC de 74 toneladas.
As variáveis quantitativas ponderadas foram: custo operacional do transporte rodoviário da madeira de povoamentos florestais (US$) (Y); distância do reflorestamento comercial até a indústria de base florestal (km) (X1); massa de madeira transportada (t) (X2).
Os custos operacionais foram estimados, por meio da metodologia proposta por Simões (2011) e expressos em dólar comercial americano. Devido as variáveis CVC (X3) e destino
da madeira (X4) serem qualitativas, essas foram ponderadas como binárias (0 ou 1),
conforme Wooldridge (2010).
A estimação dos parâmetros da regressão linear múltipla foi realizada pelo método dos mínimos quadrados, conforme encontrado em Bussab e Morettin (2012).
Para a seleção de modelos empregou-se o método de todos os modelos possíveis, que possibilita a análise do ajuste de modelos compostos pelos subconjuntos de variáveis explicativas e identifica os melhores desses subconjuntos, segundo critérios de avaliação (MONTGOMERY, et al. 2012). Inicialmente foram testados os modelos de regressão considerando uma variável independente de cada vez dentre as variáveis independentes (X1;
X2; X3 e X4); posteriormente foram testados os modelos de regressão ponderando
combinações de duas variáveis independentes (X1 e X2; X1 e X3; X1 e X4; X2 e X3; X2 e X4;
X3 e X4); em seguida testaram-se os modelos considerando combinações de três variáveis
independentes (X1, X2 e X3; X1, X2 e X4; X1, X3 e X4; X2, X3 e X4); e por fim ajustou-se o
modelo de regressão considerando todas variáveis independentes (X1; X2; X3 e X4).
Um dos critérios utilizados para analisar e comparar os modelos de regressão ajustados é o coeficiente de determinação múltipla 2
p
R da regressão, que representa a proporção da variação explicada pelo modelo regressão, ou seja, é uma medida de qualidade
de ajuste do modelo aos dados sendo calculado como T p E T p R p SQ SQ SQ SQ R2 1 , em que p R
SQ é a soma de quadrados da regressão, SQE p é a soma de quadrados do erro, SQ é a t
esse valor permanecer de um, maior é a explicação da variável resposta pelo modelo ajustado. Existe também uma medida que corrige o coeficiente de determinação múltipla pela quantidade p de variáveis independentes do modelo, denominado coeficiente de
determinação múltipla ajustado, 2 1
2
11 n p p
n
p R
R , com n o número total de observações. Para a seleção de um modelo ótimo, escolhe-se o modelo que tem o 2
p
R máximo. (MONTGOMERY, et al. 2012).
Outro critério utilizado foi o critério de informação de Akaike (Akaike's information
criterion - AIC), que tem com ideia principal encontrar o modelo mais parcimonioso. O AIC,
assim como outros critérios, também pode ser utilizado na decisão de inserir e remover variáveis explicativas.
A análise de regressão linear múltipla deu-se a partir do procedimento PROC REG do
software SAS (SAS INSTITUTE, 2012).
3 RESULTADOS E DISCUSSÕES
Conforme a descrição do ajuste de modelos empregou-se os critérios R²p, Rp2 e AIC para selecionar variáveis independentes que melhor explique o modelo do custo do transporte rodoviário da madeira proveniente de povoamentos florestais.
De acordo com os resultados dos critérios de seleção de variáveis apresentados na Tabela 1, 2
p
R , 2
p
R e AIC, observa-se que a variável X2 é a escolhida quando se considera
uma variável explicativa no modelo. Em relação aos subconjuntos com duas variáveis, os valores dos critérios apontam que as variáveis selecionadas são X2, X4. Já para os
subconjuntos com três variáveis as escolhidas são X1, X2, X4. Considerando todas as
variáveis explicativas (X1, X2, X3, X4), notam-se os melhores valores para os critérios de
Tabela 1 - Valores dos critérios para seleção de variáveis Variáveis no modelo R²p 2 p R AIC X1 0,0002 -0,0005 -10910,829 X2 0,8333 0,8331 -13267,966 X3 0,7066 0,7064 -12524,305 X4 0,0197 0,0189 -10936,670 X1, X2 0,8334 0,8331 -13266,970 X1, X3 0,7069 0,7064 -12523,354 X1, X4 0,1167 0,1154 -11071,837 X2, X3 0,8352 0,8349 -13281,269 X2, X4 0,8529 0,8527 -13431,198 X3, X4 0,7263 0,7259 -12613,650 X1, X2, X3 0,8353 0,8350 -13280,357 X1, X2, X4 0,9569 0,9568 -15043,787 X1, X3, X4 0,8233 0,8229 -13187,743 X2, X3, X4 0,8549 0,8545 -13446,560 X1, X2, X3, X4 0,9582 0,9580 -15081,929 Na
Tabela 2 encontram-se as estimativas dos parâmetros do modelo ajustado considerando as variáveis independentes, os erros padrão das estimativas e os valores p.
Tabela 2 - Estimativas dos parâmetros do modelo
Parâmetro Estimativa Erro Padrão Valor p 0 β 1,79 x 10-1 1,37 x 10-3 < 10-3 1 β -2,12 x 10-4 3,73 x 10-6 < 10-3 2 β -1,43 x 10-3 2,19 x 10-3 < 10-3 3 β 2,61 x 10-3 4,10 x 10-4 < 10-3 4 β -3,00 x 10-2 4,84 x 10-4 < 10-3
Desta forma, o modelo de regressão múltipla ajustado para o custo do transporte rodoviário da madeira proveniente de povoamentos florestais é expresso por
1,79 x 10-1-2,12 x 10-4(distância) 1,43 x 10-3(massa) 2,61x10 3(CVC) 3x10 2(indústria)
Cˆ .
O estudo permitiu concluir que, por meio do método de todos os modelos possíveis utilizado no processo de seleção de variáveis explicativas, os modelos ajustados que consideram subconjuntos das variáveis explicam o custo do transporte rodoviário de madeira, contudo o melhor ajuste é dado pelo modelo que pondera todas as variáveis.
A técnica de regressão linear múltipla permite ao gestor florestal inserir variáveis quantitativas e qualitativas para a elaboração de modelos matemáticos que possibilitam estimar o custo do transporte rodoviário de madeira, ademais, identificar variáveis que possam minimizar esse custo.
5 REFERÊNCIAS
AKAIKE, H. A new look at the statistical model identification. IEEE Transactions on Automatic Control, Notre Dame, v. 19, p.716-723, 1974.
BOX, G. EP; TIAO, G. C. Bayesian inference in statistical analysis. Addison-Wesely publishing company, 1973.
BUSSAB, W. O.de.; MORETTIN, P. A. Estatística Básica. São Paulo: Editora Saraiva, 2012.
COELHO-BARROS, E. A. et al. Métodos de estimação em regressão linear múltipla: aplicação a dados clínicos. Revista Colombiana de Estadística, Colombia, v. 31, n. 1, p.111-129, 2008.
EFRON, B., TIBSHIRANI, R. J. An Introduction to the Bootstrap. Monographs on Statistics and Applied Probability, v. 57, Chapman and Hall, New York, 1993.
GAZOLA, S. Construção de um modelo de regressão para avaliação de imóveis. 2002. 104f. Dissertação (Mestrado em Engenharia de Produção) – Programa de Pós-Graduação em Engenharia de Produção, Universidade Federal de Santa Catarina, Florianópolis.
HOFFMANN, R. Análise de regressão: uma introdução à econometria. São Paulos: Editora Hucitec, 2006. 378p.
MACHADO, C. C. et al. Transporte rodoviário florestal. Viçosa: UFV, 2009. 217 p.
MONTGOMERY, D. C.; PECK, E. A.; VINING, G. G. Introduction to Linear Regression Analysis. 5th edition. New York: Wiley, 2012.
SAS INSTITUTE. SAS for Windows: Version 9.4. Cary, NC, USA. 2012. 6 CD-ROM.
SASSI, C. P. et al., Modelo de regressão linear múltipla utilizando os softwares R e Statistica: uma aplicação a dados de conservação de frutas. ICMC, São Carlos, 2012.
SIMÕES, D. Modelagem estatística do frete da madeira no Uruguai. Tese (Doutorado em Agronomia), Faculdade de Ciências Agronômicas, Universidade Estadual Paulista “Júlio Mesquita Filho”, 2011.
SCANDOLARA, N. L.; ROSA, C. R. M.; COLMENERO, J. C. Utilização de um sistema de transporte intermodal para uma empresa de laminados de madeira. Revista Espacios, v. 34, n. 5, p.10-15, 2013.
WOOLDRIDGE, J. M. Introdução à econometria: uma abordagem moderna. São Paulo: Cengage Learning Editora, 2010.