• Nenhum resultado encontrado

(RB867515) Santa Luzia

4.4 Predição da produtividade da cana-de-açúcar

4.4.1.1 Subconjuntos de atributos

Das 6141 possibilidades de regressões, somente 2209 foram efetivamente concluídas, pois em situações onde há muitos atributos e poucas amostras (i.e. uma única fazenda com todos os atributos), o AIC (Akaike information criterion) utilizado como métrica para seleção de variáveis no método Stepwise, é infinito, não sendo possível realizar a regressão. Logo, foram gerados muitos modelos com bom desempenho, porém com muitas variáveis (totalmente irreprodutíveis) ou superajustados (overfitting), ou seja, quando um modelo se ajusta muito bem ao conjunto de dados, se torna ineficaz para prever novos resultados (dados não apresentados). Excluindo esses modelos superajustados, obtiveram-se modelos mais interpretáveis e aplicáveis (Tabela 7).

Os modelos gerados para a fazenda Boa Vista (RB867515) a partir dos subconjuntos de atributos (Figura 8) apresentaram os melhores ajustes, além do maior número de modelos viáveis quando comparados à Santa Luzia (RB855156) e aos que integram as duas fazendas (Tabela 7).

Tabela 7. Melhores modelos de regressão multivariadas pelo método stepwise. A primeira coluna se refere ao número (identificação) da regressão; a segunda aos dados da fazenda Santa Luzia (SL), Boa Vista (BV) ou ambas (BVSL); a terceira às variáveis selecionadas e as demais, aos ajustes da calibração (cal) e validação (val) das regressões, além da diferença entre R² da calibração e da validação (ΔR²). Reg Faz Variáveis RMSE cal RMSE val RPD cal RPD val cal val ΔR² 383 BV NCOL2, NCOL3, ALT3, NDVI2, CCCI2 8,78 12,36 2,06 1,46 0,75 0,54 0,21 6 BV pH020, ARG020, NCOL1, ALT1, DIAM1 9,45 12,56 1,91 1,44 0,71 0,51 0,20 593 BV NCOL2, IAF2, NDVI2, NDRE3 9,54 12,61 1,89 1,43 0,71 0,51 0,20 38 BV NCOL1, IAF1, ALT1, CLORO3, NCOL4 8,45 12,80 2,14 1,41 0,77 0,50 0,27 389 BV CLORO3, NCOL4, NDRE2 9,70 12,71 1,86 1,42 0,70 0,49 0,20 410 BV NCOL2, IAF2, NDVI2 10,42 13,35 1,73 1,35 0,65 0,45 0,20 1596 BV NCOL2, NDVI2, Mg-folha, IAF2 9,50 13,68 1,90 1,32 0,71 0,44 0,26 718 BV NCOL1, IAF1, ALT1, CLORO3, NDVI3 10,36 14,06 1,74 1,29 0,65 0,40 0,25 2024 BV NDVI2, NDRE3, Ca-folha 11,55 13,92 1,56 1,30 0,57 0,39 0,18 203 SL IAF2, DIAM2, NDRE1, NCOL4 13,27 17,25 1,68 1,29 0,63 0,39 0,24 1677 BVSL NCOL4, NDRE1, NDRE2, NDVI2, B-folha 13,34 15,71 1,50 1,28 0,55 0,38 0,16 1121 BVSL NCOL4, NDVI2, P-folha, K-folha, NDVI1 13,31 15,86 1,51 1,26 0,55 0,38 0,17 537 BVSL IAF1, NCOL4, NDVI1, NDVI2, NCOL1 13,51 15,98 1,48 1,25 0,53 0,37 0,16

Nesse trabalho foi possível verificar que nos melhores modelos, as variáveis que aparecem com maior frequência são NCOL, ALT, IAF, e NDVI. Entretanto, apesar dos ajustes não serem satisfatórios para modelos que apresentaram melhores desempenhos, as variáveis contidas neles indicam que são as principais a serem analisadas quando o intuito é predizer a produtividade da cana. Isso está de acordo com o observado no item 4.4, onde o número de colmos e altura são os fatores que mais se relacionaram com TCH.

Os parâmetros (variáveis) de grande influência nos modelos de predição da produtividade da cana-de-açúcar se mostraram complementares: o volume de um canavial pode ser expresso pelo produto entre número de colmos, altura e diâmetro (este último com menor impacto em função do alto coeficiente de variação); o índice de área foliar estima o potencial de transpiração, respiração e fotossíntese (PEREIRA et al., 2015) e o NDVI possui associação direta com a quantidade de biomassa, índice de área foliar, cobertura do solo e interceptação da radiação (RUDORFF; BATISTA, 1990; WIEGAND; EVERITT; RICHARDSON, 1992).

Assumindo que as práticas de agricultura de precisão estão sendo cada vez mais adotadas pelas usinas e que essa abordagem de gestão demanda diversos levantamentos de dados, é possível identificar modelos factíveis para predição, por exemplo, o nº 6 (Tabela 7), que integra características importantes do solo como pH e argila de 0-20 cm e parâmetros biométricos que descrevem o volume da planta, como número de colmos, altura e diâmetro. Muitas vezes esse levantamento já é frequentemente realizado pelas usinas, por conta da amostragem para aplicação de fertilizantes em taxas variáveis e biometrias próximas à colheita, que são realizadas manualmente, porém há propostas de automação sendo desenvolvidas que podem ser aplicáveis à cana (SCHEPERS; HOLLAND; FRANCIS, 2017). A diferença seria que esse levantamento biométrico deveria ser feito num estágio inicial, e de forma espacializada através de algum tipo de sensoriamento que permitisse obter esses dados de forma ágil e não-onerosa.

Em contrapartida, os outros modelos parecem não ser aplicáveis, pois levam em consideração muitas variáveis levantadas em épocas distintas de avaliação. Nesse contexto, os modelos mais aplicáveis utilizariam apenas variáveis de uma única avaliação, pois os dados devem ser levantados conforme uma operação agrícola é realizada, não onerando demais o levantamento de dados. Todo o procedimento envolve custos, tanto para coleta e análise dos dados quanto para as tomadas de decisões. Mesmo que não haja sensores comerciais que coletem informações biométricas da cana-de-açúcar, deve-se ponderar no que as ferramentas disponíveis podem ser capazes de fornecer.

sensores proximais quando a cultura apresentar entre 0,4 e 0,6 m de altura de colmos, sugerida por Portz, Amaral e Molin (2012), uma opção seria aproveitar essa mesma operação agrícola e acoplar outros sensores que pudessem mensurar de alguma forma as características biométricas da cultura. Há algumas opções para mensurar tais atributos Por exemplo, para mensurar altura de plantas, alguns autores têm usado sensores ultrassônicos (CHANG et al., 2017; PORTZ; AMARAL; MOLIN, 2012) e LiDAR - Light Detection And Ranging (GAO et al., 2015; HOFFMEISTER et al., 2016), que também podem ser utilizados para estimar biomassa (WANG et al., 2017), IAF e arquitetura foliar (NIE et al., 2016), outros atributos importantes para caracterizar cultivos. Porém, para realizar o levantamento desses dados com precisão, há necessidade de adaptações para a cultura da cana, que é morfologicamente muito diversa de culturas anuais, onde há maior foco da pesquisa a nível global.

Esse tipo de investigação requereria que a cultura apresentasse determinado porte que permitisse a entrada de máquinas agrícolas sem danificá-la (por exemplo, AV1 ou 2, em que a cana ainda apresenta até ~50 cm de altura), enquanto em avaliações mais tardias (como a 3ª, em que a cana apresentava porte maior), há a possibilidade de se obter dados a partir de imagens de satélite (porém apenas dados de refletância) ou drones (CARUSO et al., 2017). O desafio é que imagens gratuitas (por exemplo, oriundas dos sistemas Landsat 8 ou Sentinel) apresentam limitações de resolução espacial e temporal e os drones ainda apresentam limitações para cobrir grandes áreas.

Também é interessante destacar que os erros de todos esses modelos apresentados estão na ordem de 15 Mg.ha-1, o que é uma diferença grande de produtividade quando o objetivo é realizar uma previsão de safra, já que a produtividade média de ambas as área foi 122 Mg.ha-1. Assim, esses modelos não devem ser recomendados quando o objetivo é realizar uma previsão precisa, mas alguns modelos (1,4 ≤ RPD val ≤ 1,8 – Tabela 4) podem ser utilizados quando a intenção é realizar estimativas e inferências, ou seja, obter uma ordem de grandeza de produção e então dimensionar insumos para indústria, por exemplo.

Dessa forma, um bom modelo para predizer a produtividade da cana-de-açúcar deve apresentar o menor erro possível, ou seja, algo em torno de 5% em relação à produtividade média final pode ser um valor aceitável (aqui obtivemos mais de 12%). Contudo, este é um desempenho difícil de se alcançar com regressões multivariadas a partir desses atributos, ainda mais porque o número de instâncias desse trabalho foi baixo para fins de predição. Desse modo, buscou-se também melhorar esses ajustes através de outras técnicas

de análise de dados a fim de obter melhores modelos e compreendimento dos fatores envolvidos com a variabilidade da produtividade da cana-de-açúcar.

Documentos relacionados