Disciplina - detalhe

ECO5081 - Introdução a Estatística e Ciência de Dados Aplicada às Ciências Ambientais


Carga Horária

Teórica
por semana
Prática
por semana
Créditos
Duração
Total
4
2
8
10 semanas
120 horas

Docentes responsáveis
Cristian Marcelo Villegas Lobos
Deoclecio Jardim Amorim

Objetivo
Desenvolver habilidades de análise de dados, tanto em pequenos quanto em grandes volumes,
capacitando os estudantes a adquirirem conhecimentos sobre as principais técnicas da Ciência de Dados
e suas aplicações em problemas ecológicos.

Conteúdo
I) Estatística descritiva e visualização de dados: tipos de variáveis, pré-processamento de dados,
construção de tabelas, medidas de resumo (posição, dispersão, quantis amostrais), construção gráficos
univariados e multivariados e medidas de associação e correlação.
II) Análise de regressão: conceitos básicos, regressão linear simples, regressão linear múltipla e
regressão logística.
III) Introdução à ciência de dados: conceitos básicos, tipos de dados (estruturados e não estruturados:
imagens, sons, texto, vídeos), problemas de classificação, regressão e reconhecimento de padrões.
IV) Aprendizado supervisionado: análise discriminante linear e quadrática, árvores de decisão, florestas
aleatórias e máquinas de suporte vetorial.
V) Aprendizado não supervisionado: análise de agrupamentos (hierárquico e não hierárquico), análise de
componentes principais e análise fatorial.
VI) Tópicos adicionais: redes neurais, aprendizado profundo e estudos de caso.

Bibliografia
DANGETI, P. Statistics for machine learning. Birmingham: Packt Publishing, 2017. 442 p.
DURGABAI, R. P. L.; BHARGAVI, P. Machine learning ensemble with image processing for pest
identification and classification in field crops. Journal of Cardiovascular Disease Research, v. 13, n.
7, p. 189-204, 2022. Disponível em:
https://jcdronline.org/admin/Uploads/Files/63353901212939.55356270.pdf
GOODFELLOW, I.; BENGIO, Y; COURVILLE, A. Deep Learning. Cambridge: The MIT Press, 2016. 775 p.
Disponível em: https://www.deeplearningbook.org/
HASTIE, T.; TIBSHIRANI, R.; FRIEDMAN, J. The elements of statistical learning. 2nd. ed. New York:
Springer, 2017. 745 p. Disponível em: Biblioteca IME/USP (QA277.38 H356e).
HSIEH, W. W. Evolution of machine learning in environmental science: a perspective. Environmental
Data Science, v. 1, art. e3, 2022. Disponível em:
https://web.archive.org/web/20220611120815id_/https://www.cambridge.org/core/services/aop-cambri
dge-core/content/view/C21F19C66FA387BC25F43C3C6B95E866/S2634460222000024a.pdf/div-class-titl
e-evolution-of-machine-learning-in-environmental-science-a-perspective-div.pdf
JAMES, G. et al. Introduction to statistical learning. New York: Springer, 2017. 426p. Disponível em:
Biblioteca IME/USP (QA276.7 J27i).
JOHNSON, R. A.; D. W. WICHERN. Applied multivariate statistical analysis. 6th ed. Englewood
Cliffs: Prentice Hall, 2007. 773 p. Disponível em: Biblioteca Central da ESALQ (519.53 J68a6).
LEGENDRE, P.; LEGENDRE, L. Numerical ecology. 2nd. ed. Amsterdam: Elsevier, 1998. 853 p.
Disponível em:
https://www.sciencedirect.com/bookseries/developments-in-environmental-modelling/vol/20/suppl/C
MANLY, B. F. J.; ALBERTO, J. A. N. Métodos estatísticos multivariados: uma introdução. Porto Alegre:
Bookman, 2019. 254 p. Disponível em: Biblioteca Central da ESALQ (519.53 M279m4).
MCKINNEY, W. Python para análise de dados: tratamento de dados com pandas, numpy & jupyter.
3rd. ed. São Paulo: Novatec Editora, 2023. 634 p. Disponível em: Biblioteca IME/USP (QA762 M478p).
MORETTIN, P. A.; SINGER, J. M. Estatística e ciência de dados. 1. ed. Rio de Janeiro: LTC, 2023. 454
p. Disponível em: Biblioteca Central da ESALQ (519.50285 M845e).
RAZA, A.; HU, Y.; LU, Y. Improving carbon flux estimation in tea plantation ecosystems: a machine
learning ensemble approach. European Journal of Agronomy, v. 160, art. 127297, 2024. doi:
10.1016/j.eja.2024.127297
RIMAL, K.; SHAH, K. B.; JHA, A. K. Advanced multi-class deep learning convolution neural network
approach for insect pest classification using TensorFlow. International Journal of Environmental
Science and Technology, v. 20, n. 4, p. 4003-4016, 2023. doi: 10.1007/s13762-022-04277-7
RODRIGUES, P. C.; CARFAGNA, E. Data science applied to environmental sciences. Environmetrics, v.
34, n. 1, art. e2783, 2023. doi: 10.1002/env.2783
RYO, M. Ecology with artificial intelligence and machine learning in Asia: a historical perspective and
emerging trends. Ecological Research, v. 39, n. 1, p. 5-14, 2024. doi: 10.1111/1440-1703.12425
WICKHAM, H.; GROLEMUND, G. R for data science: import, tidy, transform, visualize, and model data.
1st. ed. Sebastopol: O'Reilly Media, 2017. 518 p. Disponível em: Biblioteca IME/USP (QA276.7 W637r).
WICKHAM, H.; GROLEMUND, G. R para data science: importe, arrume, transforme, visualize e modele
dados. Rio de Janeiro: Alta Books, 2019. 528 p. Disponível em: Biblioteca IME/USP (QA276.7 W637r).
ZHU, J. J.; YANG, M.; REN, Z. J. Machine learning in environmental research: common pitfalls and best
practices. Environmental Science & Technology, v. 57, n. 46, p. 17671-17689, 2023. doi:
10.1021/acs.est.3c00026