Aqui você entenderá a importância da estatística e da
probabilidade para análise de dados e irá aprender como empregar o R para
extrair importantes informações sobre os dados. Você iniciará pelos comandos e
estruturas básicas da linguagem como variáveis, atribuições e operações
aritméticas. É esperado que você já tenha alguma familiaridade com linguagens
de programação. Você aprenderá como acessar grandes conjuntos de dados, a fazer
seleções de instâncias e atributos de interesse, e obter estatísticas básicas
sobre esses dados.
Atenção: arquivos dos links em vermelho
somente acessíveis pelo Professor.
Aula | Exercícios
| Solução | html
Aula | Exercícios
| Solução | rmd
Aqui você vai compreender os conceitos de população e amostra, e
o que é a estatística descritiva. Aprenderá o que são e como empregar medidas
de centralidade (média, mediana) e medidas de dispersão (variância, desvios
padrão, quartis) para caracterização de conjuntos de dados. Vai aprender também
como identificar outliers dos dados e a explorar como duas variáveis podem
estar relacionadas linearmente (covariância, correlação). E você aprender tudo
isso aplicando esses conceitos a conjuntos de dados com R.
Aula | Exercícios
| Solução | html
Aula | Exercícios
| Solução | rmd
Aqui você aprenderá comandos básicos de R para diferentes visualizações
dos dados. Aprenderá a produzir gráficos como de tendência (linha), de
distribuição (histograma, boxplot e densidade),
relações (dispersão) e proporção (barras, pizza) dos dados. Você aprenderá
também como interpretar esses dados e, em conjunto com seleções de dados e a
estatística descritiva que viu anteriormente, elaborar explorações importantes
dos dados (EDA, Exploratory Data Analysis).
Aula | Exercícios
| Solução | html
Aula | Exercícios
| Solução | rmd
Vamos introduzir aqui a noções de probabilidade e inferência
estatística. Você vai conhecer aqui as principais distribuições de
probabilidades. Aqui você aprenderá como caracterizar diferentes distribuições
de probabilidades e como empregar essas distribuições para fazer inferências
sobre os dados. Você vai ainda aplicar esse conceitos
em conjuntos de dados com R.
Aula | Exercícios
| Solução | html
Aula | Exercícios
| Solução | rmd
Você já aprendeu o que são as as distribuições de probabilidade e algumas de suas
funções mais importantes como as funções de densidade e probabilidade
acumulada. Com isso já somos capazes de ‘inferir’ sobre a probabilidade de
alguns eventos. Mas podemos fazer ainda mais. Aqui você vai aprender alguns
resultados importantes para a inferência estatística como a Lei dos Grandes
Números e o Teorema Central do Limite. Vai também explorar outras
distribuições, e conhecer a distribuição t-Student
que tem um papel bastante importante em muitos testes de hipóteses que serão
vistos a seguir.
Aula | Exercícios
| Solução | html
Aula | Exercícios
| Solução | rmd
Você vai aprender aqui como determinar intervalos de confiança
que permitem avaliar a confiança de valores esperados em uma população. Outro
instrumento importante da Inferência Estatística são os Testes de Hipótese, e
você vai aprender aqui como aplicar testes de hipóteses para diferentes tipos
de variáveis e como empregar esses testes para comparar médias ou valores de
diferentes conjuntos de dados.
Aula | Exercícios
| Solução | html
Aula | Exercícios
| Solução | rmd
Aprenda aqui como fazer a aproximação de dados a uma função
linear. Aqui você vai aprender como estimar os valores dos coeficientes para
regressões simples e múltiplas. Aprenderá como avaliar quantitativamente esses
modelos lineares (coeficiente de determinação, p-value
dos coeficientes), criar linhas de tendências dos dados e aplicar esses modelos
para fazer estimativa de valores com R.
Aula | Exercícios
| Solução | html
Aula | Exercícios
| Solução | rmd
Nesta última seção você empregará vários dos conceitos aprendidos
antes para entender e aplicar um modelo de regressão logística para
classificação de dados. Esse é um importante modelo de classificação e
desempenha um papel fundamental para o entendimento de modelos mais gerais de
aprendizado de máquina supervisionados.
Aula | Exercícios
| Solução | html
Aula | Exercícios
| Solução | rmd