1. Fundamentos de Estatística
Introdução: O Que é Estatística Descritiva?
Bem-vindos ao universo da Ciência de Dados! Antes de nos aprofundarmos nas ferramentas, é essencial construirmos uma base sólida em Estatística. A Estatística Descritiva é a primeira etapa na análise de dados, um ramo que nos ajuda a resumir e descrever as principais características de um conjunto de dados de forma clara e concisa.
Pense nela como um "retrato" dos dados. Ela nos permite responder perguntas fundamentais:
- Qual é o valor típico ou central dos meus dados?
- Quão espalhados eles estão?
- Existem valores que se destacam?
Imagine que você está analisando as notas de uma turma em uma prova. A estatística descritiva é como tirar um "retrato" dessas notas, resumindo as informações importantes para entender o desempenho geral da turma. Ela nos ajuda a responder perguntas como:
- Qual foi a nota média?
- Qual a nota mais comum?
- Quão dispersas foram as notas?
Objetivos da estatística descritiva
- Organizar os dados: Apresentar os dados de forma lógica e estruturada, facilitando a sua compreensão.
- Resumir os dados: Condensar as informações em formatos mais simples e fáceis de interpretar.
- Descrever os dados: Identificar padrões, tendências e características importantes do conjunto de dados.
Medidas descritivas
Medidas descritivas são valores numéricos que resumem e descrevem as principais características de um conjunto de dados. Elas nos ajudam a entender a tendência central (média, mediana, moda), a dispersão (amplitude, variância, desvio padrão) e a forma (assimetria, curtose) dos dados, tornando-os mais fáceis de interpretar.
1.1. Medidas de Tendência Central
As medidas de tendência central são valores que representam o centro de um conjunto de dados.
- Média (μ): A média (ou média aritmética) é a soma de todos os valores de um conjunto, dividida pelo número total de elementos. É a medida mais comum para descrever um conjunto de dados. É o famoso "ponto de equilíbrio".
- Exemplo: Imagine que cinco amigos foram a um restaurante e gastaram, respectivamente: R$ 25, R$ 30, R$ 28, R$ 22 e R$ 35. Para encontrar o gasto médio por pessoa, somamos todos os valores e dividimos pelo número de amigos (5).
- (25 + 30 + 28 + 22 + 35) = 140 / 5 = 28
- A média de gasto por pessoa é R$ 28.