Contente
- Simplificando um conjuntos de dados
- Utilização no programa
- Características
- Considerações
- Excel
- Prevenção / solução
A análise dos principais componentes reduz um conjunto de variáveis correlacionadas a um conjunto menor de variáveis não correlacionadas, simplificando um conjunto de dados complexos para uma análise posterior. Este procedimento estatístico complexo pode ser realizada por muitos programas de análise de dados, ou extensões (add-on) de programas que ampliam as habilidades do mesmo, adicionando novas funcionalidades.
Programas de planilhas como o Excel podem realizar análise de componentes principais com a ajuda de uma extensão (Image by Flickr.com, courtesy of Casey Serin)
Simplificando um conjuntos de dados
A análise dos principais componentes é uma técnica de exploração e redução de dados. Um analista pode utilizar a técnica para extrair informações relevantes de um conjunto de dados grandes e confusos. A técnica é comumente utilizada quando o número de variáveis observadas é muito grande e as correlações entre as mesmas tornam os dados difíceis de serem analisados de maneira direta. Por exemplo, em alguns casos, a correlação entre as variáveis pode criar uma falsa impressão de redundância dos dados, dificultando a análise técnica ou comprometendo a avaliação do mesmo. A análise dos principais componentes simplifica as variáveis expressando-as em função de um número menor de elementos, os componentes principais, que representam a maior parte das variações nas medidas dos dados.
Utilização no programa
A complexidade da análise dos principais componentes requer o uso de um programa específico. Existe uma grande variedade de programas de estatística e a maioria deles são capazes de realizar esta técnica. Os programas mais conhecidos são o SAS, o Stata e o SPSS. As universidades, centros de pesquisa, organizações de consultoria e outros profissionais de pesquisa utilizam estes programas específicos. Os três podem realizar análise de componentes principais de um conjunto de dados inseridos em uma planilha, na qual as linhas representam as observações individuais e as colunas representam as variáveis separadas.
Características
A maioria dos programas de software para análise de componentes principais, incluindo o SAS, o Stata e o SPSS vão apresentar os resultados em forma de tabelas que incluem os valores próprios, ou medidas de variação explicada. Muitos programas também proporcionam a exibição visual dos resultados sob a forma de um gráfico chamado de "scree plot".
Considerações
Análise de componentes principais é muitas vezes confundida com análise fatorial, outra técnica de redução de dados que explica observações correlacionadas em termos de factores subjacentes. Os dois são, na verdade, procedimentos separados, embora a análise de componentes principais seja um passo da análise de fatores. No entanto, muitos pacotes combinam os dois procedimentos.
Outra consideração importante é que programas especializados, tais como SAS, SPSS e Stata são caros. Portanto, esses programas podem não ser úteis para pessoas que não planejam realizar análises estatísticas com frequência.
Excel
As pessoas que precisam realizar algumas análises estatísticas, mas preferem não comprar um programa especializado, podem questionar se programas de planilha amplamente utilizados, tais como Excel, são capazes de efetuar uma análise de componentes principais. A resposta é sim e não. Embora o Excel tenha algumas ferramentas de análise de dados que podem ser acessíveis a partir da instalação de um pacote de análise estatístico, o programa não se propõe a ser um programa de análise estatística. A análise de componentes principais e a análise fatorial não estão entre as funções da ferramenta de análise de dados.
Prevenção / solução
Existe um programa que os usuários podem baixar e instalar para melhorar as funcionalidades do Excel como uma ferramenta de análise de dados. A Addinsoft, uma empresa de software especializada em programas analíticos criou o XLSTAT. Este programa permite que o Excel realize a análise de componentes principais e outros procedimentos estatísticos. O mesmo tem procedimentos amigáveis ao usuário, permitindo que este selecione os dados para análise, simplesmente, clicando e arrastando uma célula através dos campos necessários. Os usuários podem comprar e baixar o XLSTAT no site da Addinsoft. Há também uma versão gratuita que os usuários podem experimentar antes de decidir comprá-lo.