Soft Skills para Governança de Dados

Apesar da maioria das pessoas acharem que Governança de Dados é um assunto puramente técnico ou analítico, não é. Na realidade, há várias atividades da área que são realizadas por usuários corporativos. Com certeza os programas de Governança de Dados mais bem-sucedidos são executados, liderados e apoiados por pessoas com habilidades sociais bem desenvolvidas. A paixão, Leia mais… »

COMANDOS BÁSICOS DO SISTEMA R

COMANDOS BÁSICOS DO SISTEMA R Baseado no material do Mauro Campos, fiz uma seleção de alguns dos comandos básicos. As palavras que aparecem em azul, devem ser substituidas pelo comando ou nome específico. Ajuda do R help(comando)– Ajuda rápida sobre um comando help.start() – Inicia a ajuda no browser help(package=nome_pacote) – Ajuda sobre um pacote Leia mais… »

Árvores de decisão

• Aprendizado supervisionado; • Árvores de decisão vão permitir que operemos diretamente com atributos nominais, sem necessidade de uma transformação; Os nós da árvore têm todos a mesma estrutura. Os nós são os atributos, e seus ramos se dividem nos valores possíveis que esses atributos assumem. No caso de valores numéricos, contínuos, é normalmente empregada Leia mais… »

Como instalar Python e Jupyter Notebook usando Anaconda

Como instalar Python e Jupyter Notebook usando Anaconda Aprenda a utilizar esse pacote de arquivos que contém os itens essenciais de todo Data Scientist O Anaconda é uma iniciativa que tem como objetivo agregar todas as ferramentas para análise de dados em um único arquivo. Resumidamente, é um arquivo que irá instalar em seu computador Leia mais… »

Tutorial de ggplot2

O pacote ggplot2 foi desenvolvido pelo Dr. Hadley Wickham (que desenvolveu diversos outros pacotes importantes para R como o (d)plyr por exemplo. Este pacote implementa uma nova maneira de criar gráficos a partir dos dados, trazendo o conceito de camadas (layers) para a sintaxe do R. Com esse novo conceito, surge também a necessidade de Leia mais… »

Como fazer uma análise de regressão linear simples no R

A análise de regressão é normalmente utilizada quando se deseja obter um modelo preditivo do efeito de uma variável sobre outra sendo que essas variáveis devem ser contínuas. Na Regressão Linear Simples têm-se apenas duas variáveis, uma variável preditora (eixo X) e outra resposta (eixo y). Existem quatro pressupostos básicos para análises de regressão: LINEARIDADE Leia mais… »

Big Data

Big Data O que é e qual sua importância? Big data é um termo que descreve o grande volume de dados — tanto estruturados quanto não-estruturados — que impactam as empresas diariamente. Mas não é a quantidade de dados disponíveis que importa; é o que as organizações fazem com eles. Big data pode ser analisado Leia mais… »