Ciência de Dados e Engenharia de Dados

Então este é o mundo da tecnologia. E todo esse mundo agora está quase confiando na tecnologia. E sim! isso é verdade. Nosso negócio, nossa educação, nossa vida técnica, tudo depende da tecnologia e da ciência, é claro. E quando há tecnologia e ciência, também aparece uma palavra atrás da qual é DATA. Os dados estão em todo lugar. Estamos usando dados Leia mais… »

GRÁFICOS EM R

Vamos agora apresentar alguns gráficos simples de se fazer no R. Para não deixarmos os gráficos tão deselegantes a ponto de serem inúteis, vamos incluir algumas características em cada um. A base de dados utilizada será novamente a german_credit_2, que dessa vez será chamada de dados_credito, para não causar confusão. 1. Gráfico de Dispersão: Um dos mais fáceis de se Leia mais… »

CARREGANDO / IMPORTANDO SEUS DADOS NO R

A função read.table()  do R serve para importar arquivos de diversos formatos. O print abaixo apresenta a descrição do que a função é capaz de fazer e algumas variações dela, como o read.csv() – muito embora a própria read.table() seja capaz de ler arquivos csv. Não tem muito segredo para ler arquivos. Vejamos um exemplo de como ler um arquivo utilizando as Leia mais… »

Lista rápida de pacotes R úteis

Pacotes Recomendados Muitas funções R úteis vêm em pacotes, bibliotecas livres de código escritas pela comunidade de usuários ativos de R. Para instalar um pacote R, abra uma sessão R e digite na linha de comando install.packages(“<the package’s name>”) R irá baixar o pacote do CRAN, então você precisa estar conectado à internet. Uma vez que você Leia mais… »

Documentos dinâmicos no R

Documentos dinâmicos no R Criando um documento dinâmico com Markdown e R No exemplo anterior, escrevemos um documento em Markdown (.md) e inserimos códigos do R, que são apenas apresentados no documento final. Desse forma temos um documento estático, pois os códigos não são interpretados. Para fazermos esse documento ser dinâmico, vamos usar o pacote knitr a nosso favor, Leia mais… »

Artigo Data Warehouse

Neste artigo iremos abordar um pouco sobre , que consiste num sistema que através de diferentes transações e processos, faz uma copia das informações registradas nos diversos sistema espalhados na organização através da mineração de dados, organizando-os em diferentes níveis ou camadas de dados para facilitar as consultas, relatórios e analises através de ferramentas OLAP. Leia mais… »

Soft Skills para Governança de Dados

Apesar da maioria das pessoas acharem que Governança de Dados é um assunto puramente técnico ou analítico, não é. Na realidade, há várias atividades da área que são realizadas por usuários corporativos. Com certeza os programas de Governança de Dados mais bem-sucedidos são executados, liderados e apoiados por pessoas com habilidades sociais bem desenvolvidas. A paixão, Leia mais… »

COMANDOS BÁSICOS DO SISTEMA R

COMANDOS BÁSICOS DO SISTEMA R Baseado no material do Mauro Campos, fiz uma seleção de alguns dos comandos básicos. As palavras que aparecem em azul, devem ser substituidas pelo comando ou nome específico. Ajuda do R help(comando)– Ajuda rápida sobre um comando help.start() – Inicia a ajuda no browser help(package=nome_pacote) – Ajuda sobre um pacote Leia mais… »

Árvores de decisão

• Aprendizado supervisionado; • Árvores de decisão vão permitir que operemos diretamente com atributos nominais, sem necessidade de uma transformação; Os nós da árvore têm todos a mesma estrutura. Os nós são os atributos, e seus ramos se dividem nos valores possíveis que esses atributos assumem. No caso de valores numéricos, contínuos, é normalmente empregada Leia mais… »