Data Warehousing 101

Autor: Robert Simon
Data De Criação: 24 Junho 2021
Data De Atualização: 1 Julho 2024
Anonim
What Is a Data Warehouse?
Vídeo: What Is a Data Warehouse?

Contente



Leve embora:

O data warehousing fornece uma base sólida para a consolidação de dados históricos, atuais e futuros, permitindo que uma organização gere relatórios, realize análises avançadas e faça uma mineração de dados.

Muitas empresas coletam continuamente grandes quantidades de dados. Mas, para usar essas informações, um conjunto funcional de processos e procedimentos deve ser implementado para dar sentido às mesmas.

Se você é desenvolvedor de data warehouse ou está ouvindo o termo data warehousing pela primeira vez, é essencial entender os conceitos básicos de data warehousing - incluindo o que significa, como é usado e os benefícios que pode oferecer -.

Depois que os dados são analisados ​​adequadamente, eles podem ser usados ​​para criar uma imagem mais clara dos impactos positivos e negativos que as tendências e padrões comuns têm sobre uma empresa. Isso parece bastante simples, mas garantir que os dados sejam úteis é um dos principais desafios do data warehousing.


O que é data warehousing?

Um data warehouse é uma unidade de armazenamento centralizado (banco de dados) que define e reúne dados e todos os seus detalhes detalhados. Esses detalhes podem incluir informações pertencentes à base de clientes de uma organização, prestadores de serviços, fornecedores, transações ou processos de negócios através do uso de um modelo de dados integrado. (Para aprender sobre o gerenciamento de processos de negócios, consulte BPM e SOA: Como eles conduzem os negócios.)

O data warehousing extrai dados de várias fontes que são disponibilizadas em uma empresa; esses dados podem ser analisados ​​de várias maneiras diferentes. Um data warehouse é uma coleção de informações integrada, não volátil, variável no tempo e orientada ao assunto. O que isso significa é que um data warehouse deve atingir os seguintes objetivos:


  • Capture e forneça acesso a metadados de negócios
  • Melhore a qualidade dos dados e minimize as inconsistências nos relatórios gerados
  • Integre dados de várias fontes diferentes e forneça compartilhamento de dados
  • Aumente a velocidade e o desempenho de todas as necessidades de relatórios, mesclando dados históricos e atuais com eficácia e eficiência

Tipos de dados

Um data warehouse fornece técnicas aprimoradas de inteligência de negócios, obtendo dados de várias fontes e permitindo que os usuários de negócios acessem rapidamente dados críticos de um local compartilhado. O tipo de dados coletados em um data warehouse é orientado ao assunto, integrado e identificado ou sincronizado dentro de um período de tempo específico.

Quando se trata de data warehousing, existem quatro tipos principais de dados:

Você não pode melhorar suas habilidades de programação quando ninguém se importa com a qualidade do software.

Dados de variação temporal

Os dados com variação de tempo garantem que todas as informações armazenadas no data warehouse sejam atualizadas e geradas em tempo real. Todas as estruturas principais no data warehouse contêm um elemento de tempo, fornecendo informações de uma perspectiva do horizonte, como nos últimos cinco a 10 anos.

Dados orientados ao assunto

Os dados orientados ao assunto são organizados com base nas principais categorias de assuntos de uma empresa, como clientes, vendas, produtos e serviços. A orientação de assunto fornece uma avaliação simples e concisa de assuntos específicos, concentrando-se no modelo e nas análises de dados que serão usados ​​pelos principais tomadores de decisão da organização.

Dados Integrados

Os dados integrados são compostos de várias fontes mistas, como bancos de dados relacionais, registros de transações online e arquivos simples. Após a integração bem-sucedida das fontes especificadas, a limpeza de dados é aplicada. Isso garante consistência nas medidas de atributo, convenções de nomenclatura, estruturas de codificação e termos-chave por meio da conversão de dados.

Análise de negócios e geração de relatórios

Um data warehouse é baseado na modelagem de dados multidimensional. Um modelo de dados multidimensional cria uma variedade de visualizações diferentes na forma de um cubo de dados, o que permite que os dados sejam moderados e visualizados em várias dimensões. Um data warehouse é uma das primeiras etapas usadas quando uma organização se expande e evolui. É usado principalmente quando uma empresa decide começar a investir em análise de negócios. A análise de negócios utiliza uma variedade de aplicativos e procedimentos tecnológicos usados ​​pela empresa para localizar e identificar necessidades e aprimoramentos de negócios com base em dados estatísticos.

A análise de negócios ajuda as organizações a descobrir e reconhecer padrões que podem ser usados ​​para prever, moldar e melhorar os resultados dos negócios. No entanto, são os resultados reunidos nesse processo que realmente contam, pois são utilizados para propor a criação, implementação e gerenciamento de novas estratégias. (Para leitura em segundo plano, consulte Uma introdução à inteligência de negócios.)

As soluções analíticas de negócios usam dados quantitativos e estatísticos baseados em fatos para avaliar o desempenho passado e se preparar para o planejamento e alternativas de negócios futuros. A coleta de dados comerciais geralmente é gerada por máquinas ou aplicativos através do uso de software estatístico. É por isso que muitas empresas usam software estatístico para fazer melhorias com base em análises.

Software Estatístico e Inteligência de Negócios

O software estatístico também é conhecido como software de inteligência de negócios (BI). Para muitas empresas, não existe um processo específico de seleção de software, enquanto outras seguem um padrão corporativo ou já possuem um banco de dados ou ferramenta de relatório que apenas precisa ser ativado. O processo usado ao selecionar o software analítico apropriado começa com a criação de uma estratégia de BI e a conformidade com os requisitos gerais de negócios já estabelecidos.

Os gerentes e analistas de negócios desempenham um papel importante na seleção do software apropriado e na garantia de que suas técnicas de análise de negócios os iniciem na direção certa. Sabe-se que empresas como a Amazon acompanham as tendências no comportamento de compra entre os clientes, a fim de descobrir faixas de preço com as quais o mercado-alvo se sente mais confortável. As empresas são capazes de decidir efetivamente as taxas de preços competitivas sem causar muito impacto em sua margem de lucro geral. Sem uma estratégia de BI predefinida, é comum que o tipo de software adquirido não forneça a uma organização as habilidades de personalização apropriadas necessárias.

Mineração de dados

A mineração de dados envolve se aprofundar nos dados para produzir insights úteis para tomar evidências e decisões baseadas em fatos. Em termos técnicos, a mineração de dados pode ser usada para encontrar correlações ou padrões entre vários campos de dentro de grandes bancos de dados relacionais. Mais especificamente, é o processo de analisar informações de várias perspectivas e resumi-las em dados úteis. Na melhor das hipóteses, essas informações podem ajudar uma empresa a cortar custos, aumentar as vendas e influenciar outros indicadores-chave de desempenho.

A mineração de dados é uma tecnologia poderosa que pode ser usada para descobrir várias dimensões, categorias e relacionamentos diferentes que existem entre diferentes fontes e registros de dados. Por exemplo, no setor de varejo, a mineração de dados pode ajudar uma empresa a reconhecer padrões de vendas e comportamento do cliente, permitindo que eles explorem as informações em seu proveito. Um exemplo infame é a capacidade do varejista em determinar quais de seus clientes podem estar esperando, permitindo que a loja ofereça cupons para itens de bebê em um momento em que os pais tendem a começar a comprá-los.

Armazenamento de dados em poucas palavras

Ao integrar e aplicar técnicas de data warehousing, as metodologias de análise de negócios permitem que as organizações aprimorem suas estratégias gerais de negócios e permitam uma tomada de decisão otimizada com o uso do software de BI. As análises desempenham um papel vital em qualquer organização, e muitos procedimentos diferentes, incluindo mineração de dados e outros métodos analíticos, podem ser usados ​​para dar suporte e gerar serviços e marketing de coleta de dados apropriados. Novas oportunidades e possibilidades são exploradas por meio de técnicas de armazenamento de dados, melhorando o atendimento ao cliente, simplificando o gerenciamento de inventário, promovendo produtos que atendem às necessidades individuais dos clientes e fornecendo análises críticas de produtos e serviços.

Data warehousing é o que permite às organizações encontrar respostas para perguntas complexas em grandes conjuntos de dados. Esse é o poder da coleta e armazenamento de dados digitais.