Limpeza de dados

Autor: Randy Alexander
Data De Criação: 26 Abril 2021
Data De Atualização: 1 Julho 2024
Anonim
Pandas Essencial - #19 Limpeza de Dados (Parte 1)
Vídeo: Pandas Essencial - #19 Limpeza de Dados (Parte 1)

Contente

Definição - O que significa Limpeza de Dados?

A limpeza de dados é o processo de alteração de dados em um determinado recurso de armazenamento para garantir que eles sejam precisos e corretos. Há muitas maneiras de buscar a limpeza de dados em várias arquiteturas de software e armazenamento de dados; a maioria deles se concentra na revisão cuidadosa dos conjuntos de dados e dos protocolos associados a qualquer tecnologia específica de armazenamento de dados.


A limpeza de dados também é conhecida como limpeza ou limpeza de dados.

Uma introdução ao Microsoft Azure e Microsoft Cloud | Neste guia, você aprenderá sobre o que é a computação em nuvem e como o Microsoft Azure pode ajudá-lo a migrar e administrar seus negócios a partir da nuvem.

Techopedia explica Limpeza de Dados

Às vezes, a limpeza de dados é comparada à limpeza de dados, onde dados antigos ou inúteis serão excluídos de um conjunto de dados. Embora a limpeza de dados possa envolver a exclusão de dados antigos, incompletos ou duplicados, a limpeza de dados é diferente da limpeza de dados, pois a limpeza de dados geralmente se concentra em liberar espaço para novos dados, enquanto a limpeza de dados se concentra em maximizar a precisão dos dados em um sistema. Um método de limpeza de dados pode usar a análise ou outros métodos para se livrar de erros de sintaxe, erros tipográficos ou fragmentos de registros. Uma análise cuidadosa de um conjunto de dados pode mostrar como a mesclagem de vários conjuntos levou à duplicação. Nesse caso, a limpeza de dados pode ser usada para corrigir o problema.


Muitos problemas que envolvem a limpeza de dados são semelhantes aos problemas que arquivistas, funcionários administrativos do banco de dados e outros enfrentam processos como manutenção de dados, mineração de dados direcionada e a metodologia de extração, transformação, carga (ETL), na qual dados antigos são recarregados em um novo conjunto de dados. Esses problemas geralmente consideram a sintaxe e o uso específico de comando para efetuar tarefas relacionadas nas tecnologias de banco de dados e servidor, como SQL ou Oracle. A administração de banco de dados é um papel muito importante em muitas empresas e organizações que dependem de grandes conjuntos de dados e registros precisos para comércio ou qualquer outra iniciativa.