Ciência de dados ou aprendizado de máquina? Heres Como identificar a diferença

Autor: Laura McKinney
Data De Criação: 3 Abril 2021
Data De Atualização: 1 Julho 2024
Anonim
Ciência de dados ou aprendizado de máquina? Heres Como identificar a diferença - Tecnologia
Ciência de dados ou aprendizado de máquina? Heres Como identificar a diferença - Tecnologia

Contente


Fonte: Elnur / Dreamstime.com

Leve embora:

Ciência de dados e aprendizado de máquina são diferentes nas principais maneiras. De certa forma, um pode ser visto como um subconjunto do outro. Ambos são importantes no progresso atual da TI.

Nesse novo mundo de inteligência artificial e gerenciamento de dados, é fácil ficar confuso com alguns dos termos mais usados ​​no mundo de TI.

Por exemplo, ciência de dados e aprendizado de máquina têm muito a ver um com o outro. Não é de surpreender que muitas pessoas com apenas um conhecimento passageiro dessas disciplinas tenham dificuldade em descobrir como diferem umas das outras.

Esta é a melhor maneira de separar a ciência de dados do aprendizado de máquina, como princípio e como abordagem tecnológica.

Ciência de dados e aprendizado de máquina: terminologia ampla e restrita

Antes de tudo, a ciência de dados é realmente uma categoria ampla e abrangente de tecnologia que abrange muitos tipos diferentes de projetos e criações. (Para saber mais sobre o que está envolvido em um trabalho de ciência de dados, consulte Função do trabalho: cientista de dados.)


A ciência de dados é essencialmente a prática de trabalhar com big data. Surgiu como a lei de Moore e a proliferação de dispositivos de armazenamento mais eficientes, levando a enormes quantidades de dados sendo coletadas por empresas e outras partes. Então, plataformas e ferramentas de big data como o Hadoop começaram a redefinir a computação, alterando o funcionamento do gerenciamento de dados. Agora, com a nuvem e a conteinerização, bem como com novos modelos, o big data se tornou um dos principais impulsionadores das maneiras como trabalhamos e vivemos.

Em sua forma mais simples, a ciência de dados é a maneira como gerenciamos esses dados, desde a limpeza e refinamento até a utilização na forma de insights.

A definição de aprendizado de máquina é muito mais restrita. No aprendizado de máquina, as tecnologias captam dados e os colocam em algoritmos, a fim de simular processos cognitivos humanos descritos como "aprendizado". Em outras palavras, após coletar os dados e treiná-los, o computador é capaz de fornecer seus próprios resultados , onde a tecnologia parece ter aprendido com os processos que os programadores implementam.


Conjuntos de habilidades de ciência de dados e aprendizado de máquina

Outra maneira de contrastar a ciência de dados e o aprendizado de máquina é observar as diferentes habilidades que são mais valiosas para os profissionais em qualquer um desses campos.

Sem erros, sem estresse - seu guia passo a passo para criar software que muda vidas sem destruir sua vida

Você não pode melhorar suas habilidades de programação quando ninguém se importa com a qualidade do software.

Existe um consenso geral de que os cientistas de dados se beneficiam de habilidades analíticas e matemáticas profundas, experiência prática com tecnologias de banco de dados e conhecimento de linguagens de programação como Python ou outros pacotes usados ​​para analisar big data.

"Qualquer pessoa interessada em construir uma forte carreira em (ciência de dados) deve adquirir as principais habilidades em três departamentos: análise, programação e conhecimento de domínio", escreve Srihari Sasikumar na Simplilearn. “Aprofundando um nível, as seguintes habilidades o ajudarão a desenvolver um nicho como cientista de dados: Forte conhecimento de Python, SAS, R (e) Scala, experiência prática em codificação de banco de dados SQL, capacidade de trabalhar com dados não estruturados de várias fontes, como vídeo e mídia social, entendem várias funções analíticas (e) conhecimentos de aprendizado de máquina ".

No lado do aprendizado de máquina, os especialistas costumam citar habilidades de modelagem de dados, conhecimento de probabilidade e estatística e habilidades de programação mais amplas como ferramentas úteis no kit de ferramentas do engenheiro de aprendizado de máquina.

Como identificar o aprendizado de máquina

A chave aqui é que todos os tipos de coisas compreendem o trabalho em ciência de dados, mas não é aprendizado de máquina, a menos que você tenha um regime muito rigoroso configurado para ajudar o computador a aprender com suas entradas.

Quando isso ocorre, cria sistemas surpreendentemente capazes que podem ter efeitos abrangentes em nossas vidas.

"Muito do que fazemos com o aprendizado de máquina acontece sob a superfície", afirmou o fundador da Amazon, Jeff Bezos, apontando algumas das aplicações desses tipos de sistemas. “O aprendizado de máquina direciona nossos algoritmos para previsão de demanda, classificação de pesquisa de produtos, recomendações de produtos e ofertas, posicionamentos de merchandising, detecção de fraudes, traduções e muito mais. Embora menos visível, grande parte do impacto do aprendizado de máquina será desse tipo - melhorando discretamente mas significativamente as operações principais. ”

Um dos exemplos mais úteis aqui é o surgimento da rede neural - é um método comum e popular de configurar processos de aprendizado de máquina.

Na sua forma mais básica, a rede neural é composta por camadas de neurônios artificiais. Cada neurônio artificial individual tem funcionalidade equivalente a um neurônio biológico - mas, em vez de sinapses e dendritos, possui entradas, uma função de ativação e eventuais saídas.

A rede neural é criada para agir como um cérebro humano, e os profissionais de aprendizado de máquina geralmente utilizam esse modelo para criar resultados de aprendizado de máquina.

No entanto, essa não é a única maneira de fazer aprendizado de máquina. Alguns projetos mais rudimentares de aprendizado de máquina simplesmente incluem mostrar ao computador uma ampla variedade de fotografias (ou fornecer outros dados brutos), introduzir idéias através do processo de uso de aprendizado de máquina supervisionado e rotular dados, e permitir que o computador seja capaz de discriminar entre várias formas ou itens em um campo visual. (Para o básico sobre aprendizado de máquina, confira Machine Learning 101.)

Duas disciplinas de ponta

Em conclusão, o aprendizado de máquina é uma parte valiosa da ciência de dados. Mas a ciência de dados representa a fronteira mais vasta e o engodo em que o aprendizado de máquina ocorre.

De certa forma, você poderia dizer que o aprendizado de máquina nunca aconteceria sem big data. O big data em si não criou o aprendizado de máquina - em vez disso, depois de termos agregado coletivamente tantos dados que quase não sabíamos o que fazer com ele, as principais mentes criaram esses processos de bio-simulação como uma maneira sobrecarregada de fornecer insights.

Outra coisa boa a ser lembrada aqui é que a ciência de dados pode ser aplicada de duas maneiras principais - podemos adotar o aprendizado de máquina e a inteligência artificial, deixando os computadores pensarem por nós, ou podemos trazer a ciência de dados de volta a uma abordagem mais centrada no ser humano, onde o computador simplesmente apresenta resultados e nós, como seres humanos, tomamos as decisões.

Isso está levando alguns especialistas, incluindo alguns dos principais inovadores de hoje, a exigir uma contabilidade mais vibrante das maneiras pelas quais usamos essas tecnologias.

"A IA é capaz de muito mais do que quase todo mundo sabe e a taxa de aprimoramento é exponencial", disse Elon Musk, ao alertar que os programas de aprendizado de máquina e IA exigem supervisão.

De qualquer forma, tanto a ciência de dados quanto o aprendizado de máquina são partes essenciais do progresso que nós, como sociedades, estamos fazendo na tecnologia hoje.