12 dicas importantes para aprender ciência de dados

Autor: Laura McKinney
Data De Criação: 3 Abril 2021
Data De Atualização: 1 Julho 2024
Anonim
12 dicas importantes para aprender ciência de dados - Tecnologia
12 dicas importantes para aprender ciência de dados - Tecnologia

Contente


Fonte: Artinspiring / Dreamstime.com

Leve embora:

Os cientistas de dados obviamente precisam de fortes habilidades matemáticas e de codificação, mas a comunicação e outras habilidades pessoais também são essenciais para o sucesso.

Cientista de dados é considerado o melhor trabalho para 2019 na América no Glassdoor. Com um salário-base médio de US $ 108.000 e um nível de satisfação no trabalho de 4,3 em 5, mais um número razoável de vagas previstas, isso não é surpreendente. A pergunta é: O que é preciso fazer para entrar no caminho certo para se qualificar para esse trabalho?

Para descobrir, procuramos o conselho dado àqueles que buscam entrar nessa carreira. Muito se resume às grandes habilidades em codificação e matemática. Mas esse cálculo forte por si só não é suficiente. Os cientistas de dados bem-sucedidos também precisam ser capazes de falar com as pessoas de negócios em seus próprios termos, o que exige os recursos associados a habilidades pessoais e liderança. (Para saber mais sobre os deveres de um cientista de dados, consulte Função do trabalho: cientista de dados.)


Construindo a Fundação Educacional: três dicas principais

Drace Zhan, cientista de dados da NYC Data Science Academy, enfatiza a necessidade de uma base educacional que inclua o essencial da codificação e da capacidade matemática:

  1. R / Python + SQL. Se você não possui as habilidades de codificação, precisa de muito poder de rede e de outras áreas para reforçar esse déficit. Vi cientistas de dados com matemática fraca e pouca experiência no domínio, mas eles sempre foram carregados por uma forte capacidade de codificação. Python é ideal, mas R é uma ótima ferramenta de retorno. É melhor ter os dois no seu arsenal. SQL também é extremamente importante para um analista de dados.

  2. Fortes habilidades matemáticas. Ter um entendimento muito bom de alguns dos métodos comumente usados: modelos lineares generalizados, árvore de decisão, médias K e testes estatísticos é melhor do que ter uma visão ampla de vários modelos ou especializações, como a RNN.

Essas são habilidades centrais para se desenvolver, embora alguns especialistas as acrescentem. Por exemplo, uma lista do KDnuggets inclui os componentes de codificação que Zhan mencionou e acrescenta outras coisas úteis a serem conhecidas no lado técnico, incluindo a plataforma Hadoop Apache Spark, visualização de dados, dados não estruturados, aprendizado de máquina e IA.


Porém, se seguirmos as dicas de uma pesquisa sobre as ferramentas mais usadas, identificadas para uso na vida real por uma pesquisa da Kaggle, obteremos resultados um pouco diferentes. Como você pode ver no gráfico das 15 principais opções abaixo, Python, R e SQL são facilmente as três principais, mas a quarta são os notebooks Jupyter, seguidos por TensorFlow, Amazon Web Services, shell Unix, Tableau, C / C ++, NoSQL , MATLAB / Octave e Java, todos à frente do Hadoop e Spark. Mais uma adição que pode surpreender as pessoas, é o Excel Data Mining da Microsoft.

Imagem cortesia de Kaggle

A lista do KDnuggets também inclui uma dica sobre educação formal. A maioria dos cientistas de dados possui diplomas avançados: 46% têm doutorado e 88% possuem pelo menos um mestrado. Os diplomas de graduação que possuem geralmente são divididos entre áreas relacionadas. Cerca de um terço são em matemática e estatística, que é a mais popular para essa carreira. O segundo mais popular é o de ciência da computação, com 19%, e de engenharia, com 16%. Obviamente, as ferramentas técnicas específicas da ciência de dados geralmente não são estudadas nos programas de graduação, mas em campos de treinamento especializados ou através de cursos on-line.

Mais do que cursos: mais duas dicas

Hank Yun, assistente de pesquisa no Departamento de Pneumologia da Weill Cornell Medicine e estudante da NYC Data Science Academy, aconselha os aspirantes a cientistas de dados a planejar em que trabalharão e a encontrar um mentor. Ele disse:

Sem erros, sem estresse - seu guia passo a passo para criar software que muda vidas sem destruir sua vida

Você não pode melhorar suas habilidades de programação quando ninguém se importa com a qualidade do software.

Não cometa o erro que cometi ao dizer a si mesmo que você conhece ciência de dados porque fez um curso e recebeu um certificado. Esse é um ótimo começo, mas quando você começar a estudar, tenha um projeto em mente. Em seguida, encontre um mentor no campo e inicie um projeto de paixão imediatamente! Quando você é novo, não sabe o que não sabe, por isso ajuda quando alguém está lá para orientá-lo sobre o que é importante para você e o que não é. Você não quer gastar muito tempo estudando sem nada para mostrar!

Saber qual ferramenta retirar da sua caixa de ferramentas: Dica para se manter à frente da curva

Dada a disparidade no ranking das ferramentas de ciência de dados, alguns podem se sentir confusos sobre o que focar. Celeste Fralick, cientista chefe de dados da empresa de software de segurança McAfee, aborda a questão em um artigo do CIO que analisa as habilidades essenciais para um cientista de dados, declarando: “Um cientista de dados precisa ficar à frente da curva na pesquisa, bem como entender que tecnologia aplicar quando. ”Isso significa não ser atraído pelos“ 'sexy' e novos, quando o problema real ”exige algo muito mais comum. "Estar ciente do custo computacional para o ecossistema, interpretabilidade, latência, largura de banda e outras condições de contorno do sistema - bem como a maturidade do cliente - ajuda o cientista de dados a entender qual tecnologia aplicar".

Soft Skills essenciais: outras seis dicas

O ponto que Fralick aborda se relaciona às habilidades não técnicas exigidas pelo trabalho de cientista de dados. É por isso que a lista do KDnuggets inclui estes quatro: curiosidade intelectual, trabalho em equipe, habilidades de comunicação e perspicácia nos negócios. Zhan também incluiu habilidades básicas importantes em suas dicas para cientistas de dados, identificando “habilidades de comunicação” como o KDnuggets, mas usando “conhecimento de domínio” no lugar da “perspicácia nos negócios”. Como é chamado, refere-se à aplicação prática da ciência de dados ao o negócio. (Para saber mais sobre habilidades de comunicação, consulte A importância das habilidades de comunicação para profissionais técnicos.)

Olivia Parr-Rud ofereceu seu próprio ponto de vista sobre isso, acrescentando mais duas habilidades leves, com ênfase no papel da criatividade, afirmando: “Penso na ciência de dados como uma arte tanto quanto uma ciência”, algo que exige os pontos fortes de ambos os lados do cérebro. “Muitas pessoas falam sobre ciência de dados como uma carreira que usa principalmente o lado esquerdo do cérebro. Eu descobri que, para ter sucesso, os cientistas de dados devem usar todo o cérebro. ”

Ela explicou que o avanço no campo requer não apenas competência técnica, mas criatividade e a visão necessária para a liderança:

A maioria das tarefas lineares do lado esquerdo do cérebro pode ser automatizada ou terceirizada. Para oferecer uma vantagem competitiva como cientistas de dados, devemos ser capazes de reconhecer padrões e sintetizar grandes quantidades de informações usando os dois lados do cérebro. E devemos ser pensadores inovadores. Muitos dos melhores resultados resultam da integração do cérebro esquerdo e direito.

Ela também enfatizou por que comunicar claramente uma visão é essencial:

Como cientistas de dados, nosso objetivo é usar dados para ajudar nossos clientes a aumentar seus lucros. A maioria dos executivos não entende o que fazemos ou como fazemos. Portanto, precisamos pensar como líderes e comunicar nossas descobertas e recomendações em linguagem que nossos stakeholders entendam e confiem.

The Data Dozen

As dicas principais incorporam um número maior de ferramentas, habilidades e capacidades técnicas, além de qualidades menos quantificáveis, como aptidão para criatividade e liderança. Em última análise, não é apenas um jogo de números. Como a ciência de dados não se trata apenas de criar modelos no vácuo, mas de apresentar aplicativos práticos para resolver problemas da vida real das empresas, aqueles que serão bem-sucedidos no campo precisam não apenas dominar a tecnologia, mas conhecer seu domínio de negócios e entender as necessidades dos negócios. os vários membros da equipe no trabalho.