Função do trabalho: cientista de dados

Autor: Roger Morrison
Data De Criação: 28 Setembro 2021
Data De Atualização: 11 Poderia 2024
Anonim
Função do trabalho: cientista de dados - Tecnologia
Função do trabalho: cientista de dados - Tecnologia

Contente


Fonte: Sergey Khakimullin / iStockphoto

Leve embora:

Os cientistas de dados têm trabalhos abrangentes que variam consideravelmente de acordo com o aplicativo. Mas uma coisa que todos eles têm em comum é a unidade para fazer bom uso dos dados.

O que um cientista de dados faz em relação à inteligência artificial e ao aprendizado de máquina funciona? Muitos profissionais que lidam com esse tipo de projeto todos os dias diriam que a pergunta é meio difícil de responder simplesmente. Uma pergunta melhor seria: O que os cientistas de dados NÃO fazem?

Um cientista de dados é parte integrante de um processo de IA ou ML, no sentido de que todos esses projetos dependem de big data ou entradas complexas. O cientista de dados é o carreirista essencial que sabe como trabalhar com dados para produzir resultados.

No entanto, existem algumas maneiras de falar sobre o que um cientista de dados faz, quais qualificações ele precisa e qual é o seu papel no processo.


Ler: 6 principais conceitos de ciência de dados que você pode dominar através do aprendizado on-line

Definições variadas, deveres variados

Muitos especialistas que descrevem o trabalho de um cientista de dados falam sobre isso em termos amplos.

“Em pequenas empresas ou ao trabalhar em um novo mercado, o papel de um cientista de dados é converter fontes de dados relativamente novas (mas óbvias) em coisas que resolvem um problema para um usuário final, o que não seria possível anteriormente, onde as tecnologias empregadas não existiam ”, diz Antonio Hicks, gerente de contas da Mercury Global Partners. "O candidato ideal é alguém que é matemático, engenheiro de software e empreendedor".

Outros ecoam essa idéia básica, mencionando quais dados os cientistas precisam para lidar com projetos de modelagem.

"O atributo mais importante que um cientista de dados precisa é de uma profunda curiosidade sobre o mundo ao seu redor - seja respondendo perguntas ou construindo modelos, o desejo de entender o problema à sua frente é fundamental", diz Erin Akinci, gerente de cientista de dados no Asana. "A partir daí, a maioria das pessoas precisará de habilidades em matemática e programação para encontrar soluções, mas os tipos específicos de matemática e programação variam amplamente, dependendo da área de especialização em ciência de dados".


Sem erros, sem estresse - seu guia passo a passo para criar software que muda vidas sem destruir sua vida

Você não pode melhorar suas habilidades de programação quando ninguém se importa com a qualidade do software.

"Um excelente trabalho científico tem mais a ver com a maneira como um cientista pensa sobre um problema do que com as ferramentas que ele usa para resolvê-lo", acrescenta Charlie Burgoyne, fundador e CEO da Valkyrie Intelligence. A Valkyrie é uma empresa de consultoria em ciência aplicada com projetos impressionantes, como o Mark I, um dispositivo de rede dedicado que aprimora o treinamento e o teste de redes neurais, melhorando o que é possível com as plataformas de aprendizado de máquina anteriores baseadas na nuvem.

"O mercado exige cientistas que sejam proficientes no desenvolvimento de Python, no design de redes neurais e na capacidade de remodelar um repositório de dados na mais recente arquitetura de banco de dados", diz Burgoyne. “Essas capacidades, no entanto, são apostas para um cientista talentoso. O que é menos óbvio é a aptidão de um cientista para curiosidade intrépida, engenhosidade agressiva e adesão ao método científico ".

As habilidades de um cientista de dados

Portanto, no que diz respeito a conjuntos de habilidades práticas, os cientistas de dados precisam de alguma quantidade de criatividade e conhecimento no que diz respeito à modelagem. Eles também podem se beneficiar bastante com "habilidades", como experiência em codificação em Python, C ++ ou outras linguagens comuns aplicadas a projetos de ML.

“Python e C ++ são essenciais e poder combinar habilidades de codificação com análise e processamento de dados e estatística são habilidades essenciais que farão com que um cientista de dados se destaque como um forte candidato ou funcionário”, diz Val Streif, da Pramp, uma plataforma de entrevistas simuladas on-line para engenheiros de software, desenvolvedores e cientistas de dados. "Embora algumas das habilidades de programação possam ser resolvidas ao associar um cientista de dados a um desenvolvedor, é muito mais fácil se você tiver as duas habilidades combinadas em uma, da perspectiva de uma empresa".

Outros especialistas adicionam R, Hadoop, Spark, Sas e Java à lista, além de tecnologias como Tableau, Hive e MATLAB.

Tudo isso contribui para um currículo impressionante, mas alguns que têm experiência em recrutar cientistas de dados dizem que o outro lado "humano" também é importante. (Um tipo de cientista de dados é o cientista de dados do cidadão. Saiba mais em O papel dos cientistas de dados do cidadão no mundo do Big Data.)

"Tradicionalmente, indivíduos com uma educação diversificada em artes liberais são excelentes cientistas de dados", diz Burgoyne, fazendo uma distinção entre engenheiros, que estão do lado do prédio, e cientista de dados, cujo trabalho pode ser muito mais conceitual. Ele continua:

A experiência em um campo STEM tradicional, com um foco complementar nos domínios das ciências humanas, artes ou negócios, fornece as qualidades que fazem de um excelente cientista orientado para a indústria. Deve-se dizer que é igualmente importante para a capacidade da organização de aproveitar essas qualidades e moldar seu fervor e métodos de maneira produtiva. Observei que, quando uma iniciativa de ciência de dados não é bem-sucedida, a organização tem a mesma probabilidade de ser tão culpada quanto os cientistas. Os cientistas não são engenheiros. Eles não são orientados a executar e construir. Eles são levados a descobrir e entender. As organizações que compreendem essa diferença são bem recompensadas pelo cultivo de ambos os campos.

Quanto aos dados aos quais os cientistas normalmente se aplicam, isso tem a ver com os principais objetivos da empresa. Algumas empresas estão buscando uma Internet descentralizada - outras estão brincando com IoT ou SaaS. Outros estão tentando ser pioneiros em IA “amigável” ou “ética” ou “transparente”.

De qualquer forma, é provável que os cientistas de dados colmaram a divisão entre as métricas rígidas dos dados que usam, em qualquer pilha de tecnologia em que estão em jogo, e o trabalho livre de conceitualizar a funcionalidade de IA / ML.

"Contratamos cientistas de dados para gerenciar a coleta e limpeza de dados, além de traduzir esses dados em informações significativas", diz Michael Hupp, gerente de ciência e análise de dados da G2 Crowd. Ele elabora:

Normalmente, isso significa gerenciar quaisquer algoritmos importantes que controlam o mecanismo de dados de uma empresa e ser fluente nas principais ferramentas e linguagens de análise, mas nos últimos anos também incluiu campos emergentes como processamento de linguagem natural, aprendizado de máquina e outras formas de análise ativada por IA. Os cientistas de dados mais bem-sucedidos são aqueles que combinam suas habilidades difíceis com a capacidade de aprender rapidamente e a capacidade de comunicar efetivamente os insights que descobrem, para que sejam significativos para os negócios.

Com esses tipos de informações, é mais fácil para jovens profissionais ou estudantes descobrir se o cientista de dados seria um bom papel para eles e como adquirir habilidades. O aprendizado de STEM está se tornando mais acessível nas escolas de todo o país, mas não há substituto para a paixão por codificação e tecnologia e a capacidade de aprender em tempo real.