O aprendizado por reforço pode dar uma boa rotação dinâmica ao marketing

Autor: Roger Morrison
Data De Criação: 1 Setembro 2021
Data De Atualização: 1 Julho 2024
Anonim
O aprendizado por reforço pode dar uma boa rotação dinâmica ao marketing - Tecnologia
O aprendizado por reforço pode dar uma boa rotação dinâmica ao marketing - Tecnologia

Contente



Fonte: Juliatimchenko / Dreamstime.com

Leve embora:

O aprendizado por reforço é um subconjunto de inteligência artificial e aprendizado de máquina que pode prever resultados e ajudar os usuários a tomar melhores decisões.

Os profissionais de marketing estão constantemente procurando soluções escaláveis ​​e inteligentes ao tentar obter uma vantagem nas condições de marketing cada vez mais competitivas. Não é de admirar que a inteligência artificial (IA) e o aprendizado de máquina (ML) agora estejam sendo adotados em massa pelas marcas e suas organizações de marketing. (Para saber mais sobre o básico do ML, consulte Machine Learning 101.)

Para os não iniciados, a IA geralmente pode ser considerada uma tecnologia quando um computador automatiza as tarefas definidas que um ser humano faria. O aprendizado de máquina, como uma área funcional dentro da IA, é quando um computador recebe um objetivo final, mas precisa calcular a melhor rota por conta própria.


Hoje, estamos vendo essas tecnologias - especialmente aprendizado de máquina - implementadas em muitas áreas de marketing, incluindo detecção de fraude de anúncios, previsão de comportamento do consumidor, sistemas de recomendação, personalização criativa e muito mais.

Embora tudo esteja bem, há uma nova tecnologia de ramificação que, para os profissionais de marketing, atenderá realmente à demanda que o aprendizado de máquina está criando. É chamado de "aprendizado por reforço" (RL).

O que é aprendizado por reforço?

A mudança de etapa de ML para RL é mais do que apenas uma letra. A maioria das tarefas entregues ao aprendizado de máquina envolve o uso de uma única etapa, como "reconhecer esta imagem", "entender o conteúdo do livro" ou "pegar fraude". Para um profissional de marketing, uma meta de negócios como "atrair, reter e engajar usuários" é inerentemente, de várias etapas e de longo prazo, que não é facilmente alcançado com o aprendizado de máquina.


É aqui que entra o aprendizado por reforço. Os algoritmos de RL têm como objetivo otimizar para uma jornada que se desdobra e muda constantemente - uma onde ocorrem problemas dinâmicos. Ao empregar uma "função de recompensa" matemática para calcular o resultado de cada permutação, a RL pode ver o futuro e fazer a decisão certa.

Hoje, as melhores formas de realização dessa tecnologia de ponta podem ser vistas em jogos e carros autônomos. Quando o sistema AlphaGo do Google venceu o melhor jogador do mundo no jogo de tabuleiro Go, no ano passado, seu molho secreto foi o aprendizado por reforço. Enquanto os jogos definem regras, as opções de um jogador para o caminho da vitória mudam dinamicamente com base no estado do tabuleiro. Com o aprendizado por reforço, o sistema responde por todas as permutações possíveis que podem mudar com base em cada próximo movimento.

Da mesma forma, um carro autônomo segue uma jornada em que as regras da estrada e a localização do destino permanecem fixas, mas as variáveis ​​ao longo do caminho - de pedestres a bloqueios de estradas - a ciclistas - mudam dinamicamente. É por isso que a OpenAI, a organização fundada por Elon Musk, da Tesla, emprega algoritmos avançados de RL para seus veículos.

Sem erros, sem estresse - seu guia passo a passo para criar software que muda vidas sem destruir sua vida


Você não pode melhorar suas habilidades de programação quando ninguém se importa com a qualidade do software.

Máquinas para profissionais de marketing

O que isso significa para os profissionais de marketing?

Muitos dos principais desafios dos profissionais de marketing são criados pelo fato de que a condição do negócio muda o tempo todo. Uma estratégia de campanha vencedora pode se tornar desfavorecida ao longo do tempo, enquanto uma estratégia antiga pode ganhar nova força. RL é um passo para imitar a verdadeira inteligência humana, onde aprendemos com o sucesso e / ou fracasso de vários resultados e formamos uma estratégia vencedora do futuro. Deixe-me dar alguns exemplos:

1. Aprimoramento do envolvimento do usuário

Vamos nos concentrar no engajamento do cliente para uma cadeia de restaurantes e uma meta de multiplicá-lo dez vezes ao longo do próximo ano. Hoje, uma campanha de marketing pode envolver uma saudação de aniversário com uma oferta de desconto, talvez até com base nas preferências alimentares. Esse é o pensamento linear em que o profissional de marketing definiu um ponto inicial e final.

Em um mundo agitado, a vida dos clientes muda constantemente em tempo real - às vezes eles são mais engajados, às vezes menos. No aprendizado por reforço, um sistema constantemente recalibraria quais táticas no arsenal de marketing, a qualquer momento, têm a melhor chance de levar o destinatário ao objetivo final do envolvimento de 10x.

2. Alocação dinâmica de orçamento

Agora imagine um cenário de publicidade no qual você tenha um orçamento de US $ 1 milhão e precise gastar alguns até o final do mês, alocado em quatro canais diferentes: TV, promoções de fidelidade e Google. Como você pode garantir que está gastando o orçamento da melhor maneira possível? A resposta depende do dia, dos usuários-alvo, do preço do estoque e de vários outros fatores.

No aprendizado por reforço, os algoritmos usariam dados históricos de resultados de anúncios para escrever funções de recompensa que pontuam determinadas decisões de gastos. Mas também é responsável por fatores em tempo real, como preços e probabilidade de recepção positiva do membro do público-alvo. Por meio do aprendizado interativo, a alocação dos gastos com anúncios ao longo do mês mudaria dinamicamente. Embora o objetivo final seja definido, a RL alocará o orçamento da melhor maneira possível em todos os cenários. (Para saber mais sobre IA em marketing, consulte Como a inteligência artificial revolucionará o setor de vendas.)

Em breve

O aprendizado por reforço reconhece a complexidade e reconhece que as pessoas são heterogêneas e respondem por essas verdades, melhorando a cada ação seguinte ao longo do tempo, à medida que as peças do seu tabuleiro de jogo mudam em torno dela.

A aprendizagem por reforço ainda é amplamente preservada de projetos de pesquisa e adotantes de ponta. O conceito e a técnica de matemática existem há mais de 40 anos, mas não foram possíveis para implantação até relativamente recentemente, graças a três tendências:

  1. Proliferação do poder de computação por meio de GPUs (unidades de processamento gráfico) de alta potência.

  2. A computação em nuvem disponibiliza energia de processador de ponta por uma fração do custo de compra das próprias GPUs, permitindo que terceiros aluguem uma GPU para treinar seu modelo de RL por várias horas, dias ou semanas a um preço relativamente baixo.

  3. Melhoria em algoritmos numéricos ou heurística inteligente. Algumas etapas numéricas críticas em um algoritmo RL agora podem convergir em um ritmo muito mais rápido. Sem esses truques numéricos mágicos, eles ainda não seriam possíveis, mesmo com os computadores mais poderosos de hoje.

Pensando Maior

Tudo isso significa que os novos poderes do aprendizado por reforço logo estarão disponíveis em escala para marcas e profissionais de marketing. No entanto, adotá-lo exigirá uma mudança de mentalidade. Para um gerente de marketing, essa tecnologia significa a capacidade de tirar as mãos do volante.

Toda empresa tem um objetivo, mas quando você está mergulhado nas trincheiras, as ações diárias realizadas para esse objetivo podem ficar confusas. Agora, a tecnologia RL permitirá que os tomadores de decisão estabeleçam a meta, tendo mais confiança de que os sistemas traçarão seu melhor caminho em direção a ela.

Na publicidade, por exemplo, hoje em dia muitas pessoas percebem que métricas como a taxa de cliques (CTR) são apenas proxies para resultados reais dos negócios, contados apenas porque são contáveis. Os sistemas de marketing orientados à RL enfatizarão essas métricas intermediárias e todo o trabalho pesado associado a elas, permitindo que os chefes se concentrem nos objetivos.

Isso exigirá que as empresas pensem em seus grandes problemas de maneira muito mais proativa e a longo prazo. Quando a tecnologia estiver madura, eles atingirão seu objetivo.

Caminho para Adoção

O aprendizado por reforço ainda não está pronto para uso em larga escala pelas marcas; no entanto, os profissionais de marketing devem ter tempo para entender esse novo conceito que pode revolucionar a maneira como as marcas fazem marketing, cumprindo algumas das promessas iniciais do aprendizado de máquina.

Quando a energia chegar, ela virá no software de marketing com uma interface do usuário, mas as tarefas exigidas por esse software serão radicalmente simplificadas. Para a equipe, haverá menos interruptores em movimento e números de entrada, além de menos leitura de relatórios analíticos e atuação neles. Por trás do painel, o algoritmo lidará com a maior parte disso.

É improvável que RL consiga combinar a inteligência humana desde o início. A velocidade de seu desenvolvimento dependeria do feedback e sugestões dos profissionais de marketing. Devemos garantir que estamos solicitando a um computador que resolva o problema certo e penalizando-o quando isso não acontecer. Parece que você ensinaria seu próprio filho, não é?