Comando de voz cresce e amplia mercado para empresas e profissionais

Assistentes já estavam nos celulares, mas ganham corpo com popularização das caixas de som inteligentes

Marcelo Gimenes Vieira

21/01/2020

É um cenário cada vez mais comum em mercados desenvolvidos: a pessoa chega em casa e pede em voz alta que as luzes acendam. Depois, que a TV ligue no canal de esportes. Quando vai pegar uma cerveja na geladeira e percebe que acabou, pede para o assistente na mesa de centro comprar um engradado e entregar o mais rápido possível. Afinal, o jogo já vai começar.

 

 

Tudo por voz. Nenhuma tela tocada, nenhuma tecla digitada.

 

 

Esse é o mundo em que os assistentes se tornam uma interface cada vez mais comum. Eles já estão em telefones celulares nos nossos bolsos há algum tempo, e tem feito buscas de sites e produtos para a nossa conveniência.

 

 

Com as técnicas de aprendizado de máquina (Machine Learning) avançando, e com os assistentes inteligentes para casas – como o Home Mini do Google e a linha Echo da Amazon – se tornando mais populares, inclusive no Brasil, surge uma miríade de oportunidades de negócio para as companhias. E, claro, para profissionais que desejam nelas atuar.

 

 

Um estudo de 2018 da ComScore nos EUA mostrou que aproximadamente metade dos usuários de smartphones utilizam recursos de voz em seus aparelhos, sendo que um terço o fazem diariamente. Quase metade dos ouvidos (47%) pretende usar o recurso ainda mais. Ou seja, a voz veio para ficar.

 

 

Outro estudo, este da Meticulous Research e divulgado em 2019, o mercado de reconhecimento de voz deve crescer 17,2% ao ano até 2025, alcançando incríveis US$ 26,7 bilhões.

 

 

“Com cerca de um quarto das residências nos EUA com Google Home, Amazon Echo ou outro alto-falante inteligente (…), fica evidente que este é um caminho sem volta. A voz guiará o mercado daqui frente”, diz André Miceli, coordenador do MBA de marketing e negócios digitais da Fundação Getulio Vargas (FGV) nesta matéria publicada na IT Trends.

 

 

Para ele, o crescimento da voz e de recursos de automação e inteligência artificial a ela conectados – chatbots, por exemplo – deve mudar a forma com as empresas atuam e vendem, priorizando principalmente a experiência do consumidor.

 

 

“A voz é uma ferramenta muito natural para as pessoas. Particularmente no Brasil existe uma grande preferência. O primeiro benefício é ter uma interface mais natural e simples de entender, o que deixa as pessoas mais satisfeitas”, ressalta Alessandro Germano, diretor de desenvolvimento de negócios do Google para América Latina.

“A voz é uma ferramenta muito natural para as pessoas. Particularmente no Brasil existe uma grande preferência. O primeiro benefício é ter uma interface mais natural e simples de entender”

 

Maravilhoso mundo das APIs

 

 

Recursos de comando e reconhecimento de voz só são possíveis e populares graças ao advento da computação em nuvem. Grandes provedores de soluções disponibilizam aos clientes a possibilidade de integrar recursos de voz às soluções por meio das chamadas interfaces de programação de aplicações, ou simplesmente APIs (sigla para o termo em inglês, Application Programming Interface).

 

 

Esses conjuntos de rotinas e padrões permitem que aplicações diversas usem as funcionalidades de uma plataforma na nuvem sem as dificuldades de uma implementação manual, atendo-se a “acoplar” os serviços. Essa é a estratégia da Amazon – player que atualmente divide com o Google e a Apple a liderança desse mercado.

 

 

“O que temos percebido é que, além do uso que as empresas têm feito [de voz], elas têm integrado o recurso às suas ofertas. Uma série de fabricantes de tecnologia estão fazendo isso”, diz Glauber Gallego, gerente de arquitetura de soluções da Amazon Web Services, a AWS.

 

 

Um exemplo citado pelo executivo é o Duolingo, plataforma de ensino de idiomas que usa o Polly – API que converte voz em texto – para interagir com os estudantes durante o processo de aprendizado. Outro uso comum é feito para comunicação entre consumidor e empresas, com as APIs traduzindo voz em texto enquanto o usuário tem as mãos ocupadas.

 

 

O recurso ultrapassa a barreira doméstico, chegando aos grandes softwares de gestão corporativa. Desenvolvedores tem trabalhado para habilitar recursos de voz em ERPs. Outro uso comum é feito em softwares de interface para deficientes visuais. O Audima, por exemplo, utiliza APIs da AWS para permitir interações de usuários portadores de deficiências com websites comuns.

 

 

“As empresas têm entendido que a voz é o caminho. É um novo canal que estão integrando para interagir com consumidores”, resume Gallego. A empresa fornece um kit de skills para a Alexa (Alexa Skill Kit, ou ASK) que facilitam a criação de produtos e serviços que conversem com a caixa de som inteligente da empresa. Há vários casos de uso no Brasil.

“As empresas têm entendido que a voz é o caminho. É um novo canal que estão integrando para interagir com consumidores”

 

Para Germano, do Google, companhias brasileiras estão atentas e lançando assistentes de interação por voz, que “caíram no gosto das empresas e das pessoas, todo mundo entendeu o potencial que [a voz] tem”. O caminho da adoção oferecido pela empresa também é o das APIs.

 

 

Entre os serviços ofertados para as empresas interessadas estão não só compreensão de voz e tradução em texto (e vice-versa), ou de compreensão de linguagem, mas também de intenções. Segundo o executivo do Google, são recursos particularmente usados em soluções de atendimento ao cliente, que buscam reduzir a complexidade das URAs, reduzindo custos.

 

 

Por isso empresas que cujo modelo de operação exigem grandes estruturas de atendimento ao cliente são as que percebem maiores benefícios atualmente. Grandes bancos, empresas de telecomunicações, empresas áreas, governo e (claro) fabricantes de soluções tecnológicas são exemplos. Pequenas e médias empresas, principalmente aquelas de perfil mais inovador (como startups), também conseguem aproveitar esse recurso graças às facilidades da nuvem.

 

 

Gallego cita ainda educação e saúde como setores em que a adoção é crescente. Assistentes de voz em campus podem ajudar os alunos a se informarem melhor a respeito do cotidiano da instituição e sobre suas agendas acadêmicas. Na saúde, podem auxiliar pacientes crônicos a interagirem com médicos e enfermeiros à distância, ou auxiliarem no autocuidado, informando horários de medicações, entre outros recursos.

 

Automação na sala de estar

 

 

A pouco mais de meia década crescendo nos EUA e na Europa, o mercado de caixas de som inteligentes equipadas com assistentes pessoais entrou em evidência no Brasil – ao menos oficialmente – em outubro de 2019 com a chegada do Amazon Echo, equipado com a assistente Alexa em português. Exatamente um mês depois foi a vez do Google começar a comercializar o Nest Mini, equipado com o Google Assistant.

 

 

Apesar de novidade no Brasil, o Echo conta com inúmeras aplicações “importadas” de mercados mais desenvolvidos, e não deve ser difícil para empresas nacionais explorarem o equipamento, diz Gallego, da AWS. Para ele, qualquer serviço que combine voz com aprendizado de máquina tende a crescer rapidamente.

 

 

Germano concorda e ressalta que os assistentes de voz são interfaces que se adaptam muito bem ao ambiente doméstico, e que a partir de sua adoção podem ser imaginados novos e diferentes usos, inclusive de automação doméstica.

 

 

Quase um terço do público americano (30%), segundo dados do Hubspot, já compraram algum produto ou serviço utilizando assistentes de voz (Alexa, Assistant ou Siri) – número que deve crescer junto com as vendas desses dispositivos.

 

 

“Cria-se um ecossistema enorme de fabricantes e serviços que podem estar atrelados à experiencia do Home Mini”, diz. “Os fabricantes de aparelhos, por exemplo: anunciamos coisas com a Positivo, que tem uma linha de produtos importante, e outros fabricantes também. É uma interface também para pedir serviços: comida, carro, produtos etc. É mais uma maneira de buscar conveniência.”

 

Oportunidades profissionais

 

Sustentar esse ecossistema de empresas exige, é claro, profissionais qualificados. Por isso os que desejem atuar com recursos de voz e linguagem deverão se qualificar principalmente em inteligência artificial e aprendizado de máquinas (Machine Learning). Sejam profissionais formados em ciências de dados e que precisam escrever algoritmos.

 

 

Outra possibilidade é atuar com a massiva quantidade de dados necessários para que estas técnicas de IA funcionem. Eles podem criar modelos para fazer pesquisa por voz e recomendações. Graças às APIs, é possível desenvolver aplicações sem necessariamente conhecer programação à fundo. Há serviços em grandes provedores que facilitam a criação de chatbots, por exemplo, sem ter que fazer isso do zero.

 

 

“Um profissional que atue nessas áreas precisa estar atualizado em Machine Learning, IA, interface de voz e assistência, programação mais avançada. No Brasil se encontram profissionais muito bons e existe demanda”, diz Germano, do Google (foto). “É um momento glorioso para um profissional de TI trabalhar.”

 

 

 

Mas não são só os profissionais técnicos que ganham espaço. Cientistas de dados capazes de criar modelos de análise com dados extraídos das interações por voz também serão necessários. A multidisciplinaridade exigida na criação de soluções de negócio é cada vez mais importante, seja qual for o recurso tecnológico utilizado.