Inteligência Artificial do Google se passa por ser humano no telefone

O Google revelou uma visão de inteligência artificial (AI) que foi ao mesmo tempo emocionante e controversa em sua Developer ConFab na terça-feira.

O Assistente do Google ligou para um salão de beleza para marcar uma consulta e depois ligou para um restaurante para saber sobre a disponibilidade da mesa. As performances fizeram mais do que roubar o show. Eles também ofuscaram tudo o que a Microsoft anunciou sobre a AI em sua própria conferência nesta semana.

“O Google reafirmou sua posição de liderança em inteligência artificial”, afirmou o analista da Atlantic Equities, James Cordwell, em nota na quarta-feira. A nota de Cordwell não mencionou a Microsoft.

Os meios de comunicação foram rápidos em apontar que o Google não divulgou para as pessoas do outro lado das chamadas que o chamador era um programa de computador, não uma pessoa, mesmo que soasse surpreendentemente natural. O problema subjacente? As pessoas podem não tratar chamadas automáticas da mesma forma que as chamadas humanas. Dois dias após a apresentação, o Google, que planeja testar a tecnologia neste verão, esclareceu que se certificará de que as pessoas saibam sempre que for a chamada do Asssitant e não uma pessoa real.

Mas vamos começar com o básico. No palco, o Google não falou muito sobre os detalhes de como o recurso, chamado Duplex, funciona, mas uma postagem no blog adiciona algum contexto importante. Primeiro, o Duplex não é uma caixa de bate-papo futurista da IA, capaz de conversas abertas. Como explicam os pesquisadores do Google, ele só pode conversar em “domínios fechados” – trocas que são funcionais, com limites rígidos sobre o que será dito. “Você quer uma mesa? Por quanto? Em que dia? E a que horas? Ok, obrigado, tchau. ”Fácil!

Mark Riedl, professor associado de IA na Georgia Tech, com especialização em narrativas de computação, disse ao a imprensa que achava que o Assistente do Google provavelmente funcionaria “razoavelmente bem”, mas apenas em situações estereotipadas. “Lidar com diálogos de idiomas fora do contexto é um problema realmente difícil”. “Mas também há muitos truques para disfarçar quando a inteligência artificial não entende ou para trazer a conversa de volta aos trilhos”.

Uma das demonstrações do Google mostrou como esses truques funcionam perfeitamente. A IA foi capaz de lidar com uma série de mal-entendidos, mas o fez repetindo e repetindo questões. Esse tipo de coisa é comum para programas de computador projetados para falar com humanos. Snippets da conversa parecem mostrar inteligência real, mas quando você analisa o que está sendo dito, eles são revelados como gambits pré-programados. A postagem do blog do Google oferece alguns detalhes fascinantes sobre isso, soletrando alguns dos sinais verbais que o Duplex usará. Estes incluem elaborações (“para sexta-feira na próxima semana, dia 18”), sincronizações (“você pode me ouvir?”) E interrupções (“o número é 212-” “desculpe, você pode começar de novo?”).

É importante observar que o Google está chamando o Duplex de “experiência”. Não é um produto acabado e não há garantias de que ele estará amplamente disponível neste formulário ou amplamente disponível. (Veja também: o recurso de tradução em tempo real que o Google mostrou por seu Pixel Buds no ano passado. Ele funcionou perfeitamente no palco, mas foi um sucesso na vida real e disponível apenas para os proprietários de telefones Pixel.) Duplex funciona em apenas três cenários no momento: fazer reservas em um restaurante; agendamento de cortes de cabelo; e perguntando às empresas por suas horas de férias. Ele também estará disponível apenas para um número limitado (e desconhecido) de usuários em algum momento deste verão.

Mais uma grande advertência: se uma chamada der errado, um humano assume o controle. Em seu post no blog, o Google diz que o Duplex possui uma “capacidade de automonitoramento” que permite reconhecer quando as conversas ultrapassaram suas capacidades. “Nestes casos, sinaliza para um operador humano, que pode completar a tarefa”, diz o Google. Isso é semelhante ao assistente pessoal M do Facebook, que a empresa prometeu usar a AI para lidar com os cenários de atendimento ao cliente, mas acabou terceirizando uma quantidade desconhecida desse trabalho para os humanos. (Facebook fechou esta parte do serviço em janeiro.)

Tudo isso nos dá uma imagem mais clara do que o Duplex pode fazer, mas não responde às perguntas sobre quais efeitos o Duplex terá. E como a primeira empresa a demonstrar essa tecnologia, o Google tem a responsabilidade de enfrentar esses problemas de frente.

A pergunta óbvia é: a empresa deve notificar as pessoas de que estão falando com um robô? O vice-presidente de engenharia do Google, Yossi Matias, disse à imprensa que é “provável” que isso aconteça. Mas o Google foi além e disse que acredita que tem a responsabilidade de informar os indivíduos. (Por que isso nunca foi mencionado no palco não está claro.)

Esquema visual de como funcionaria a AI Google de forma simplificada

FLuxo ilustrado da interação do Google Duplex com o Negócio de rua tradicional por telefone

Muitos especialistas que trabalham nesta área concordam, embora exatamente como você diria a alguém que está falando com uma IA é uma pergunta complicada. Se o Assistente iniciar as chamadas dizendo “Olá, sou um robô”, é provável que o receptor desligue. Indicadores mais sutis podem significar limitar o realismo da voz da IA ou incluir um tom especial durante as chamadas. O Google diz ao que um conjunto de normas sociais irá evoluir organicamente, deixando claro quando o interlocutor é um AI.

Joanna Bryson, professora associada da Universidade de Bath, que estuda ética em IA, disse que o Google tem a óbvia obrigação de divulgar essa informação. Se os robôs puderem posar livremente como seres humanos, o escopo para o dano é incrível; variando de fraudes para fraudes automatizadas. Imagine receber um telefonema em pânico de alguém dizendo que houve um tiroteio por perto. Você faz algumas perguntas, eles respondem – o suficiente para convencê-los de que são reais – e depois desligam, dizendo que receberam o número errado. Você ficaria preocupado?

Mas Bryson diz que permitir que as empresas gerenciem isso sozinhas não será suficiente, e haverá novas leis introduzidas para proteger o público. “A menos que o regulemos, alguma empresa em uma posição menos visível do que o Google aproveitará essa tecnologia”, diz Bryson. “O Google pode fazer a coisa certa, mas nem todo mundo vai.”

E se essa tecnologia se tornar difundida, haverá outros efeitos mais sutis, do tipo que não pode ser legislado. Escrevendo para o Atlântico, Alexis Madrigal sugere que a conversa fiada – seja durante telefonemas ou conversas na rua – tem um valor social intangível. Ele cita a urbanista Jane Jacobs, que diz que “o contato público e informal em nível local” cria uma “rede de respeito e confiança pública”. O que perderemos se oferecermos às pessoas outra opção para evitar interações sociais, não importa quão pequenas sejam?

Um dos efeitos das ligações telefônicas AI pode ser tornar todos nós um pouco mais rudes. Se não podemos dizer a diferença entre humanos e máquinas no telefone, vamos tratar todas as conversas telefônicas com suspeita? Poderíamos começar a cortar pessoas reais durante as chamadas, dizendo-lhes: “cale a boca e deixe-me falar com um humano.” E se se torna mais fácil para nós reservas em um restaurante, podemos aproveitar esse fato e registrá-los mais especulativamente, não se importando se nós realmente não aparecermos? (O Google disse depois que limitaria tanto o número de chamadas diárias que uma empresa pode receber do Assistente, quanto o número de chamadas que o Assistente pode fazer, a fim de impedir que as pessoas usem o serviço de spam.)

Não há respostas óbvias para essas questões, mas, como aponta Bryson, o Google está, pelo menos, fazendo do mundo um serviço, chamando a atenção para essa tecnologia. Não é a única empresa que desenvolve esses serviços e certamente não será a única a usá-los. “É uma grande coisa que eles estão mostrando isso”, diz Bryson. “É importante que eles continuem fazendo demos e vídeos para que as pessoas possam ver que isso está acontecendo. […] O que realmente precisamos é de uma cidadania informada”.