Lições aprendidas: como criar jogos e histórias para smart displays

Este guia compartilha nossas principais lições que aprendem sobre como ajudar os desenvolvedores a criar ótimas experiências de narrativa e jogos para o Google Assistente em smart displays. Recomendamos a leitura deste guia antes de projetar sua Ação para criar uma experiência agradável e evitar erros comuns. No final deste guia, também fornecemos uma lista de verificação que condensa essas recomendações para ajudar você a avaliar seu design.

Defina as expectativas na introdução

Para facilitar o engajamento do usuário com sua experiência, a introdução precisa fornecer instruções para interagir com a ação e definir expectativas claras. No caso de jogos, use a abertura como um tipo de tutorial para explicar o objeto do jogo e como ele é jogado. Lembre-se de que o objetivo do usuário é começar a jogar rapidamente. Portanto, mantenha a introdução curta (de preferência menos de um minuto). No caso de histórias interativas, informe ao usuário a duração provável da experiência. Essa abordagem pode ser tão simples quanto uma descrição rotulada na GUI. Além disso, informe a eles o que esperar quando forem pedidos respostas durante a narrativa.

Uma interface de linguagem natural abre muitos caminhos criativos para o design, mas também significa que há uma responsabilidade inicial maior de articular as metas da interação.

Encontre o equilíbrio entre interações de toque e voz

Os smart displays foram criados para uso com o viva-voz. Na maioria dos casos de uso, supomos que a voz é o modo principal de interação. Em geral, tudo que um usuário pode realizar por toque também deve ser feito por voz. Imagine uma criança pedindo para ouvir uma história na cama ou alguém jogando enquanto cozinhando com as mãos bagunçadas. Usar voz como uma interface agrega um valor real aos nossos usuários.

No entanto, os usuários também gostam de interações rápidas. Às vezes, ler e tocar pode ser mais rápido do que ouvir e falar. Para alguns jogos, o toque pode ser a principal modalidade de interação. Se a jogabilidade seria muito mais fácil para o usuário com um toque, oriente-o a usar o toque. Sempre que possível, no entanto, garanta que as interações também estejam disponíveis por voz.

Mantenha o TTS (conversão de texto em voz) breve

A conversão de texto em voz ou as vozes geradas por computador melhoraram exponencialmente nos últimos anos, mas não são perfeitas. Por meio de testes com usuários, descobrimos que os usuários (especialmente crianças) não gostam de ouvir mensagens longas de TTS. Obviamente, alguns conteúdos, como histórias interativas, não podem ser reduzidos. No entanto, para jogos, tente manter seu script simples. Sempre que possível, aproveite o poder do meio visual e mostre, não conte. Outra opção é fornecer um botão "Pular" na tela para que os usuários possam ler e avançar sem esperar até que o TTS seja concluído. Em muitos casos, o TTS e o texto na tela nem sempre precisam se espelhar mutuamente. Por exemplo, o TTS pode dizer "Bom trabalho! Vamos para a próxima pergunta. "Qual é o nome do cachorro grande vermelho?", e o texto na tela pode simplesmente dizer "Qual é o nome do cachorro grande vermelho?"

Considere a primeira vez e os usuários recorrentes

Usuários frequentes não precisam ouvir as mesmas instruções de TTS repetidamente. Otimizar a experiência para usuários recorrentes. Se for a primeira experiência do usuário, tente explicar o contexto completo. Se ele revisitar a ação, confirme o retorno com uma mensagem "Bem-vindo de volta" e tente encurtar (ou diminuir) o TTS. Se você perceber que o usuário retornou mais de três a quatro vezes, tente chegar ao ponto o mais rápido possível.

Veja um exemplo de redução das instruções para usuários diferentes :

  • Instruções para um novo usuário:"Basta dizer palavras que você pode fazer com as letras fornecidas. Tudo pronto para começar?"
  • Para um usuário recorrente:"Crie palavras usando as letras misturadas. Tudo pronto?"
  • Para usuários frequentes:"Tudo pronto para jogar?"

Abra o microfone corretamente

O microfone precisa abrir após cada pergunta direta porque, ao fazer uma pergunta, você está convidando o usuário a responder explicitamente. A necessidade de dizer uma palavra de ativação para abrir o microfone não é intuitivo para os usuários no meio do jogo e pode deixá-los confusos, resultando em enunciados e erros perdidos ou repetidos. Abra o microfone imediatamente e permita que o usuário responda o mais rápido possível após uma pergunta.

Qualquer linguagem que incentive o usuário a responder deve estar no final da solicitação, logo antes de o microfone abrir. Essa abordagem evita que o usuário tente responder enquanto o microfone está fechado, o que causa frustração e cria um erro.

O que fazer: " Tenho vermelho, verde ou azul. Qual você quer?"

O que não fazer: "Qual cor você quer? Tenho vermelho, verde ou azul."

Enfatize perguntas

Uma diferença principal entre a linguagem escrita e a falada é que a escrita é persistente. Ela permanece na página, onde pode ser facilmente reescrita em caso de perda. Como a conversa é temporária, é fácil não perceber quando uma pergunta está sendo feita. Deixe a pergunta clara para que os usuários possam entender e responder.

Há algumas maneiras diferentes de fazer isso. Pode haver uma mudança na música de fundo ou no humor na tela. Você também pode adicionar um som curto (ou ícone auditivo) antes da pergunta.

Se você colocar as perguntas na tela, elas precisam ficar visíveis durante a reprodução do TTS. Às vezes, o jogador pode querer avançar lendo a pergunta e usando o toque para avançar.

Preparar-se para erros "sem correspondência" e casos extremos

É recomendável encaminhar o tratamento de erros e as solicitações específicas do contexto para dar aos usuários várias oportunidades de engajar novamente quando houver uma escolha a ser feita ou uma pergunta respondida. Em cada momento de escolha da experiência, determine se uma resposta do usuário é necessária ou se você pode levar os usuários à frente de forma elegante sem ouvir a escolha.

Em uma estratégia de erro crescente, digamos que a pergunta inicial seja "Você pode ter vermelho, verde ou azul. Qual cor você quer?" Se houver uma mensagem Sem correspondência (em que a resposta do usuário não é compreendida), a prática padrão será uma nova solicitação rápida: "Qual cor era essa?" Se houver outro "Sem correspondência", a próxima resposta dará um pouco mais de contexto: "Você quer vermelho, verde ou azul?" Se ele ainda não responder com algo que o sistema possa reconhecer, você pode seguir em frente para mantê-lo no jogo ou na história: "Vamos usar o vermelho desta vez". Você também pode instruir o usuário a usar os botões na tela para fazer uma escolha.

Para situações em que o usuário não responde a uma pergunta, o microfone é fechado após um número predeterminado de segundos, exigindo que o usuário use a entrada por toque.

Há algumas intents usadas com frequência que melhoram a experiência do usuário. Se a Ação não oferecer suporte para elas, os usuários poderão ficar frustrados. Confira a seguir uma lista de intents altamente recomendadas:

  • "Sair / Sair"

    Fecha a ação.

  • “Repita / Diga isso de novo”

    Repete imediatamente o conteúdo anterior. Ela precisa estar disponível a qualquer momento.

  • "Jogar de novo"

    Permite que o usuário inicie a experiência de ação novamente. Essa intent dá aos usuários a oportunidade de voltar a interagir com as experiências favoritas deles.

  • "Ajuda"

    Oferece instruções mais detalhadas para os usuários que podem ter se perdido. Dependendo do tipo de ação, talvez ela precise ser específica para o contexto. O padrão é retornar os usuários de onde pararam no jogo depois de uma mensagem de ajuda.

  • "Pausar, retomar"

    Permite que o usuário pause ou retome a experiência. Forneça uma indicação visual de que o jogo foi pausado e ofereça opções visuais e de voz para retomar.

  • "Pular"

    Passa para o próximo ponto de decisão.

  • "Página inicial / Menu"

    Move para a página inicial ou o menu principal de uma ação. Ter uma affordance visual é uma ótima ideia. Sem indicações visuais, é difícil para os usuários saberem que podem navegar por voz, mesmo quando há suporte para isso.

  • “Voltar”

    Volta para a página anterior em uma história interativa.

Garanta a legibilidade

O smart display é um dispositivo fixo e pode ser usado à distância em muitos casos de uso. Recomendamos o uso de fontes maiores para garantir a legibilidade: no mínimo 32pt para texto principal e 24pt para texto secundário.

Além disso, usar o espaço negativo corretamente pode reduzir a confusão visual. Se não houver espaço suficiente entre os elementos, eles se tornarão difíceis de ler e exigirão um esforço adicional. Coloque um pouco de espaço para respirar ao redor do objeto. Recomendamos colocar uma margem de 40px na borda da tela.

Fornecer feedback visual

Quando a execução dos pedidos dos usuários for muito demorada, ofereça feedback visual adequado. Em vez de usar um ícone de carregamento, tente ser transparente sobre o que está acontecendo. Quanto tempo resta para concluir a tarefa? Quanto do conteúdo foi carregado? O que está acontecendo no sistema? Além disso, confira se a ação oferece suporte ao estado pressionado de botões para oferecer feedback de toque imediato aos usuários. Isso pode evitar facilmente que erros sejam tocados duas vezes.

Reduza a carga cognitiva

A tela pode ajudar a reduzir a carga cognitiva mostrando informações compactas de maneira organizada. Mantenha o conteúdo na tela claro, conciso e verificável, com as informações mais importantes primeiro. Os comandos de exibição podem precisar ser uma versão condensada dos comandos falados e colocados no topo ou no meio da tela. Mostre as respostas nos ícones de sugestão na parte inferior da tela. Se você decidir usar um botão de ícone em vez de um botão de texto, o ícone precisa ser ainda mais claro para que os usuários possam executá-lo por voz sem hesitação.


Lista de verificação

Esta lista de verificação condensa as informações das seções anteriores e fornece uma maneira fácil de evitar problemas comuns no design.

Definir expectativas

Encontre o equilíbrio entre interações de toque e voz

Mantenha o TTS (conversão de texto em voz) breve

Considere a primeira vez e os usuários recorrentes

Abra o microfone corretamente

Enfatize perguntas

Preparar-se para erros "sem correspondência" e casos extremos

Garanta a legibilidade

Projetar uma navegação clara

Fornecer feedback visual

Reduza a carga cognitiva

.

Outros recursos