
Google reforça defesas do Gmail contra spam
5 Dezembro, 2023Quem tem uma conta Google e utiliza o Gmail, sabe que a sua caixa de entrada diariamente fica recheada de e-mails, e em que muitos deles são claramente spam. Ciente dessa situação, o gigante das pesquisas procura sistematicamente uma formula que lhe permita combater essa situação.
Gmail mais forte contra spam graças ao RETVec
A batalha contra o spam é uma batalha sem fim e em constante evolução e a mais recente inovação do Gmail acaba de ser ilustrada pela Google na sua eficácia: a tecnologia utilizada permitiu uma melhoria de 38% na identificação de texto.
Serviços como o Gmail, mas também o Google Play e o YouTube, dependem de modelos de classificação de texto para serem capazes de reconhecer conteúdos potencialmente prejudiciais (como ataques de phishing, comentários inadequados e fraudes). Esses tipos de texto são mais difíceis de serem classificados pelos modelos de aprendizagem de máquina, pois os invasores usam diversas técnicas — homóglifos (caracteres que parecem semelhantes a letras reais), caracteres invisíveis, excesso de palavras-chave e outras “manipulações de texto adversárias” — estudadas precisamente para escapar a esses mesmos classificadores.
O contra-ataque da Google consiste em focar no RETVec (Resilient & Efficient Text Vectorizer), uma nova abordagem desenvolvida pela Google Research (de código aberto) que ajuda os modelos a alcançar desempenho de classificação de última geração e a reduzir simultaneamente custos, ao mesmo tempo que oferece suporte a “todos os idiomas e todos os caracteres UTF-8 sem a necessidade de pré-processamento de texto”. Resumindo, um sistema que pode ser utilizado em dispositivos móveis, via web e em casos de uso em larga escala.

No caso do Gmail, o RETVec permitiu reconhecer spam de forma 38% mais eficaz, ao mesmo tempo que reduziu a taxa de falsos positivos em 19,4% e o uso da Unidade de Processamento Tensor (TPU) em até 83%. A Google explica que o RETVec tornou possíveis melhorias tão importantes graças a um modelo de incorporação de palavras particularmente leve (cerca de 200 parâmetros), tornando possível reduzir o tamanho do modelo Transformer com desempenho inalterado ou melhor e com a possibilidade adicional de dividir a computação tarefas entre host e TPU de forma eficiente (em termos de rede e memória).
A Google relata que os testes realizados no RETVec no ano passado produziram resultados extremamente positivos.

Joel Pinto
Fundador do Noticias e Tecnologia, e este foi o seu segundo projeto online, depois de vários anos ligado a um portal voltado para o sistema Android, onde também foi um dos seus fundadores.