Empezando por los reporteros de la Fundación Thomson Reuters en junio.

La unidad Jigsaw de Google está publicando el código de una herramienta antiacoso de código abierto llamada Harassment Manager. La herramienta, destinada a periodistas y otras figuras públicas, emplea la API Perspective de Jigsaw para permitir a los usuarios clasificar los comentarios potencialmente abusivos en plataformas de redes sociales, empezando por Twitter. Está debutando como código fuente para que los desarrolladores lo aprovechen, y luego se lanzará como una aplicación funcional para los periodistas de la Fundación Thomson Reuters en junio.
Harassment Manager puede trabajar actualmente con la API de Twitter para combinar opciones de moderación, como ocultar las respuestas de los tweets y silenciar o bloquear cuentas, con un sistema de filtrado masivo e informes. La perspectiva comprueba el lenguaje de los mensajes en busca de niveles de «toxicidad» en función de elementos como amenazas, insultos y blasfemias. Clasifica los mensajes en colas en un panel, donde los usuarios pueden abordarlos por lotes en lugar de individualmente a través de las herramientas de moderación predeterminadas de Twitter. Pueden elegir desenfocar el texto de los mensajes mientras lo hacen, por lo que no necesitan leer cada uno, y pueden buscar palabras clave además de usar las colas generadas automáticamente.
:no_upscale()/cdn.vox-cdn.com/uploads/chorus_asset/file/23296479/Harassment_Manager_UI_Home.png)
Harassment Manager también permite a los usuarios descargar un informe independiente que contiene mensajes abusivos; esto crea un rastro en papel para su empleador o, en el caso de contenido ilegal como amenazas directas, para la aplicación de la ley. Por ahora, sin embargo, no hay una aplicación independiente que los usuarios puedan descargar. En su lugar, los desarrolladores pueden crear libremente aplicaciones que incorporen su funcionalidad y los servicios que lo utilicen serán lanzados por socios como la Fundación Thomson Reuters.
Jigsaw anunció Harassment Manager en el Día Internacional de la Mujer, y enmarcó la herramienta como particularmente relevante para las mujeres periodistas que se enfrentan a abusos de género, destacando las aportaciones de «periodistas y activistas con grandes presencias en Twitter», así como de organizaciones sin fines de lucro como la Fundación Internacional de Medios de Comunicación de Mujeres y el Comité para la Protección de los Periodistas. En una publicación de Medium, el equipo dice que espera que los desarrolladores puedan adaptarlo a otros usuarios de redes sociales en riesgo. «Nuestra esperanza es que esta tecnología proporcione un recurso para las personas que se enfrentan al acoso en línea, especialmente las mujeres periodistas, activistas, políticas y otras figuras públicas, que se ocupan de una toxicidad desproporcionadamente alta en línea», dice el post.
:no_upscale()/cdn.vox-cdn.com/uploads/chorus_asset/file/23296755/Harassment_Manager_UI_Edit_Report_Details.png)
Google ha aprovechado Perspective para la moderación automatizada antes. En 2019 lanzó una extensión de navegador llamada Tune que permite a los usuarios de redes sociales evitar ver mensajes con una alta probabilidad de ser tóxicos, y ha sido utilizada por muchas plataformas de comentarios (incluido Coral de Vox Media) para complementar la moderación humana. Pero como señalamos en torno al lanzamiento de Perspective and Tune, el modelo de análisis del lenguaje ha estado históricamente lejos de ser perfecto. A veces clasifica mal el contenido satírico o no detecta mensajes abusivos, y la IA al estilo Jigsaw puede asociar inadvertidamente términos como «ciego» o «sordo», que no son necesariamente negativos, con la toxicidad. Jigsaw en sí también ha sido criticado por una cultura tóxica en el lugar de trabajo, aunque Google ha cuestionado las afirmaciones.
Sin embargo, a diferencia de la moderación impulsada por IA en servicios como Twitter e Instagram, Harassment Manager no es una función de moderación del lado de la plataforma. Aparentemente, es una herramienta de clasificación para ayudar a gestionar la escala a veces abrumadora de la retroalimentación de las redes sociales, algo que podría ser relevante para las personas que están fuera del ámbito del periodismo, incluso si no pueden usarlo por ahora.