Herramienta de fuentes abiertas de Adobe para desinfectar registros y detectar credenciales expuestas

Adobe ha puesto a disposición en código abierto una herramienta diseñada para identificar cadenas generadas aleatoriamente en cualquier texto sin formato.

Apodada Stringlifier, la herramienta fue escrita en Python y aprovecha el aprendizaje automático para diferenciar secuencias de caracteres aleatorias de secuencias de texto normales.

El proyecto de código abierto debería resultar útil al analizar los registros de seguridad y aplicaciones, o al intentar descubrir credenciales que podrían haber sido expuestas accidentalmente.

Ya sea que se trate de hash, claves API, contraseñas generadas aleatoriamente u otros tipos de cadenas aleatorias en el código fuente, registros o archivos de configuración, Stringlifier debería ayudar a identificarlos fácilmente.

El código fuente de Stringlifier se ha publicado en el repositorio público de GitHub de Adobe, pero el gigante del software también puso a disposición un paquete de instalación «pip» (instalador de paquetes de Python) con un modelo previamente entrenado incluido.

Adobe dice que ya ha utilizado la herramienta para identificar cadenas aleatorias cuando busca anomalías en conjuntos de datos, además de la utilidad de código abierto llamada Tripod.

El equipo utilizó varios enfoques para preprocesar y convertir cadenas largas en forma numérica, pero estos enfoques se topan con un obstáculo cuando se encuentran cadenas aleatorias, lo que interrumpe el algoritmo de agrupación en clústeres.

Al reemplazar todas las secuencias de caracteres aleatorios con <RANDOM_STRING> , el equipo pudo agrupar tipos similares de líneas de comando más fácilmente, incluso si empleaban hashes aleatorios en sus parámetros.

“Esperamos que encuentre útil el stringlifier. El código fuente completo está disponible en el repositorio de GitHub de Adobe. También puede encontrar todos nuestros otros proyectos de código abierto de todos los equipos de seguridad de Adobe en ese repositorio. Esperamos recibir comentarios y las contribuciones siempre son bienvenidas ”, señala Adobe.

La compañía también proporciona información sobre cómo comenzar a usar Stringlifier, así como sobre cómo los usuarios pueden entrenar sus propios modelos cuando buscan detectar diferentes tipos de cadenas.