27/07/2024

Los datos en la IA: “Garbage in, garbage out”
L

Llevamos años escuchando que los datos son el petróleo del siglo XXI o el nuevo activo de valor de la economía moderna. Asumiendo por tanto que son el patrón oro en esta era dominada por la Inteligencia Artificial (IA), es lógico llegar a la conclusión de que su gobernanza será el pilar fundamental de las organizaciones. […]

Te puede interesar

Llevamos años escuchando que los datos son el petróleo del siglo XXI o el nuevo activo de valor de la economía moderna. Asumiendo por tanto que son el patrón oro en esta era dominada por la Inteligencia Artificial (IA), es lógico llegar a la conclusión de que su gobernanza será el pilar fundamental de las organizaciones.

Uno de los riesgos que entraña el uso de las nuevas herramientas tecnológicas como la IA es la validez de sus resultados. A nivel macro, sabemos que el desarrollo de las mismas se realiza a través del entrenamiento sobre millones de datos. Empresas como Google, Meta o Microsoft compran grandes bancos de datos para poder ampliar este aprendizaje de las inteligencias artificiales. A más datos, palabras e información, más conocimiento artificial; más eficacia en la resolución de problemas. Barrera: los datos pueden ser finitos… o parecerlo. En un reciente estudio del Instituto de Investigación Epoch AI, se prevé que en 2026 se hayan agotado los datos de alta calidad en la red. Entre las soluciones que se proponen para afrontar estos retos, se investigan los entrenamientos con “datos sintéticos” o lo que es lo mismo, que la IA genere la información artificialmente y con mismas características y estructura a datos del mundo real para su propio entrenamiento.

- Publicidad -

En este contexto queda en duda la calidad de dichos datos, siendo el riesgo el propio
“envenenamiento” por calidad cuestionable de los datos generados por la IA (que
no representen la realidad). No obstante, el uso de datos sintéticos será útil para pequeñas empresas con menos capacidad de generar grandes volúmenes de datos.

Por otro lado, siguiendo a nivel “micro” o empresa no tecnológica, se cumple la máxima de “tu inteligencia artificial es tan buena como la calidad de tus datos”, expresión muy extendida dentro del sector. “Garbage in, garbage out” (basura entra, basura sale). Los problemas con la calidad de los datos incluyen datos incorrectos, duplicados, no relevantes o mal registrados, así como suposiciones erróneas y sesgos en modelos de IA. Los “dirty data” (datos sucios) como algunos los llaman, pueden provocar resultados y decisiones equivocadas, falta de confianza del usuario y errores en proyectos importantes. Cuando los modelos de IA se entrenan con estos datos sucios se generan respuestas inexactas, erróneas o también conocidas como “alucinaciones” de la IA. Por todo ello, una gobernanza sólida de datos es esencial para gestionar y validar los datos. Solo las empresas con buena gobernanza prosperarán en la era tecnológica.

- Publicidad -

La gobernanza de datos implica gestionar activamente los datos de una empresa para alinearlos con su estrategia y su visión. Estándares claros y herramientas adecuadas. Aunque ojo, no sólo se encarga de garantizar la integridad y precisión de los datos y registros. También forma parte de la gobernanza la creación de políticas y procesos que impulse a los usuarios de la organización a cuidar su calidad. Por todo esto, es fundamental la figura del Chief Data Officer (CDO), rol necesario y encargado de velar por el valor del dato en la empresa, su calidad y alinearlos con los objetivos organizacionales a través de la colaboración estrecha con otros líderes de la empresa. Esto último es muy importante. Requiere de intención, planificación, coordinación y compromiso. Será una cuestión de administración y liderazgo. Si el objetivo de nuestra empresa es la toma de decisiones basada en datos (empresa data driven), es de perogrullo que las decisiones de calidad vendrán de la mano de datos de calidad. Si estuviéramos construyendo el “edificio de la gobernanza del dato”, contaría con pilares como la estrategia, conocimiento, herramientas y metodología sistémica. Pero no hay estructura que aguante firme por muchos pilares que pongamos sin una base sólida. Esta base o soporte es la cultura.

La estrategia y el gobierno del dato están estrechamente relacionados con el desarrollo de una cultura de datos. Ésta implica la adopción de comportamientos y creencias en todos sus trabajadores que valoren el uso de los datos para la toma de decisiones. Hablamos de un enfoque integral que involucre la capacitación, la infraestructura y las herramientas, así como el apoyo organizativo y un compromiso constante con esta toma de decisiones basada en datos. Es fundamental destacar la importancia de la accesibilidad y la alfabetización como ejes esenciales sobre los que pivotar una cultura de datos exitosa. Que todos los empleados puedan acceder fácilmente a los datos y comprender su significado e importancia. Que el 100% de los profesionales de la empresa lo tengan claro. Es un fenómeno global.

- Publicidad -

Llegados a este punto, por ir concluyendo ¿cómo podemos mejorar la situación de nuestra empresa? Trabajando en la base. Probablemente la receta necesitará de 2 ingredientes igualmente importantes: herramientas concretas y personas (expertas). Respecto a los datos, habrá que invertir tiempo en el “momento input” y conseguir mayor observabilidad. Por otro lado, capacitar al personal, facilitar y estandarizar procesos será fundamental. Por último, es clave identificar los sesgos en la IA, decidir sobre su aceptación, mitigar su impacto y ser transparentes al respecto.

En resumen, aviso a navegantes: una empresa que apueste por la IA sin una gobernanza y una estrategia sólida de datos, está navegando hacia aguas turbulentas (garbage), donde los errores de datos pueden poner en peligro la integridad de sus decisiones, la eficiencia de sus operaciones y productos digitales, así como la confianza de sus clientes; poniendo en peligro su sostenibilidad en un mercado cada vez más impulsado por la tecnología.

- Advertisement -

Más noticias

Más noticias