Cómo proteger secretos comerciales al usar IA

Clase 7 de 12 • Curso de Ética y Manejo de Datos para Inteligencia Artificial

Contenido del curso

Decisiones responsables con datos y LLMs

Privacidad, seguridad y propiedad de datos

Sesgos, calidad y confiabilidad de modelos

Gobernanza y cumplimiento aplicables al trabajo

Resumen

Proteger los datos personales es solo una parte del problema cuando trabajás con inteligencia artificial. La otra cara, menos visible pero igual de crítica, tiene que ver con la propiedad intelectual y los secretos comerciales de tu empresa. Basta con que alguien de tu equipo pegue código propietario en un chatbot para que la lógica de negocio que llevó meses construir deje de ser completamente secreta [0:04]. No porque alguien la hackeó, sino porque alguien la compartió voluntariamente.

¿Cuál es la diferencia entre privacidad y propiedad intelectual?

La privacidad protege a las personas, mientras que la propiedad intelectual protege el valor del trabajo [0:42]. Si alguien publica tu dirección sin permiso, es un problema de privacidad. Si alguien copia tu código y lo vende, es propiedad intelectual. Pero en un sistema de IA pueden pasar las dos cosas al mismo tiempo. Por ejemplo, cuando alguien sube un roadmap confidencial que además incluye nombres de clientes, hay un problema doble [1:00].

El riesgo aparece en tres puntos concretos:

Fuentes de datos: los modelos se entrenan con cantidades masivas de información proveniente de libros, artículos y código. Que algo esté en internet no significa que sea libre de usar [1:19].
Inputs de entrenamiento: cuando ajustás un modelo con datos internos, los equipos suelen pegar informes, contratos y procesos. Muchas plataformas usan datos de chat para mejorar sus modelos, incluso por defecto [1:30].
Salidas generadas: el modelo puede reproducir contenido con copyright. Es como un empleado que leyó un libro y después escribe algo copiándolo casi igual, sin darse cuenta [1:50].

¿Qué son los secretos comerciales y por qué se pierden?

Un secreto comercial es cualquier información que cumple tres condiciones: es secreta, tiene valor económico asociado y se tomaron medidas razonables para protegerla [2:04]. Ejemplos claros: código interno, roadmap, precios, listados de clientes e investigación.

Si no protegés activamente esa información, podés perder su protección legal. Incluso si la compartís en una herramienta externa sin control, un tribunal podría determinar que no hiciste lo suficiente para protegerla [2:25].

¿Cuáles son los puntos de fuga concretos?

Existen al menos cinco formas en las que la información se escapa:

El prompt: escribirle al chat tu fórmula de precios es como decir la receta secreta en voz alta en un restaurante lleno [2:40].
Archivos adjuntos: subir un dataset interno para analizarlo significa que ese archivo ahora vive en otro sistema [2:58].
RAG (Retrieval Augmented Generation): si mezclás documentos con distintos niveles de acceso, la IA puede traer información que no corresponde [3:08].
Datasets compartidos con terceros: nadie revisó y se fue información sensible [3:16].
Cadena de subprocesadores: a veces hay humanos en otros países revisando conversaciones [3:21].

¿Cómo se controlan estos riesgos?

Cuatro controles fundamentales que deberías aplicar:

Redacción antes del input: eliminá o enmascaré datos sensibles antes de enviarlos [3:33].
Limitar alcance en RAG: un agente de soporte ve manuales públicos, no estrategia de precios [3:40].
Menor privilegio: si una herramienta agenda reuniones, no necesita ver datos financieros [3:47].
Desactivar el uso de datos para entrenamiento: muchos lo olvidan y es clave [3:52].

¿Qué filtros aplicar antes de compartir código con IA?

Cuando usás un asistente de código, considerá tres filtros [3:58]:

Licencia: MIT o Apache están OK. GPL requiere cuidado. Sin licencia explícita, denegar.
Permisos: si la persona no tiene acceso a ese código, no debería poder usarlo.
Sensibilidad: claves de API, contraseñas o datos de cliente nunca se comparten.

Un test rápido antes de enviar algo a la IA [4:25]: ¿tiene datos personales? ¿Tiene contenido de terceros con restricciones? ¿Te sentirías cómodo si esto se publica mañana? Si alguna respuesta es no, no lo envíes. Tres segundos de duda pueden ahorrarte meses de problemas.

Por último, implementá trazabilidad para que todo dato tenga fuente, uso y responsable [4:44]. Un registro de fuente con campos como origen, propósito, sensibilidad, retención y restricciones evita usar datos para algo distinto de lo que fueron recolectados. Porque cuando algo falla, no responde el sistema, responde una persona [5:02].

¿Qué otras restricciones utilizan en tu empresa para proteger la propiedad intelectual? Dejalo en los comentarios.

Comentarios

Estela del Carmen Henriquez

student•

La mejor manera de auditar es implementar una política de trazabilidad estricta combinada con compuertas de revisión automatizadas, funcionando como la caja negra de un avión. No basta con saber que ocurrió un error; necesitas saber exactamente qué datos entraron, quién los autorizó y con qué propósito. Crea un registro inmutable que documente cada dataset utilizado, asignando siempre un propietario humano con nombre y apellido, no un departamento genérico. Esto elimina la dilución de responsabilidad. Además, antes de que cualquier código o texto generado por IA pase a producción, debes automatizar escaneos de seguridad. Utiliza herramientas que busquen coincidencias de código fuente externo para evitar plagios accidentales y que rastreen credenciales ocultas (como tokens o llaves de acceso) en las salidas del modelo. Si un bloque de código generado coincide en un alto porcentaje con un repositorio protegido, el sistema debe detener el despliegue automáticamente hasta que un humano lo reescriba o añada la atribución legal correspondiente.

ANGELA JASMIN PERDOMO SANABRIA

student•

¿Qué pasa si pego código interno?

Al pegar código propietario en una herramienta pública, automáticamente debilitas su protección legal. La ley exige que demuestres esfuerzos razonables para mantener un secreto a salvo; si lo entregas a un modelo externo, un juez podría determinar que renunciaste a esa confidencialidad. Imagina que tienes la receta de un restaurante exitoso y la gritas en una plaza pública para pedir sugerencias de mejora. Aunque nadie la anote en ese instante, ya no es un secreto. Además, muchas plataformas de IA utilizan los datos ingresados para entrenar sus futuras versiones por defecto. Esto significa que tu algoritmo de pricing o tu lógica de negocio podría aparecer como sugerencia de autocompletado en la pantalla de un competidor meses después. Para evitar esto, siempre debes usar entornos empresariales cerrados donde los acuerdos de nivel de servicio (SLA) garanticen explícitamente que tus inputs no se usarán para entrenamiento.

Estela del Carmen Henriquez

student•

Se debería legislar en cuanto al uso de imágenes de personas expuestas de manera degradante u obscena

Carolina Ibarra

student•

Lo que tienen en común los datos y la propiedad intelectual, es que ambos son intangibles, susceptibles de explotarse y valorarse económicamente.

Es necesario tener en cuenta que, la propiedad intelectual es un universo de regulación orientada a proteger diferentes cosas y su explotación económica. Los mecanismos de protección varían de acuerdo a lo que se proteja.

Es decir:

El mecanismo de protección en los derechos de autor, surge con la sola existencia de la creación por parte de su autor. El registro es un mecanismo probatorio que permite hacer una gestión mas organizada y eficiente de la creación y de los derechos patrimoniales que surgen de estas obras.
El mecanismo de protección de la propiedad industrial (marcas, enseñas, diseños industriales) es por medio de un registro, ante las autoridades de cada país. La protección que se otorga, es territorial por país y con fechas de caducidad renovable.
Las patentes, también se solicitan por medio de registro ante las autoridades correspondientes, y deben renovarse cada tanto.

Ahora, los secretos industriales tienen sectores de mercado en los cuales son mas sensibles que en otros. Valdría la pena reflexionar en la propuesta de análisis de la clase, el impacto del open source en la evolución de las tecnologías digitales y en la evolución también de las IAG. Teniendo en cuenta, por supuesto que no todo lo que está en internet es de uso público, y que hay mecanismos de protección, gestión y explotación de la propiedad intelectual que genera ventajas competitivas, que no están delimitadas solo por la publicación imprudente de un documento, que en muchos casos es información pública.

Carolina Ibarra

student•

la educacion simultánea y sincronica, no todos llegan a capacitarse en el mismo momento, ni a tener la misma comprension

Esa brecha de conocimiento es el verdadero riesgo, Carolina. Si la seguridad depende de que cada persona "entienda" el peligro, tienes un sistema basado en la buena voluntad, no en la arquitectura.

Si no puedes controlar el ritmo de aprendizaje de todos, ¿qué tipo de barrera técnica (como un filtro o bloqueo automático) pondrías para que, aunque alguien no esté capacitado, el sistema le impida enviar información sensible por error?

Carolina Ibarra

student••

evitar referencias directas.

crear accesos deliberados a los archivos específicos.

evitar duplicar los archivos.

redactar el prompt y verificar su pertinencia antes de enviarlo al llm.

Esas tres tácticas son el núcleo de la higiene digital que mencionamos: reducir la superficie de ataque. Al evitar referencias directas y limitar el acceso, estás aplicando el principio de menor privilegio a nivel de usuario.

Si ya tienes claro cómo filtrar la información antes de que toque la IA, ¿cuál crees que es el mayor obstáculo para que tu equipo adopte estas prácticas de forma constante?

Carolina Ibarra

student•

es peor, porque crear ese cuarto limpio me obliga a sacar la informacion del ecosistema creado para alojarla.

es como si sacara los archivos fisicos de la oficina y me los llevara a la alcoba de mi casa que no tiene la proteccion ni la garantia efectiva de seguridad que sí provee o al menos de la cual es responsable la empresa

Tienes razón, Carolina. La paradoja es real: para proteger el secreto, terminas creando un silo inseguro fuera del control corporativo. Es el dilema entre seguridad técnica (la empresa) y seguridad de contenido (tú).

Si el ecosistema ya es "poroso" por diseño, ¿qué medidas de control interno, más allá de dónde guardas el archivo, crees que obligarían a la IA a respetar la confidencialidad?

Ana Lilian Zuniga de Santos

student•

Haz que empleados, socios o proveedores firmen acuerdos donde se comprometan a no divulgar la informacion .

Carolina Ibarra

student••

Son insuficientes, porque la información no se comparte siempre de manera deliberada.

La información inferencial juega un papel importante en la vida digital y su lógica, y consecuencialmente en la vida de los internautas.

El mejor acuerdo es el compromiso con la capacitación y la actualización constante de los miembros de la organización.

Juan Camilo Mejía Rodríguez

student•

Muy valiosa la distinción entre privacidad y propiedad intelectual: son dos riesgos distintos que a veces ocurren simultáneamente. Pegar código propietario en un chatbot puede no exponer datos personales, pero sí revelar la lógica de negocio que definía tu ventaja competitiva. La recomendación de clasificar la información antes de usarla en IA (pública, interna, confidencial) me parece el paso más práctico que cualquier empresa puede implementar de inmediato.

Etlin Ortega

student•

Al implementar un proyecto o al iniciar en una empresa debe haber una induccion avanzada para cada nuevo empleado con test de entendimiento.

Marlon Melara

student•

Incluir clausulas de compromiso de que los empleados no suban datos a IAs no autorizadas y algo puntual: el uso de dispositivos móviles dentro de las instalaciones. Tiene que haber estándares de seguridad al respecto.

Cómo proteger secretos comerciales al usar IA

Decisiones responsables con datos y LLMs

Cómo detectar daños invisibles en sistemas de IA

Mapa de riesgos en el ciclo de vida de datos con IA

Checklist de triaje antes de lanzar IA

Privacidad, seguridad y propiedad de datos

Cuándo una foto se vuelve dato biométrico

Reidentificación: seis patrones que debes conocer

Cinco rutas donde los LLMs filtran tus datos