Home » Meta lanza una herramienta de IA capaz de identificar y separar objetos en imágenes

Meta lanza una herramienta de IA capaz de identificar y separar objetos en imágenes

by v

Con sus ambiciones de Metaverso en ruinas, Meta busca ahora la IA para impulsar su próxima etapa de desarrollo. Uno de los últimos proyectos de Meta, anunció el miércoles el gigante de las redes sociales, se llama Segment Anything Model.

Segment Anything ayuda a los usuarios a identificar elementos específicos en una imagen con unos pocos clics. Aunque todavía está en modo de demostración, la empresa afirma que Segment Anything ya puede tomar una foto e identificar individualmente los píxeles que componen todo lo que hay en la imagen, de modo que uno o más elementos puedan separarse del resto de la imagen.

«La segmentación -identificar qué píxeles de la imagen pertenecen a un objeto- es una tarea fundamental en visión por ordenador y se utiliza en una amplia gama de aplicaciones, desde el análisis de imágenes científicas hasta la edición de fotos», escribió Meta en un post en el que anunciaba el nuevo modelo.

Según Meta, crear un modelo de segmentación preciso para tareas específicas requiere un trabajo altamente especializado por parte de expertos técnicos con acceso a la infraestructura de entrenamiento de IA y a grandes volúmenes de datos del dominio cuidadosamente anotados.

«Logramos una mayor generalización que los enfoques anteriores mediante la recopilación de un nuevo conjunto de datos de un tamaño sin precedentes». Ross Girshick, científico investigador de Meta, dijo a TCN en un correo electrónico. «Crucialmente, en este conjunto de datos, no restringimos los tipos de objetos que anotamos.

«Gracias a la escala de los datos y a su generalidad, nuestro modelo resultante muestra unas capacidades impresionantes para manejar tipos de imágenes que no se vieron durante el entrenamiento, como imágenes centradas en el ego, microscopía o fotos submarinas», añadió Girshick.

La inteligencia artificial generativa es un sistema de inteligencia artificial que genera texto, imágenes u otros medios en respuesta a instrucciones. Algunos de los ejemplos más destacados de esta tecnología son ChatGPT de OpenAI y la plataforma de arte digital Midjourney.

Meta afirma que el sistema Segment Anything AI se ha entrenado con más de 11 millones de imágenes. Como explicó Girshick, Meta está poniendo Segment Anything a disposición de la comunidad investigadora bajo una licencia abierta permisiva, Apache 2.0, a la que se puede acceder a través del Github de Segment Anything.

«Un aspecto clave de las leyes de privacidad es que la recopilación de datos debe hacerse de forma transparente y con el pleno consentimiento del individuo», dijo a TCN Lyle Solomon, abogado principal de Oak View Law Group. «El uso de IA para el reconocimiento facial sin consentimiento expreso plantea dudas sobre posibles violaciones de la ley de privacidad. Además, las empresas deben evitar compartir datos faciales con terceros a menos que el individuo haya dado su consentimiento, y cualquier intercambio debe adherirse a las disposiciones de la ley de privacidad.»

Girshick afirma que Segment Anything está en fase de investigación y no hay planes de utilizarlo en producción. Aún así, existen preocupaciones relacionadas con la privacidad en los usos potenciales de la inteligencia artificial.

En febrero, Meta abandonó sus planes de lanzar un metaverso para centrarse en otros productos, incluida la inteligencia artificial, anunciando la creación de un nuevo grupo de productos centrado en la inteligencia artificial generativa. Este cambio se produjo después de que la empresa despidiera a más de 10.000 trabajadores tras poner fin a su proyecto Instagram NFT.

Los líderes mundiales, hastiados del avance de la inteligencia artificial, han expresado su preocupación y han abierto investigaciones sobre la tecnología y lo que significa para la privacidad y la seguridad de los usuarios tras el lanzamiento de ChatGPT de OpenAI. Italia ya ha prohibido el popular chatbot.

«Muchos usuarios no entienden cómo funciona este proceso o qué consecuencias puede tener a largo plazo que su cara se utilice para entrenar un modelo de aprendizaje automático sin su consentimiento», explica a TCN Kristen Ruby, presidenta de la consultora de medios sociales e Inteligencia Artificial Ruby Media Group.

«El mayor reto al que se enfrentan muchas empresas es obtener acceso a datos de entrenamiento a gran escala, y no hay mejor fuente de datos de entrenamiento que los que proporciona la gente en las redes sociales», afirma.

Ruby sugiere comprobar si una empresa ha incluido una cláusula de aprendizaje automático que informe a los usuarios de cómo se utilizan sus datos y si pueden excluirse de futuros modelos de formación. Señala que muchas empresas tienen actualmente una opción de inclusión por defecto, pero que puede cambiar a exclusión en el futuro.

«Hemos empleado varias técnicas para preservar la privacidad, como difuminar rostros y otros datos de identificación personal (por ejemplo, matrículas)», explica Girshick. «Los usuarios pueden informarnos de contenidos ofensivos enviando un correo electrónico a [email protected] con la identificación de la imagen, y la eliminaremos del conjunto de datos».

Related Posts

Leave a Comment