Inteligencia artificial «¡No sé lo que no sé!» … modelo de IA que identifica ‘datos que no conoce’ lanzado como fuente abierta

El equipo de investigación del profesor Kyu Bin Lee en la Escuela de Tecnología de Convergencia y Estudios Interdisciplinarios desarrolla una tecnología de inteligencia artificial que distingue los
El equipo de investigación del profesor Kyu Bin Lee en la Escuela de Tecnología de Convergencia y Estudios Interdisciplinarios desarrolla una tecnología de inteligencia artificial que distingue los «datos desconocidos» que nunca se han aprendido (en el sentido de las agujas del reloj) Sung Joo Kim, Seung Ho Shin, Yoo Yun Gok, Prof. Kyu Bin Lee .


La mayor parte de la inteligencia artificial que se usa hoy en día está diseñada para encontrar la respuesta más similar si no hay una respuesta correcta entre los candidatos dados.


En particular, los modelos de aprendizaje profundo tienen excelentes capacidades de reconocimiento de imágenes y se utilizan ampliamente en el campo de la visión artificial. En este caso, el vehículo autónomo puede generar problemas graves, como la identificación errónea de obstáculos, de ahí la necesidad de un modelo de IA para compensar.


Además, el equipo de investigación del profesor Kyu-bin Lee del GIST (Instituto de Ciencia y Tecnología de Gwangju, presidente interino Park Rae-gil) en la Escuela de Tecnología de Convergencia y Estudios Interdisciplinarios desarrolló tecnología de inteligencia artificial que separa los «datos desconocidos». .


Un modelo de IA consta de varios bloques, cada uno de los cuales realiza una sola tarea. Es como el material (datos) que llega en una cinta transportadora y muchas personas (bloques) que dividen su trabajo para completar las cosas en orden.


El equipo de investigación utilizó un rompecabezas para encontrar un bloque adecuado para detectar «datos desconocidos» y propuso un método para detectar datos desconocidos basado en la actividad del bloque.


Una descripción general del método de detección de
Una descripción general del método de detección de «datos desconocidos» propuesto en este estudio. El método propuesto primero calcula la relación de actividad (imagen de aprendizaje / imagen de rompecabezas) para todos los bloques y selecciona el bloque con el mayor valor relativo (a) Luego, la actividad del bloque apropiado Basado en datos conocidos (ID) o datos desconocidos (DOO) (b).


Como ejemplo de datos desconocidos, el equipo de investigación dividió la imagen en piezas pequeñas como un rompecabezas y las barajó aleatoriamente en la entrada. Es encontrar el bloque apropiado para detectar los datos desconocidos de acuerdo con la actividad después de ingresar los datos similares a la imagen original pero no la respuesta correcta.

READ  El 'sobre de dinero' de los fiscales, Yoon Kwan Seok, interrogado durante 12 horas... Revisión de la orden de arresto (completa)


Estudios anteriores utilizaron el último bloque que aprendió la mayor cantidad de datos, pero el equipo de investigación descubrió que el último bloque tiende a confundir los datos desconocidos con los datos conocidos debido al sobreaprendizaje.


El equipo de investigación encontró que los bloques con baja actividad para datos desconocidos (rompecabezas) y alta actividad para datos conocidos son los más adecuados para detectar datos desconocidos, y para imágenes aprendidas en comparación con la actividad para rompecabezas.


Por lo tanto, los resultados de detección mejoran el primer punto de referencia CIFAR10 utilizado anteriormente en un 5,8 % y el segundo punto de referencia ImageNet en un 6,8 %, logrando el rendimiento más alto hasta la fecha.


En un modelo entrenado con el conjunto de datos CIFAR10, un histograma que compara el grado de activación al caer dentro de la distribución (gris, datos conocidos) y fuera de la distribución (azul, naranja) en el último bloque (a) y el bloque anterior (b) Es.  .  Como se muestra en (b), un bloque adecuado para detectar 'datos desconocidos (OOD)' debe tener una actividad alta para 'datos conocidos (ID)' y una actividad pequeña para 'datos desconocidos'.
En un modelo entrenado con el conjunto de datos CIFAR10, un histograma que compara el grado de activación en el último bloque (a) y el bloque anterior (b) al estar dentro de la distribución (gris, datos conocidos) y fuera de la distribución (azul, naranja) Es. . Como se muestra en (b), un bloque adecuado para detectar ‘datos desconocidos (OOD)’ debe tener una actividad alta para ‘datos conocidos (ID)’ y una actividad pequeña para ‘datos desconocidos’.


Si la metacognición de los modelos de aprendizaje profundo se vuelve posible con este resultado de investigación, será posible desarrollar modelos de IA en forma de inteligencia aumentada. También se espera que sea útil en áreas sensibles que están directamente relacionadas con la seguridad o la vida, como la conducción autónoma y el diagnóstico médico. En otras palabras, la metacognición es la capacidad de juzgar los propios pensamientos y, en este estudio, significa la capacidad de juzgar lo que uno sabe y lo que no sabe.


Esto podría evitar problemas como el reconocimiento erróneo de un animal como humano mientras conduce un vehículo autónomo y se detiene repentinamente, o el diagnóstico erróneo de una enfermedad de la piel que nunca se ha aprendido como más similar a las enfermedades de la piel aprendidas previamente.

READ  Elección extrema después de la depresión... Tribunal Supremo "Pago del monto del seguro por discapacidad mental y física admitida"


«Si nos basamos en el resultado de esta investigación, podremos lograr la capacidad metacognitiva para reconocer los resultados reconocidos por nuestro propio modelo de aprendizaje profundo», dijo el profesor Kyu-Bin Lee. Esperamos que se aplique a una variedad de tecnologías. Como un aumento de la inteligencia.


Por otro lado, esta investigación la realiza el estudiante de doctorado Yongk Yu con un método de selección de bloques de doctorado que utiliza la norma de características para detectar la falta de distribución.abajo)’ se estrenará el 18 de junio. El código utilizado en el estudio es de código abierto en Github (abajo) puede ser usado

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *