
La mayor parte de la inteligencia artificial que se usa hoy en día está diseñada para encontrar la respuesta más similar si no hay una respuesta correcta entre los candidatos dados.
En particular, los modelos de aprendizaje profundo tienen excelentes capacidades de reconocimiento de imágenes y se utilizan ampliamente en el campo de la visión artificial. En este caso, el vehículo autónomo puede generar problemas graves, como la identificación errónea de obstáculos, de ahí la necesidad de un modelo de IA para compensar.
Además, el equipo de investigación del profesor Kyu-bin Lee del GIST (Instituto de Ciencia y Tecnología de Gwangju, presidente interino Park Rae-gil) en la Escuela de Tecnología de Convergencia y Estudios Interdisciplinarios desarrolló tecnología de inteligencia artificial que separa los «datos desconocidos». .
Un modelo de IA consta de varios bloques, cada uno de los cuales realiza una sola tarea. Es como el material (datos) que llega en una cinta transportadora y muchas personas (bloques) que dividen su trabajo para completar las cosas en orden.
El equipo de investigación utilizó un rompecabezas para encontrar un bloque adecuado para detectar «datos desconocidos» y propuso un método para detectar datos desconocidos basado en la actividad del bloque.

Como ejemplo de datos desconocidos, el equipo de investigación dividió la imagen en piezas pequeñas como un rompecabezas y las barajó aleatoriamente en la entrada. Es encontrar el bloque apropiado para detectar los datos desconocidos de acuerdo con la actividad después de ingresar los datos similares a la imagen original pero no la respuesta correcta.
Estudios anteriores utilizaron el último bloque que aprendió la mayor cantidad de datos, pero el equipo de investigación descubrió que el último bloque tiende a confundir los datos desconocidos con los datos conocidos debido al sobreaprendizaje.
El equipo de investigación encontró que los bloques con baja actividad para datos desconocidos (rompecabezas) y alta actividad para datos conocidos son los más adecuados para detectar datos desconocidos, y para imágenes aprendidas en comparación con la actividad para rompecabezas.
Por lo tanto, los resultados de detección mejoran el primer punto de referencia CIFAR10 utilizado anteriormente en un 5,8 % y el segundo punto de referencia ImageNet en un 6,8 %, logrando el rendimiento más alto hasta la fecha.

Si la metacognición de los modelos de aprendizaje profundo se vuelve posible con este resultado de investigación, será posible desarrollar modelos de IA en forma de inteligencia aumentada. También se espera que sea útil en áreas sensibles que están directamente relacionadas con la seguridad o la vida, como la conducción autónoma y el diagnóstico médico. En otras palabras, la metacognición es la capacidad de juzgar los propios pensamientos y, en este estudio, significa la capacidad de juzgar lo que uno sabe y lo que no sabe.
Esto podría evitar problemas como el reconocimiento erróneo de un animal como humano mientras conduce un vehículo autónomo y se detiene repentinamente, o el diagnóstico erróneo de una enfermedad de la piel que nunca se ha aprendido como más similar a las enfermedades de la piel aprendidas previamente.
«Si nos basamos en el resultado de esta investigación, podremos lograr la capacidad metacognitiva para reconocer los resultados reconocidos por nuestro propio modelo de aprendizaje profundo», dijo el profesor Kyu-Bin Lee. Esperamos que se aplique a una variedad de tecnologías. Como un aumento de la inteligencia.
Por otro lado, esta investigación la realiza el estudiante de doctorado Yongk Yu con un método de selección de bloques de doctorado que utiliza la norma de características para detectar la falta de distribución.abajo)’ se estrenará el 18 de junio. El código utilizado en el estudio es de código abierto en Github (abajo) puede ser usado