Lima, Perú— La conducción autónoma ha sido una promesa ambiciosa de algunas de las empresas y nuevas empresas de tecnología más importantes del mundo, incluidos gigantes como Google, Tesla y Uber. Sin embargo, la adopción masiva sigue fuera de nuestro alcance.
A partir de 2022, existen muchas empresas de vehículos autónomos (AV). han apagadoy grandes nombres como Waymo de Google, Tesla de Elon Musk y Cruise de General Motors están reduciendo el tamaño de sus equipos a pesar de miles de millones en fondos y luchando por mantener la visión del automóvil autónomo.
A pesar de los importantes avances en visión por ordenador, como el desarrollo de Detectrón2Continúan produciéndose accidentes relacionados con AV. En octubre del año pasado, Cruise retiró del mercado sus 950 modelos autónomos para actualizar posteriormente el software Un coche arrastró a una mujer por una calle en San Francisco.
¿Qué causa estos errores y por qué las máquinas no pueden replicar el comportamiento humano al volante?
Arturo DezaUn ex becario postdoctoral en el Instituto Tecnológico de Massachusetts y profesor de la Universidad de Ingeniería y Tecnología (UTEC) en Lima, tiene la misión de descubrirlo.
Su puesta en marcha, Artificioestá desarrollando una plataforma de evaluación comparativa específica para la conducción autónoma en condiciones exigentes. La empresa tiene su sede en Lima y cuenta con la aplicación de navegación TomTom. recientemente nombrado como la ciudad con peor tráfico de América Latina.
El desafío de la conducción autónoma
Según Deza, la conducción autónoma “ha fracasado porque prometía demasiado que los sistemas artificiales de procesamiento de imágenes ya estaban resueltos, como si la visión por ordenador estuviera plenamente desarrollada”.
el dijo informes peru que la promesa de que una computadora pueda identificar objetos ordinarios es descabellada y que “todavía hay condiciones en las que el estímulo es ambiguo”.
Aunque las computadoras pueden identificar bien la mayoría de los objetos, explicó, a menudo fallan en situaciones complicadas, como conducir con mucho tráfico.
“Muchos proyectos de vehículos autónomos han fracasado o han cambiado de dirección debido a estas dificultades. Un ejemplo es Argo AIque quebró a pesar de invertir miles de millones”, añadió.
Según un estudiar Según el informe publicado por Artificio el pasado mes de diciembre, el fracaso de la percepción de la conducción autónoma se debe a dos factores principales.
Primero, una falta de comprensión perceptual de estímulos fuera de la distribución. Y en segundo lugar, faltan puntos de referencia de alta calidad para esos escenarios fuera de la distribución.
“En muchos casos, los vehículos autónomos son entrenados con datos reales o sintéticos en condiciones de sol casi perfecto o con poca gente, con semáforos que funcionan perfectamente, carreteras bien pavimentadas, conductores respetuosos de la ley y peatones atentos”, dice el estudio. “Sin embargo, si algo sale mal y los coches tienen que circular a través de la niebla, una multitud en un desfile, perros corriendo (o jugando) en la calle sin correa, o buscando scooters en los carriles adyacentes, en muchos de estos sistemas esto Es un problema, el razonamiento perceptivo comienza a fallar”.
La propuesta de Artificio: probar la conducción autónoma en condiciones extremadamente adversas
En su mente, Deza veía su propio patio trasero como un campo de pruebas ideal.
El fundador de Artificio sugiere que la industria audiovisual primero recopile más datos de los países en desarrollo donde el comportamiento de conducción es diferente y más exigente, como en Lima. Esto ayudaría a entrenar mejor los sistemas de visión por computadora utilizados por los automóviles autónomos.
«Si un vehículo autónomo puede navegar e identificar fácilmente cada objeto y obstáculo basándose en imágenes de vídeo de rutas en Lima, Hanoi o Mumbai, la inferencia perceptiva debería ser trivial en ciudades como San Francisco, Londres y Beijing», dijo Deza.
Además, Artificio sugiere que la formación de sistemas de visión por ordenador para vehículos autónomos se realice fuera de la ciudad en la que se van a utilizar. En el aprendizaje automático, esto se denomina entrenamiento adversario. Este método entrena sistemas con datos adversos e inusuales, lo que aumenta la probabilidad de que las redes neuronales funcionen bien en situaciones esperadas e inesperadas.
Recopilación de datos en carreteras peruanas.
Si has visitado Lima, sabrás que moverse por el área metropolitana de 11 millones de personas puede resultar caótico Tráfico TomTom estudiarLima encabeza la lista de ciudades de América Latina con peor tráfico, superando a otras grandes metrópolis como Bogotá y Ciudad de México. Además, ocupa el quinto lugar en el índice de ciudades con peor congestión de tráfico del mundo, seguida sólo por Milán, Toronto, Dublín y Londres.
Debido a esta realidad, entre diciembre de 2023 y marzo de 2024, Artificio recopiló datos en varias ciudades peruanas, incluidas Lima, Cusco y Cajamarca, utilizando dashcams montadas en vehículos y cámaras GoPro.
“La recopilación de datos es fácil, pero el análisis y etiquetado es un proceso más complejo y laborioso”, explica Deza. «Nuestro objetivo es realizar comparaciones con datos anotados para evaluar la precisión del modelo».
El equipo de Artificio enfrentó desafíos únicos, como identificar vehículos inusuales en Perú, incluidos mototaxis y furgonetas de helados, que no están incluidos en las categorías de modelos actuales.
«Este estudio nos enseña que necesitamos nuevas categorías de objetos para diferentes contextos geográficos, ya que las situaciones en la India, por ejemplo, serán diferentes a las del Perú», añadió Deza.
El objetivo es encontrar principios básicos que puedan aplicarse a todas las ciudades. «Si logramos hacer esto, otras empresas también se beneficiarán».
Un enfoque innovador que utiliza IA neuronal para la clasificación de objetos
A diferencia de los modelos actuales de inteligencia artificial que dependen de grandes cantidades de datos y recursos informáticos (como GPU y terabytes de datos) para lograr la clasificación de objetos, la tecnología de IA neuronal desarrollada por Artificio pretende lograr lo contrario.
Deza explicó: “Nuestra tecnología tiene como objetivo utilizar la menor cantidad de datos y recursos posible para crear un sistema que iguale o supere los modelos existentes como Detectron2, YOLO o RetinaNet. Esto es fundamental por varias razones, incluida la rentabilidad y el uso ético de los datos”.
La idea detrás de los modelos centrales NeuroAI patentados por la compañía, según el CEO, es que los vehículos autónomos puedan consultar cualquier objeto que vean en la carretera y encontrar el objeto más similar, ya clasificado, para resolver el conflicto en tiempo real.
La visión a largo plazo de Artificio
Por supuesto, Artificio todavía tiene un largo camino por recorrer para competir y potencialmente ayudar a las mayores empresas audiovisuales. Según Deza, el siguiente paso es comercializar su plataforma, que permite a cualquier estudiante o ingeniero cargar y evaluar sus modelos a través de una aplicación web.
“Estamos construyendo una plataforma donde las personas pueden subir y calificar sus modelos incluso sin ser parte de una empresa, democratizando el acceso a estas tecnologías avanzadas”, dijo.
Además, Artificio planea integrar sensores de detección y alcance de luz (LIDAR) en vehículos en Perú para enriquecer aún más su plataforma de datos y demostrar el rendimiento de estos sistemas en condiciones extremas.
“Si un automóvil autónomo puede manejar a Perú, puede manejar a cualquier lugar”, dijo Deza.
A pesar de sus contratiempos, ve un futuro prometedor para la conducción autónoma, aunque reconoce que aún quedan muchos retos por superar. «Creo que los coches autónomos deberían estar listos para su uso en todo el mundo en 2030, pero el desafío para las empresas es sobrevivir hasta entonces debido a los altos costos y la lenta adopción».