Responde a gestos, pero no es un smartphone, tiene "voz propia", pero no es un asistente, y hasta puede distinguir de un billete de 100 pesos, a uno de 500, con una facilidad que podría asustar; OrCam My Eye pretende ser los ojos de quienes no ven, ayudarles a hacer hasta las tareas más elementales, y todo, sin conexión a un smartphone, ni a la nube.
Parece ciencia ficción, pero un trabajo de ocho largos años han hecho posible la versión 2.0 de OrCam My Eye. Con el escepticismo a flor de piel, hemos acudido a probarlo y vaya que nos hemos topado de frente con el futuro... y con inteligencia artificial.
Hemos preparado un video un repaso de sus funciones
Susurrando al oído lo que "ve"
El dispositivo tiene un peso de apenas 22.5 gramos. Cuenta con una montura especial de manera que se puede colocar en gafas de cualquier tamaño y material. Su batería dura un día, y alcanza la carga total en una hora, y su cámara de 13 megapixeles le permite, como se ve en el video, realizar sus tres principales funciones: lectura de textos, reconocimiento facial, y reconocimiento de billetes.
Para el primer caso se cuenta con dos modos: lectura de textos impresos y digitales. Hemos tenido oportunidad de probarlo para textos impresos, en donde basta con colocar la hoja de un libro frente al dispositivo por un espacio que no supera los 5 segundos, y OrCam My Eye hace la lectura correspondiente a las líneas que alcance a capturar.
Nikol Wolpert, representante de OrCam en México, nos explica que en este caso lo que hace el dispositivo es tomar una fotografía del texto, lo que le sirve como suficiente material para comenzar emitir en voz el texto capturado. Unos segundos, y voila, podemos cerrar el libro, y el dispositivo nos dirá el contenido, como si de un audiolibro se tratara.
Para pausar la lectura solo es necesario elevar la mano frente a la cámara del dispositivo, y separar los cinco dedos para hacer una señal de "alto", acto seguido, OrCam My Eye pausa la voz.
Un detalle interesante: La versión 2.0 del dispositivo reconoce automáticamente entre idiomas, de manera que no se le necesita configurar para leer en otro idioma cada vez que requerimos lo haga; suficiente es con colocar el texto frente a él y de inmediato reconocerá de manera automática el cambio de idioma para proceder a decirlo en voz alta.
En la calle, personas con debilidad visual, pueden apuntar hacia algún letrero y OrCam My Eye reconoce el gesto y lee solo lo que le hemos apuntado.
Reconocimiento Facial
El reconocimiento facial es un proceso bastante más complejo. El objetivo detrás de su implementación en el OrCam My Eye es brindar mayor independencia a las personas con debilidad visual, y que en todo momento sepan quien está frente a ellos.
El reconocimiento facial también opera con dos modalidades, la primera, en donde el dispositivo reproduce en voz alta el nombre de la persona (lo que requiere un registro previo); y la segunda, en la que sin un registro previo OrCam puede decir las características generales de un sujeto: su género y su edad aproximada.
En cuanto al registro del rostro y su asociación con el nombre, este proceso no toma más de 20 segundos.
Nikol Wolpert nos explica que el funcionamiento del algoritmo detrás del reconocimiento facial, consiste en una medición muy exacta de a que distancia están, uno de otro, los elementos del rostro. Así, cuando OrCam graba un rostro, en realidad está haciendo mediciones, para calcular a que distancia está un ojo de otro, una ceja de la otra, la nariz del mentón, etc. El software no despliega ningún tipo de luz sobre el rostro para hacer un modelado 3D.
La forma de operar tiene una ligera desventaja; el sujeto debe estar totalmente frente al dispositivo, es decir, frente a la persona con discapacidad visual, para que la detección se haga eficazmente. Aún así, hemos podido comprobar la alta eficacia de este sistema, probándonos gafas y hasta una gorra, en todo momento OrCam My Eye 2.0 ha terminado por decir mi nombre al estar frente a su cámara, y casi de forma instantánea.
Reconocimiento de billetes
Por último, este mismo junio ha llegado al dispositivo la actualización que le permite reconocer billetes mexicanos. Basta con poner frente a la cámara un billete de cualquier denominación, sin importar de que lado esté, para que diga en voz alta la denominación. Puede hacer lo mismo con billetes argentinos, soles peruanos y dólares.
Sumado a estas funciones, OrCam My Eye reconoce colores, indica la fecha y la hora al hacer el gesto de levantar el puño, como si quisiéramos ver un reloj en la muñeca; lee textos sin importar su orientación (puede hacerlo sin problemas si están de cabeza) y reconoce señalamientos en la calle.
También se le pueden registrar productos, en un proceso que es similar al de registro de rostros, se escanea un producto y el usuario graba el fonema que se le vincula. A partir de entonces, cada vez que el producto aparezca frente a la cámara del OrCam My Eye, se reproduzca con voz el nombre asignado. Desafortunadamente esta función es la única que no hemos podido constatar.
Tres versiones y 8 años de desarrollo de software
Para ninguna de sus funciones OrCam My Eye ha estado conectado a la red. Esto quiere decir que sus procesos ocurren al interior del dispositivo, sin auxiliarse para nada de la nube, lo que revela un procesamiento de datos alucinante. Wolpert nos platica que además el dispositivo es capaz de adecuarse a los hábitos del usuario, no solo a través de la configuración específica de su uso, sino que OrCam My Eye optimizará sus funciones de forma automática conforme al uso que se le dé. Machine Learning, ni más ni menos.
Detrás del desarrollo de software de OrCam hay un arduo trabajo. Cinco años ha tomado que la primera versión de OrCam viera la luz, luego de que en 2010 la empresa fuera fundada y comenzaran los primeros trabajos. Estados Unidos, Inglaterra, Canadá e Israel fueron los primeros mercados, y las demandas de los usuarios han hecho que el producto evolucione rápidamente, primero con una versión 1.5 y después, con la que podría ser la versión definitiva, al menos durante algún tiempo, la 2.0.
Lanzada a inicios de este año, es esta versión con la que hemos tenido acercamiento. Detrás de ella hay un equipo de 200 desarrolladores que trabajan desde Israel para implementar nuevas actualizaciones. Wolpert nos adelanta que si todo va bien, podríamos ver en no mucho tiempo soporte para bluetooth en el dispositivo, pensado especialmente para usuarios que prefieran usar audífonos inalámbricos para escuchar a OrCam, y olvidarse del altavoz en solo un oído.
Pero más actualizaciones vienen en camino. En supermercados de Estados Unidos el dispositivo ya puede reconocer productos e indicar su nombre y características de embalaje tan solo escaneando su código de barras. Sin tener fecha concreta aún, sería solo cuestión de tiempo para que la funcionalidad aterrice también en suelo azteca.
Pero las ideas van mucho más allá. El equipo también está interesado en que nuevos idiomas lleguen, y que OrCam, se convierta en todo un asistente multitarea que pueda interactuar con la nube. Según Wolpert, un futuro en el que OrCam My Eye escanee un recibo de luz en México, y podamos ordenarle con comando de voz que se encargue de la transacción de pagarlo, es totalmente posible.
La promesa más potente, es que todas estas actualizaciones llegarían de forma gratuita, puesto que no hay planes cercanos de renovar el producto con la llegada de un nuevo modelo. Durante al menos tres años, OrCam My Eye recibirá actualizaciones, a fin de evitar su obsolescencia y un gasto innecesario por parte de los usuarios.
Con tantos planes en en el apartado de desarrollo, OrCam también tiene ambiciosas prospectivas de expansión. Han llegado a comienzos de este año a México, y los tratos con distribuidores se han cerrado hace apenas un mes. Con 10 mil usuarios a nivel global, es claro que México y Latinoamérica forman parte importante en los planes de la empresa israelí.
Las discapacidades visuales en México
En México no sabemos con exactitud cuantas personas con ceguera total existen; el número más aproximado que tenemos corresponde al de poco más de 3.5 millones de personas con alguna discapacidad visual, esto es, que no pueden ver, o que pueden ver con mucha dificultad.
El dato nos habla de una comunidad que ha sido invisibilizada, para la que pocas políticas públicas de salud a nivel nacional se han emprendido en los últimos años, y por tanto, el descobijo institucional y social del que padecen personas con discapacidad visual.
Sin lugar a dudas, emprendedores tecnológicos y el ecosistema de startups han entrado al escenario para equilibrar la balanza; ya sea en forma de smartphone o en forma de lentes para combatir la ceguera, la innovación que tiene como principal objetivo el beneficio de la comunidad con discapacidad visual ha florecido, aunque, con el paso de los años, muchas de las iniciativas han sido descontinuadas por sus mismos creadores y/o han perdido relevancia mediática.
Con tanto esfuerzo en innovación en el sector, era cuestión de tiempo para que la inteligencia artificial se pusiera al servicio de las personas con discapacidad visual. El único problema de momento es que la innovación se refleja en el precio, a tal punto, que coloca al dispositivo como no apto para ser un producto de consumo masivo.
Su precio, de 4,500 dólares, lo confirma. Aunque no hay precio oficial con distribuidores (se trata de nexos comerciales que aún están desarrollo), no hay duda de que OrCam My Eye 2.0 se colocará por encima de los 90,000 pesos, un precio bastante elevado que le restringirá a ser un dispositivo para un segmento del mercado muy acotado.
Imágenes | OrCam, Informador
Ver 3 comentarios