Entrevista a Jeffrey Dean, director de Google Brain

Redacción: Mariana Pernas



La incursión de las principales empresas de tecnología en el área de Inteligencia Artificial (IA) no sólo supone el lanzamiento de nuevos productos, servicios y modelos de negocios que incorporan estas capacidades. También, la creación de laboratorios de I+D corporativos, herramientas de desarrollo de código abierto y una estrecha colaboración de las compañías con el ámbito académico. Uno de los protagonistas del competitivo escenario de IA es Jeffrey Dean, Senior Fellow de Google Research y director de Google Brain, el equipo de investigación sobre IA, aprendizaje profundo y machine learning (ML) que se creó en 2010, y cuyas áreas de investigación incluyen robótica, comprensión del lenguaje natural, percepción, algoritmos de ML y Biociencias, entre otros.

En diálogo con periodistas de distintos países en el marco del Heidelberg Laureate Forum (HLF), el evento de networking entre científicos y jóvenes investigadores que todos los años se realiza en Heidelberg, Alemania, Dean abordó cuáles son las líneas de trabajo de Google Brain, los campos de aplicación de IA, los desafíos de hacer I+D en una empresa, cómo interactúa Google con el sector académico y cuáles son las áreas de capacitación en IA. Nacido en Estados Unidos, Dean se incorporó a Google en 1999. Es doctor en Ciencias de la Computación por la Universidad de Washington, e integra la Academia Nacional de Ingeniería, la Asociación para la Maquinaria de Computación (ACM) y la Asociación Americana para el Avance de las Ciencias (AAAS).

 

¿Cuáles son las principales líneas de investigación de Google Brain?

Actualmente lidero todos los esfuerzos de investigación sobre IA de Google, del cual Google Brain es solo una parte. En primer lugar, hacemos investigación pura en áreas de ciencias de la computación o ML donde no tenemos algún tipo de aplicación particular. En ese caso, publicamos papers científicos. Una segunda área es la producción de software, hardware o infraestructura, que le permita a la gente utilizar o beneficiarse de nuestra investigación. Una tercera línea de trabajo consiste en colaborar con los equipos de Producto de Google, que toman nuestra investigación para desarrollar funcionalidades o generar nuevas ideas. Por último, trabajamos sobre áreas emergentes, donde Google aún no tiene productos, pero creemos que es importante hacer I+D. Ejemplos de esto es ML para robótica de control, cuidado de la salud o ciencias de la vida.

 

¿De dónde proviene hoy la mayor parte de la facturación de Google?

Estamos incorporando IA en muchísimos productos, pero una gran proporción de nuestra facturación proviene de la publicidad. No creo que eso cambie, aunque otras áreas están empezando a crecer significativamente, como es el caso de los servicios cloud.

 

¿Cuán accesible son los productos de software de Google a nivel global?

Uno de los principios que guían nuestra investigación es que los productos sean accesibles y estén disponibles para la mayor cantidad de gente posible. Por ejemplo, Tensor Flow es un software para desarrollar sistemas de ML que produjimos para nuestro trabajo interno de investigación, pero a mediados de 2015 tomamos la decisión de liberarlo como herramienta open source bajo una licencia Apache 2.0, que es una licencia de software muy flexible. Hoy, en todo el mundo hay usuarios que están haciendo distintas aplicaciones y proyectos con Tensor Flow. También hay una comunidad que trabaja con nosotros y nos ayuda a mejorar la herramienta.

 

¿Cómo se usan y qué aplicaciones tienen los programas open source de Google?

Tensor Flow está siendo utilizado por millones de personas en distintas soluciones. Por ejemplo, para el entrenamiento de modelos de visión por computadora, que permiten hacer reconocimiento e identificación mediante imágenes; y también, para el reconocimiento de lenguaje mediante datos de audio o de lenguaje hablado, o bien para producir traducciones. En Kenia se emplea para resolver un problema puntual de visión por computadora, que consiste en poder identificar y diferenciar un patrón de enfermedades mediante imágenes. En Brasil, se usa para detección de la tala ilegal en Amazonas mediante el análisis y captura de ondas de sonido a una distancia mucho mayor de lo que el oído humano puede captar. En Australia, en tanto, hay un grupo de investigación que tiene una gran cantidad de imágenes satelitales del océano y, con un desarrollo sobre Tensor Flow, pudo automatizar el monitoreo y conteo de especies en extinción. La Universidad de Pennsylvania, por su parte, creó una aplicación móvil que permite a los agricultores diagnosticar enfermedades de cultivos mediante el reconocimiento de imágenes. También hay una empresa japonesa que utiliza Tensor Flow en el proceso de fabricación de alimentos para bebés, porque le sirve para detectar mediante imágenes si hay algún tipo de ingrediente que pueda alterar el producto. Lo interesante de liberar software open source es que realmente no sabes, en un principio, la gran cantidad y variedad de maneras que puede llegar a tener.

 

Algunos críticos dicen que las aplicaciones de IA están concentradas en cuatro grandes empresas de IT, como Google, Microsoft, Apple y Amazon. Pero al mismo tiempo, esas compañías están lanzando y liberando herramientas de IA para los desarrolladores. ¿Cuál es su visión al respecto?

Mi visión es que, en todas las cosas que hacemos -que se lanzan como herramientas de software o resultados de investigación-, el objetivo es permitir que cualquier persona pueda aprovechar y aplicar estas herramientas para resolver problemas en diferentes compañías e industrias. Y es muy positivo, en particular, cuando publicamos de manera abierta los resultados de nuestros trabajos de investigación. Esto permite que una comunidad más amplia aprenda de lo que estamos haciendo y que, a la vez, nosotros podamos aprender de la comunidad de investigación. De hecho, el ámbito de investigación especializado en ML es increíblemente abierto, lo cual es fantástico, ya que podemos acceder a resultados y papers antes de que sean formalmente entregados o publicados en las conferencias con revisión de pares. Así, todos los que integramos la comunidad -universidades, grupos de investigación grandes y pequeños, empresas que hacen investigación- aportamos comentarios y proponemos mejoras. No hay un énfasis en que pequeños o grandes grupos de investigación realicen distintos tipos de descubrimientos. En nuestro caso, sin embargo, no publicamos abiertamente algunos algoritmos del motor de búsqueda. En parte, no lo hacemos porque algunas empresas que quieren ser líderes en búsqueda en Internet podrían acceder a información que les permitirá posicionarse como tales. Y en otras áreas específicas, como detección de fraudes, tampoco hacemos mucha publicación. Pero sí lo hacemos, por ejemplo, sobre nuestro sistema de traducción de idiomas y distintos acercamientos en ML.

 

¿Cómo desempeña su trabajo de científico en una empresa? ¿De qué manera interactúa con las áreas de negocios de Google?

Hasta 2011 yo estaba principalmente involucrado en el desarrollo de sistemas de computación de larga escala en Google, y luego trabajé en el desarrollo de sistemas de propósito general que corren por debajo de varios servicios y productos de Google, como es el caso de las computadoras que almacenan o procesan datos de una manera más flexible y con mayor capacidad para tener un set de datos mucho más grande. En 2011 también empecé a trabajar en sistemas de ML para construir sistemas de computación de larga escala que puedan entrenar modelos de ML para diferentes tipos de tareas, como visión y comprensión del lenguaje para traducción. En los últimos dos años comencé a gestionar grupos de investigación cada vez más grandes. Por ejemplo, Google Brain es uno de los grupos de investigación más grandes de Google Research. Constantemente tratamos de identificar problemas interesantes en los que podamos trabajar; algunos son de largo plazo y creemos que son importantes e interesantes, potencialmente, para agregar a nuestros productos actuales o para desarrollar en el futuro nuevos tipos de productos.

 

¿Cuáles son los principales desafíos de su trabajo como investigador en una empresa?

Entender cómo podemos desarrollar más sistemas generales de IA. Hasta hoy hemos tenido mucho éxito en el uso de modelos de aprendizaje profundo para los casos en que se debe resolver un determinado tipo de problema, una tarea o función concreta, y se requiere un tipo determinado de datos para abordarlo. Pero hasta ahora no hemos tenido mucho éxito en el entrenamiento de sistemas generales que hagan muchas tareas. Esa es una interesante línea de investigación para seguir. Si podemos tener sistemas que hagan miles de tareas, y que luego usen esa experiencia y esas miles de cosas para poder seguir aprendiendo más rápidamente mediante la construcción de tecnología, sería una poderosa herramienta.

 

¿Cuál es el rol de la academia en el segmento de IA?

Hay muchas maneras en las cuales puede ayudar el sector de investigación académico. Una de ellas es educar a las nuevas generaciones de estudiantes, lo cual es muy importante porque el campo de ML está creciendo en todo el mundo y es importante que en el mundo haya más gente con ese expertise. En segundo lugar, obviamente es clave hacer desarrollo de investigación básica en IA. Muchas veces las mejores investigaciones provienen de la academia con ideas inteligentes, por lo que incentivar esos resultados es súper importante. De hecho, nosotros colaboramos con universidades y el sector académico de muchas diferentes maneras, otorgando becas, subsidios y financiamiento de becas de doctorado en computación científica.

 

¿Cuáles son los sectores de empleo y capacitación más relevantes para un estudiante de ciencias de la computación?

Es importante que estudien los principales fundamentos de ciencias de la computación. El campo de ML es uno de los más relevantes y está creciendo en importancia, por lo cual yo alentaría a que se capaciten en ese campo. Lo interesante es que ML no solo afectará a las ciencias de la computación, sino también muchos otros ámbitos y tipos de aplicaciones, tanto en empresas como en organizaciones no gubernamentales. Así que tener un buen entendimiento de esa disciplina como herramienta puede resultar de mucha ayuda. En Google, también empleamos científicos sociales, que realizan investigación enfocada en la interacción de la gente con los sistemas de IA, lo que ayuda en el desarrollo y diseño de sistemas. Y en nuestra división de cuidado de salud estamos contratando un buen número de perfiles que no son usuales en compañías tradicionales de IT, como profesionales de la medicina y otras especialidades de la salud.