Aprendizaje Automatizado Profundo

En esta jornada he hecho una pausa para escribir sobre algunos temas que atraen mi atención y espero que a los lectores de este blog les resulten al menos igual de interesantes.
Desde que tengo memoria me ha parecido fascinante que el ingenio humano haya podido abrirse paso para desarrollar herramientas que facilitan las tareas y que han permitido que los humanos sobreviviéramos y modificáramos el entorno para adecuarlo a nuestras necesidades.
Las herramientas han ido creciendo en sofisticación y, cada vez estos ingenios hacen más tareas que requieren menos nuestra intervención. Cuando Alan Turing concibió su primera máquina programable se preguntó si en algún punto de su evolución llegarían a un estado donde se les pudiera considerar inteligentes. Considero que en alguna medida hay software que puede tomar decisiones más razonables que algunos humanos que habitan la tierra.
Desde que Marvin Minsky acuño el término de inteligencia artificial (IA) en 1927, el software con estas características se ha utilizado para resolver problemas que son intelectualmente difíciles para las personas, pero sencillos desde la lógica que usan las computadoras -problemas que pueden describirse en una lista de reglas matemáticas. El gran reto para la IA consiste en resolver tareas que son fáciles de realizar por la gente pero que resulta difíciles de describir formalmente- es decir los resolvemos de forma intuitiva, automática, como reconocer el lenguaje hablado, rostros o imágenes.
El reto consiste en que las computadoras aprendan de la experiencia y entiendan el mundo en términos de una jerarquía de conceptos, donde cada concepto se relaciona hacia conceptos más simples. Este paradigma es poderoso, porque la computadora adquiere conocimiento desde la experiencia -como lo hacemos los humanos- y elimina la necesidad de que un operador humano brinde todo el conocimiento que la computadora necesita.
Si graficáramos cómo se construyen estas relaciones desde conceptos complejos hacia conceptos simples podemos imaginar una red con múltiples capas donde el concepto más simple se encuentra en lo profundo de la pila de capas. De ahí el término de aprendizaje profundo en la IA.

Algunos éxitos de IA sucedieron en retos que no requieren mucho conocimiento del mundo. Por ejemplo cuando el programa de IBM Deep Blue venció a Garry Kasparov en 1997 en ajedrez. El ajedrez es un mundo simple con reglas de movimiento de las piezas muy bien definidas. Establecer una estrategia ganadora ya es otra historia, pero para las computadoras no representa un reto ya que el juego se puede describir con pocas reglas muy bien definidas.
Aunque las computadoras son muy efectivas en tareas abstractas sucumben a tareas que requieren habilidades de un humano promedio como lo sería reconocer objetos o hablar.
Hasta aquí lo dejaré en esta intervención. La siguiente entrada del blog la dedicaré a explorar un poco más las técnicas matemáticas que nos permiten hacer que las maquinas aprendan de manera automática bajo este enfoque.
Referencias usadas: https://www.deeplearningbook.org/