Skip to content

Instantly share code, notes, and snippets.

@marisbotero
Last active July 17, 2020 14:21
Show Gist options
  • Save marisbotero/d9ee42e4ba5df38d5aa8011cd59dafe6 to your computer and use it in GitHub Desktop.
Save marisbotero/d9ee42e4ba5df38d5aa8011cd59dafe6 to your computer and use it in GitHub Desktop.
馃挏Intro.ipynb
Display the source blob
Display the rendered blob
Raw
{
"nbformat": 4,
"nbformat_minor": 0,
"metadata": {
"colab": {
"name": "馃挏Intro.ipynb",
"provenance": [],
"include_colab_link": true
},
"kernelspec": {
"name": "python3",
"display_name": "Python 3"
},
"accelerator": "GPU"
},
"cells": [
{
"cell_type": "markdown",
"metadata": {
"id": "view-in-github",
"colab_type": "text"
},
"source": [
"<a href=\"https://colab.research.google.com/gist/marisbotero/d9ee42e4ba5df38d5aa8011cd59dafe6/-intro.ipynb\" target=\"_parent\"><img src=\"https://colab.research.google.com/assets/colab-badge.svg\" alt=\"Open In Colab\"/></a>"
]
},
{
"cell_type": "markdown",
"metadata": {
"id": "XNl94mckskzZ",
"colab_type": "text"
},
"source": [
"# **馃悕Hola Python Pereira**"
]
},
{
"cell_type": "markdown",
"metadata": {
"id": "q9UCcdFjkrsD",
"colab_type": "text"
},
"source": [
"## 馃挌Entrenando tu primer modelo馃挌\n",
"\n",
"\n"
]
},
{
"cell_type": "markdown",
"metadata": {
"id": "_kucEXAh-PTF",
"colab_type": "text"
},
"source": [
"El problema que vamos a resolver es convertir de grados Celsius a Fahrenheit, donde la f贸rmula aproximada es:\n",
"\n",
"$$ f = c* 1.8 + 32 $$\n",
"\n",
"\n",
"Por supuesto, ser铆a bastante simple crear una funci贸n Python convencional que realice directamente este c谩lculo, pero eso no ser铆a Machine Learning\n",
"\n",
"En cambio, le daremos a TensorFlow algunos valores Celsius de muestra (0, 8, 15, 22, 38) y sus valores Fahrenheit correspondientes (32, 46, 59, 72, 100).Luego, entrenaremos un modelo que resuelva la f贸rmula anterior a trav茅s del proceso de entrenamiento.馃帀"
]
},
{
"cell_type": "markdown",
"metadata": {
"id": "7zkZOkxz_fBp",
"colab_type": "text"
},
"source": [
"## 猸怚mportar librerias\n",
"\n",
"馃挋Vamos a importar primero TensorFlow. Aqu铆, lo llamamos `tf` para facilitar su uso. Tambi茅n le decimos que solo muestre errores.\n",
"\n",
"\n",
"馃挏A continuaci贸n, importanos ([NumPy](http://www.numpy.org/)) como `np`. \n",
"Que nos ayuda a representar nuestros datos como listas de alto rendimiento."
]
},
{
"cell_type": "code",
"metadata": {
"colab_type": "code",
"id": "bdLopQtuAJi4",
"colab": {}
},
"source": [
"# No importa esta declaraci贸n, por razones de compatibilidad.\n",
"from __future__ import absolute_import, division, print_function, unicode_literals"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "code",
"metadata": {
"colab_type": "code",
"id": "-ZMgCvSRFqxE",
"colab": {}
},
"source": [
"try:\n",
" # %tensorflow_version magic if in colab.\n",
" %tensorflow_version 2.x\n",
"except Exception:\n",
" pass\n",
"\n",
"import tensorflow as tf"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "code",
"metadata": {
"colab_type": "code",
"id": "y_WQEM5MGmg3",
"colab": {}
},
"source": [
"import numpy as np #numpy es una libreria para hacer operaciones matematicas de alto nivel\n",
"import logging #m贸dulo define funciones y clases que implementan un sistema flexible de registro de eventos para aplicaciones y bibliotecas.\n",
"logger = tf.get_logger()\n",
"logger.setLevel(logging.ERROR)"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"metadata": {
"id": "MwrBNyKH__9_",
"colab_type": "text"
},
"source": [
"## 馃Configurar los datos de entrenamiento\n",
"\n",
"el aprendizaje autom谩tico supervisado se trata de descubrir un algoritmo dado un conjunto de entradas y salidas. Dado que la tarea en este Codelab es crear un modelo que pueda dar la temperatura en Fahrenheit cuando se dan los grados en Celsius, creamos dos listas `celsius_q` y` fahrenheit_a` que podemos usar para entrenar nuestro modelo."
]
},
{
"cell_type": "code",
"metadata": {
"colab_type": "code",
"id": "gg4pn6aI1vms",
"colab": {
"base_uri": "https://localhost:8080/",
"height": 140
},
"outputId": "1ff9004d-2d43-4279-8fcd-417a2544b2ea"
},
"source": [
"celsius_q = np.array([-40, -10, 0, 8, 15, 22, 38], dtype=float)\n",
"fahrenheit_a = np.array([-40, 14, 32, 46, 59, 72, 100], dtype=float)\n",
"\n",
"#Bucle para visualizar los datos de entrada y salida de nuestro modelo\n",
"for i,c in enumerate(celsius_q):\n",
" print(\"{} degrees Celsius = {} degrees Fahrenheit\".format(c, fahrenheit_a[i]))"
],
"execution_count": null,
"outputs": [
{
"output_type": "stream",
"text": [
"-40.0 degrees Celsius = -40.0 degrees Fahrenheit\n",
"-10.0 degrees Celsius = 14.0 degrees Fahrenheit\n",
"0.0 degrees Celsius = 32.0 degrees Fahrenheit\n",
"8.0 degrees Celsius = 46.0 degrees Fahrenheit\n",
"15.0 degrees Celsius = 59.0 degrees Fahrenheit\n",
"22.0 degrees Celsius = 72.0 degrees Fahrenheit\n",
"38.0 degrees Celsius = 100.0 degrees Fahrenheit\n"
],
"name": "stdout"
}
]
},
{
"cell_type": "markdown",
"metadata": {
"id": "Q0iKGpBEBW2j",
"colab_type": "text"
},
"source": [
"### 馃挏馃挏Alguna terminolog铆a de Machine Learning馃挏馃挏\n",
"\n",
"聽 - **Caracter铆stica** - La entrada (s) a de nuestro modelo. En este caso, un valor 煤nico: los grados en grados Celsius.\n",
"\n",
"聽 - **Etiquetas** - El resultado que predice de nuestro modelo. En este caso, un valor 煤nico: los grados en Fahrenheit.\n",
"\n",
"聽 - **Ejemplo** - Un par de entradas / salidas utilizadas durante el entrenamiento. En nuestro caso, un par de valores de `celsius_q` y` fahrenheit_a` en un 铆ndice espec铆fico, como `(22,72)`."
]
},
{
"cell_type": "markdown",
"metadata": {
"id": "PToGlfL0Bo55",
"colab_type": "text"
},
"source": [
"## 馃搳Creaci贸n del modelo\n",
"\n",
"utilizaremos el modelo m谩s simple posible, una red densa. Como el problema es sencillo, esta red requerir谩 solo una capa, con una sola neurona.\n",
"\n",
"### Construcci贸n de las capas\n",
"\n",
"Llamaremos a la capa `l0` y la crearemos instanciando` tf.keras.layers.Dense` con la siguiente configuraci贸n:\n",
"\n",
"* `input_shape = [1]` - Esto especifica que la entrada a esta capa es un valor 煤nico. Es decir, la forma es una matriz unidimensional con un miembro. Como esta es la primera (y 煤nica) capa, esa forma de entrada es la forma de entrada de todo el modelo. El valor 煤nico es un n煤mero de coma flotante, que representa grados Celsius.\n",
"\n",
"* `units = 1` - Esto especifica el n煤mero de neuronas en la capa. El n煤mero de neuronas define cu谩ntas variables internas tiene que tratar la capa para aprender a resolver el problema (m谩s adelante). Dado que esta es la capa final, tambi茅n es el tama帽o de la salida del modelo: un 煤nico valor flotante que representa grados Fahrenheit. (En una red de varias capas, el tama帽o y la forma de la capa tendr铆an que coincidir con la `input_shape` de la siguiente capa)."
]
},
{
"cell_type": "code",
"metadata": {
"colab_type": "code",
"id": "pRllo2HLfXiu",
"colab": {}
},
"source": [
"l0 = tf.keras.layers.Dense(units=1, input_shape=[1])"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"metadata": {
"id": "BjSb-sNblvcL",
"colab_type": "text"
},
"source": [
"\n",
"**馃崁A menudo veras las capas definidas dentro de la definici贸n del modelo, en lugar de antes**:\n",
"\n",
"```python\n",
"model = tf.keras.Sequential([\n",
" tf.keras.layers.Dense(units=1, input_shape=[1])\n",
"])\n",
"```"
]
},
{
"cell_type": "markdown",
"metadata": {
"id": "EtcA8Sm_lI7r",
"colab_type": "text"
},
"source": [
"## 馃敤Ensamblar capas en el modelo\n",
"Una vez que se definen las capas, deben ensamblarse en un modelo. La definici贸n del modelo secuencial toma una lista de capas como argumento, especificando el orden de c谩lculo de la entrada a la salida.\n",
"\n",
"Este modelo tiene una sola capa, l0."
]
},
{
"cell_type": "code",
"metadata": {
"colab_type": "code",
"id": "cSp-GpLSuMRq",
"colab": {}
},
"source": [
"model = tf.keras.Sequential([l0])"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"metadata": {
"id": "WOQ3o10lmMgJ",
"colab_type": "text"
},
"source": [
"## Compilar el modelo, con funciones de p茅rdida y optimizador\n",
"\n",
"Antes de entrenar, el modelo tiene que ser compilado. Cuando se compila para el entrenamiento, se debe tener presente:\n",
"\n",
"- **Funci贸n de p茅rdida** - Una forma de medir qu茅 tan lejos est谩n las predicciones del resultado deseado. (La diferencia medida se llama \"p茅rdida\").\n",
"\n",
"- **Funci贸n de optimizador** - Una forma de ajustar los valores internos para reducir la p茅rdida."
]
},
{
"cell_type": "code",
"metadata": {
"colab_type": "code",
"id": "m8YQN1H41L-Y",
"colab": {}
},
"source": [
"model.compile(loss='mean_squared_error',\n",
" optimizer=tf.keras.optimizers.Adam(0.1))"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"metadata": {
"id": "WusKawMsolO7",
"colab_type": "text"
},
"source": [
"* durante el entrenamiento se usa (`model.fit ()`, a continuaci贸n) para calcular primero la p茅rdida en cada punto y luego mejorarla. De hecho, el acto de calcular la p茅rdida actual de un modelo y luego mejorarlo es precisamente lo que es el entrenamiento.\n",
"\n",
"* Durante el entrenamiento, la funci贸n de optimizaci贸n se usa para calcular los ajustes a las variables internas del modelo. El objetivo es ajustar las variables internas hasta que el modelo (que es realmente una funci贸n matem谩tica) refleje la ecuaci贸n real para convertir Celsius a Fahrenheit.\n",
"\n",
"* TensorFlow utiliza un an谩lisis num茅rico para realizar este ajuste, y toda esta complejidad est谩 oculta para nosotros, pero puede consultar la documentaci贸n oficial de la librer铆a. Lo que es 煤til saber sobre estos par谩metros son:\n",
"\n",
"馃挍 Funci贸n de p茅rdida ([mean squared error](https://en.wikipedia.org/wiki/Mean_squared_error)) y de optimiazci贸n ([Adam](https://machinelearningmastery.com/adam-optimization-algorithm-for-deep-learning/))utilizados aqu铆 son est谩ndar para modelos simples como este, pero hay muchos otros disponibles. \n",
"\n",
"馃АUna parte del Optimizador en la que se debe pensar al momento de crear sus propios modelos es la tasa de aprendizaje (`0.1` en el c贸digo anterior). Este es el tama帽o del paso dado al ajustar los valores en el modelo. Si el valor es demasiado peque帽o, se necesitar谩n demasiadas iteraciones para entrenar el modelo. Demasiado grande y la precisi贸n disminuye. Encontrar un buen valor a menudo implica alguna prueba y error, pero el rango generalmente est谩 dentro de 0.001 (predeterminado) y 0.1"
]
},
{
"cell_type": "markdown",
"metadata": {
"id": "dpyIoxEtqKGD",
"colab_type": "text"
},
"source": [
"## Entrenar al modelo\n",
"\n",
"para el entrenamiento se usa al m茅todo `fit`.\n",
"\n",
"Durante el entrenamiento, el modelo toma valores Celsius, realiza un c谩lculo utilizando las variables internas actuales (llamadas \"pesos\") y genera valores que est谩n destinados a ser el equivalente en Fahrenheit. Dado que los pesos se establecen inicialmente al azar, la salida no estar谩 cerca del valor correcto. La diferencia entre la salida real y la salida deseada se calcula utilizando la funci贸n de p茅rdida, y la funci贸n de optimizaci贸n dirige c贸mo deben ajustarse los pesos.\n",
"\n",
"Este ciclo de c谩lculo, comparaci贸n y ajuste se controla mediante el m茅todo `fit`. El primer argumento son las entradas, el segundo argumento son las salidas deseadas. El argumento `epochs` especifica cu谩ntas veces se debe ejecutar este ciclo, y el argumento`verbose` controla cu谩nta salida produce el m茅todo."
]
},
{
"cell_type": "code",
"metadata": {
"colab_type": "code",
"id": "lpRrl7WK10Pq",
"colab": {}
},
"source": [
"history = model.fit(celsius_q, fahrenheit_a, epochs=500, verbose=False)\n",
"print(\"Finished training the model\")"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"metadata": {
"id": "cxP3zoBJwBj0",
"colab_type": "text"
},
"source": [
"## 馃枻Mostrar estad铆sticas de entrenamiento\n",
"\n",
"El m茅todo `fit` devuelve un objeto de historial. Podemos usar este objeto para trazar c贸mo la p茅rdida de nuestro modelo disminuye despu茅s de cada 茅poca de entrenamiento. Una p茅rdida alta significa que los grados Fahrenheit que predice el modelo est谩n lejos del valor correspondiente en `fahrenheit_a`.\n",
"\n",
"Usaremos [Matplotlib](https://matplotlib.org/) para visualizar el resultado. Podemos ver, que nuestro modelo que mejora muy r谩pidamente al principio, y luego tiene una mejora constante y lenta hasta que est谩 muy cerca de \"perfecto\" hacia el final."
]
},
{
"cell_type": "code",
"metadata": {
"colab_type": "code",
"id": "IeK6BzfbdO6_",
"colab": {
"base_uri": "https://localhost:8080/",
"height": 296
},
"outputId": "81ce9571-b443-4fc4-9e01-08991376fdea"
},
"source": [
"import matplotlib.pyplot as plt\n",
"plt.xlabel('Epoch Number')\n",
"plt.ylabel(\"Loss Magnitude\")\n",
"plt.plot(history.history['loss'])"
],
"execution_count": null,
"outputs": [
{
"output_type": "execute_result",
"data": {
"text/plain": [
"[<matplotlib.lines.Line2D at 0x7f0550181128>]"
]
},
"metadata": {
"tags": []
},
"execution_count": 14
},
{
"output_type": "display_data",
"data": {
"image/png": "\n",
"text/plain": [
"<Figure size 432x288 with 1 Axes>"
]
},
"metadata": {
"tags": [],
"needs_background": "light"
}
}
]
},
{
"cell_type": "markdown",
"metadata": {
"id": "Pcue0k0QxbIr",
"colab_type": "text"
},
"source": [
"Usa el modelo para predecir valores\n",
"Ahora tiene un modelo que ha sido entrenado para aprender la relaci贸n entre celsius_q y fahrenheit_a. Puede usar el m茅todo de predicci贸n para que calcule los grados Fahrenheit para grados Celsius previamente desconocidos.\n",
"\n",
"Entonces, por ejemplo, si el valor Celsius es 100, 驴cu谩l cree que ser谩 el resultado Fahrenheit? Adivina antes de ejecutar este c贸digo."
]
},
{
"cell_type": "code",
"metadata": {
"colab_type": "code",
"id": "oxNzL4lS2Gui",
"colab": {
"base_uri": "https://localhost:8080/",
"height": 34
},
"outputId": "a50eb429-a72f-46b6-bf8f-babfa8ec0917"
},
"source": [
"print(model.predict([100.0]))"
],
"execution_count": null,
"outputs": [
{
"output_type": "stream",
"text": [
"[[211.29968]]\n"
],
"name": "stdout"
}
]
},
{
"cell_type": "code",
"metadata": {
"colab_type": "code",
"id": "XcBP6zi1ybCg",
"colab": {
"base_uri": "https://localhost:8080/",
"height": 34
},
"outputId": "11806dff-f8a5-48c2-c5ec-9c8d92927afd"
},
"source": [
"print(model.predict([200.0]))"
],
"execution_count": null,
"outputs": [
{
"output_type": "stream",
"text": [
"[[393.86972]]\n"
],
"name": "stdout"
}
]
},
{
"cell_type": "markdown",
"metadata": {
"id": "91NBQ5ICykMV",
"colab_type": "text"
},
"source": [
"La respuesta correcta es $100 \\times 1.8 + 32 = 212$, por lo que nuestro modelo est谩 funcionando muy bien.\n",
"\n",
"### Para revisar\n",
"\n",
"* Creamos un modelo con una capa densa\n",
"* Lo entrenamos con 3500 ejemplos (7 pares, m谩s de 500 茅pocas).\n",
"\n",
"Nuestro modelo ajust贸 las variables (pesos) en la capa Densa hasta que pudo devolver el valor Fahrenheit correcto para cualquier valor Celsius. (Recuerda, 100 Celsius no era parte de nuestros datos de entrenamiento)."
]
},
{
"cell_type": "markdown",
"metadata": {
"id": "OXeMnOdAzygu",
"colab_type": "text"
},
"source": [
"馃挍\n",
"Miremos los pesos de las capas\n",
"Finalmente, imprimamos las variables internas de la capa Densa."
]
},
{
"cell_type": "code",
"metadata": {
"colab_type": "code",
"id": "kmIkVdkbnZJI",
"colab": {
"base_uri": "https://localhost:8080/",
"height": 34
},
"outputId": "54489e77-6d63-4e83-dcf5-2db59221caeb"
},
"source": [
"print(\"These are the layer variables: {}\".format(l0.get_weights()))"
],
"execution_count": null,
"outputs": [
{
"output_type": "stream",
"text": [
"These are the layer variables: [array([[1.8257002]], dtype=float32), array([28.729662], dtype=float32)]\n"
],
"name": "stdout"
}
]
},
{
"cell_type": "markdown",
"metadata": {
"id": "CjzSpz4L0vYO",
"colab_type": "text"
},
"source": [
"La primera variable est谩 cerca de ~1.8 y la segunda a ~32. Estos valores (1.8 y 32) son las variables reales en la f贸rmula de conversi贸n real.\n",
"\n",
"Esto est谩 muy cerca de los valores en la f贸rmula de conversi贸n. pero para una sola neurona con una sola entrada y una sola salida, la matem谩tica interna se ve igual que la ecuaci贸n para una l铆nea, y = mx + b , que tiene la misma forma que la ecuaci贸n de conversi贸n, f = 1.8c + 32.\n",
"\n",
"Como la forma es la misma, las variables deber铆an converger en los valores est谩ndar de 1.8 y 32, que es exactamente lo que sucedi贸.\n",
"\n",
"Con neuronas adicionales, entradas adicionales y salidas adicionales, la f贸rmula se vuelve mucho m谩s compleja, pero la idea es la misma."
]
},
{
"cell_type": "markdown",
"metadata": {
"id": "J7j_uLYF1QZ-",
"colab_type": "text"
},
"source": [
"## Un peque帽o experimento\n",
"\n",
"驴qu茅 pasa si creamos m谩s capas densas con diferentes unidades, que por lo tanto tambi茅n tienen m谩s variables?"
]
},
{
"cell_type": "code",
"metadata": {
"colab_type": "code",
"id": "Y2zTA-rDS5Xk",
"colab": {
"base_uri": "https://localhost:8080/",
"height": 263
},
"outputId": "85c9845e-f96f-45e3-a93d-21d3505322ab"
},
"source": [
"l0 = tf.keras.layers.Dense(units=4, input_shape=[1])\n",
"l1 = tf.keras.layers.Dense(units=4)\n",
"l2 = tf.keras.layers.Dense(units=1)\n",
"model = tf.keras.Sequential([l0, l1, l2])\n",
"model.compile(loss='mean_squared_error', optimizer=tf.keras.optimizers.Adam(0.1))\n",
"model.fit(celsius_q, fahrenheit_a, epochs=500, verbose=False)\n",
"print(\"modelo Entrenado\")\n",
"print(model.predict([100.0]))\n",
"print(\"El modelo predice que 100 grados Celsius es: {} degrees Fahrenheit\".format(model.predict([100.0])))\n",
"print(\"Estas son las variables l0: {}\".format(l0.get_weights()))\n",
"print(\"Estas son las variables l1: {}\".format(l1.get_weights()))\n",
"print(\"Estas son las variables l2: {}\".format(l2.get_weights()))"
],
"execution_count": null,
"outputs": [
{
"output_type": "stream",
"text": [
"modelo Entrenado\n",
"[[211.74744]]\n",
"El modelo predice que 100 grados Celsius es: [[211.74744]] degrees Fahrenheit\n",
"Estas son las variables l0: [array([[-0.48331484, -0.26425937, 0.27393183, 0.35009843]],\n",
" dtype=float32), array([-3.3172476, 2.1680315, 3.352336 , 3.1641006], dtype=float32)]\n",
"Estas son las variables l1: [array([[ 1.0073822 , 1.0120987 , -0.39548022, -0.2694926 ],\n",
" [-0.1821391 , -0.1327263 , 1.197555 , 0.98735654],\n",
" [-0.8868927 , -0.58175534, 0.33293673, 0.6419989 ],\n",
" [-1.3141623 , 0.05242901, -0.14548413, 0.9013979 ]],\n",
" dtype=float32), array([-3.4697073, -0.7854123, 0.4618529, 3.5536973], dtype=float32)]\n",
"Estas son las variables l2: [array([[-1.2423879 ],\n",
" [-0.17954892],\n",
" [ 0.12979956],\n",
" [ 0.78609097]], dtype=float32), array([3.2585516], dtype=float32)]\n"
],
"name": "stdout"
}
]
},
{
"cell_type": "markdown",
"metadata": {
"id": "ppbJ-clw1msE",
"colab_type": "text"
},
"source": [
"este modelo tambi茅n puede predecir el valor Fahrenheit correspondiente realmente bien. Pero cuando observa las variables (pesos) en las capas l0 y l1, ni siquiera se acercan a ~ 1.8 y ~ 32. La complejidad a帽adida oculta la forma \"simple\" de la ecuaci贸n de conversi贸n.\n"
]
}
]
}
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment