numpy

705f766b · Mario Chirinos Colunga · 9daef39a · 705f766b
Commit 705f766b authored Feb 14, 2019 by Mario Chirinos Colunga 💬
Show whitespace changes
Inline Side-by-side

Showing with 110 additions and 6 deletions

05-NumPy&Pandas.ipynb 05-NumPy&Pandas.ipynb +110 -6

No files found.
--- a/05-NumPy&Pandas.ipynb
+++ b/05-NumPy&Pandas.ipynb
@@ -826,22 +826,126 @@
   "cell_type": "markdown",
   "metadata": {},
   "source": [
-    "## 2.2 Pandas"
+    "## 2.2 Pandas\n",
+    "En python, pandas es una biblioteca de software escrita como extensión de NumPy para manipulación y análisis de datos. En particular, ofrece estructuras de datos y operaciones para manipular tablas numéricas y series temporales.\n",
+    "and expressive data structures designed to make working with “relational” or “labeled” data both easy and intuitive. Su objetivo es ser un bloque de construccion fundamental para realizar analisis de datos en el mundo real.\n",
+    "El nombre de la biblioteca deriva del término \"datos de panel\" (PANel DAta), término de econometría que designa datos que combinan una dimensión temporal con otra dimensión transversal.\n",
+    "\n",
+    "Pandas tiene dos typos de datos principales, **Series** (1D) y **DataFrame** (2D), *Dataframe* es un contenedr para *Series* y *Series* es un contenedor de escalares. \n",
+    "\n",
+    "### 2.2.1 Series\n",
+    "Series es un arreglo unidimensional etiquetado capaz de contener cualquier tipo de dato (Enteros, cadenas, punto flotante, objetos, etc), El eje de etiquetas es llamado indice (**index**).\n",
+    "\n"
   ]
  },
  {
-   "cell_type": "markdown",
+   "cell_type": "code",
+   "execution_count": 41,
   "metadata": {},
+   "outputs": [],
   "source": [
-    "En python, pandas es una biblioteca de software escrita como extensión de NumPy para manipulación y análisis de datos. En particular, ofrece estructuras de datos y operaciones para manipular tablas numéricas y series temporales.  El nombre de la biblioteca deriva del término \"datos de panel\" (PANel DAta), término de econometría que designa datos que combinan una dimensión temporal con otra dimensión transversal."
+    "import numpy as np\n",
+    "import pandas as pd"
   ]
  },
  {
   "cell_type": "code",
-   "execution_count": null,
+   "execution_count": 45,
   "metadata": {},
-   "outputs": [],
-   "source": []
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "a   -1.144505\n",
+       "b    0.483479\n",
+       "c   -0.633879\n",
+       "d   -1.152392\n",
+       "e    1.992141\n",
+       "dtype: float64"
+      ]
+     },
+     "execution_count": 45,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "pd.Series(np.random.randn(5), index=['a', 'b', 'c', 'd', 'e'])"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 46,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "0    2.042498\n",
+       "1   -0.964070\n",
+       "2   -0.687132\n",
+       "3    0.623300\n",
+       "4    1.366322\n",
+       "dtype: float64"
+      ]
+     },
+     "execution_count": 46,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "pd.Series(np.random.randn(5))"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 47,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "a    0\n",
+       "b    1\n",
+       "c    2\n",
+       "dtype: int64"
+      ]
+     },
+     "execution_count": 47,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "d = {'b': 1, 'a': 0, 'c': 2}\n",
+    "pd.Series(d)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 48,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "b    1.0\n",
+       "c    2.0\n",
+       "d    NaN\n",
+       "a    0.0\n",
+       "dtype: float64"
+      ]
+     },
+     "execution_count": 48,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "d = {'a': 0., 'b': 1., 'c': 2.}\n",
+    "pd.Series(d, index=['b', 'c', 'd', 'a'])"
+   ]
  },
  {
   "cell_type": "code",