{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Standard imports, get names from database."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>first_name</th>\n",
       "      <th>last_name</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>PENELOPE</td>\n",
       "      <td>GUINESS</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>NICK</td>\n",
       "      <td>WAHLBERG</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>ED</td>\n",
       "      <td>CHASE</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>JENNIFER</td>\n",
       "      <td>DAVIS</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>JOHNNY</td>\n",
       "      <td>LOLLOBRIGIDA</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "  first_name     last_name\n",
       "0   PENELOPE       GUINESS\n",
       "1       NICK      WAHLBERG\n",
       "2         ED         CHASE\n",
       "3   JENNIFER         DAVIS\n",
       "4     JOHNNY  LOLLOBRIGIDA"
      ]
     },
     "execution_count": 6,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "import numpy as np\n",
    "import pandas as pd\n",
    "import matplotlib.pyplot as plt\n",
    "import pymysql\n",
    "\n",
    "sakila = pymysql.connect(host=\"localhost\",\n",
    "                         user=\"root\",\n",
    "                         password=\"\",\n",
    "                         db=\"sakila\",\n",
    "                         charset=\"utf8mb4\",\n",
    "                         cursorclass=pymysql.cursors.DictCursor)\n",
    "\n",
    "grades = pd.read_sql(\"select first_name, last_name from actor\", con = sakila)\n",
    "grades.head()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Update the index with login ids that look like GT login IDs, generated from names, e.g.. Penelope Guinness's id is pguiness0."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 7,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>first_name</th>\n",
       "      <th>last_name</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>loginId</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>pguiness0</th>\n",
       "      <td>PENELOPE</td>\n",
       "      <td>GUINESS</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>nwahlberg1</th>\n",
       "      <td>NICK</td>\n",
       "      <td>WAHLBERG</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>echase2</th>\n",
       "      <td>ED</td>\n",
       "      <td>CHASE</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>jdavis3</th>\n",
       "      <td>JENNIFER</td>\n",
       "      <td>DAVIS</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>jlollobrigida4</th>\n",
       "      <td>JOHNNY</td>\n",
       "      <td>LOLLOBRIGIDA</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "               first_name     last_name\n",
       "loginId                                \n",
       "pguiness0        PENELOPE       GUINESS\n",
       "nwahlberg1           NICK      WAHLBERG\n",
       "echase2                ED         CHASE\n",
       "jdavis3          JENNIFER         DAVIS\n",
       "jlollobrigida4     JOHNNY  LOLLOBRIGIDA"
      ]
     },
     "execution_count": 7,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "ids = [grades.loc[i]['first_name'].lower()[0] + grades.loc[i]['last_name'].lower() + str(i)\n",
    "       for i in grades.index]\n",
    "grades.index = ids\n",
    "grades.index.name = \"loginId\"\n",
    "grades.head()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Convert names to capitalized form."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 8,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>first_name</th>\n",
       "      <th>last_name</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>loginId</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>pguiness0</th>\n",
       "      <td>Penelope</td>\n",
       "      <td>Guiness</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>nwahlberg1</th>\n",
       "      <td>Nick</td>\n",
       "      <td>Wahlberg</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>echase2</th>\n",
       "      <td>Ed</td>\n",
       "      <td>Chase</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>jdavis3</th>\n",
       "      <td>Jennifer</td>\n",
       "      <td>Davis</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>jlollobrigida4</th>\n",
       "      <td>Johnny</td>\n",
       "      <td>Lollobrigida</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "               first_name     last_name\n",
       "loginId                                \n",
       "pguiness0        Penelope       Guiness\n",
       "nwahlberg1           Nick      Wahlberg\n",
       "echase2                Ed         Chase\n",
       "jdavis3          Jennifer         Davis\n",
       "jlollobrigida4     Johnny  Lollobrigida"
      ]
     },
     "execution_count": 8,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "grades['first_name'] = grades.apply(lambda row: row['first_name'].capitalize(), axis=1)\n",
    "grades['last_name'] = grades.apply(lambda row: row['last_name'].capitalize(), axis=1)\n",
    "grades.head()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Make a single \"name\" column with last_name, first_name format, get rid of old last_name and first_name columns."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 9,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>name</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>loginId</th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>pguiness0</th>\n",
       "      <td>Guiness, Penelope</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>nwahlberg1</th>\n",
       "      <td>Wahlberg, Nick</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>echase2</th>\n",
       "      <td>Chase, Ed</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>jdavis3</th>\n",
       "      <td>Davis, Jennifer</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>jlollobrigida4</th>\n",
       "      <td>Lollobrigida, Johnny</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "                                name\n",
       "loginId                             \n",
       "pguiness0          Guiness, Penelope\n",
       "nwahlberg1            Wahlberg, Nick\n",
       "echase2                    Chase, Ed\n",
       "jdavis3              Davis, Jennifer\n",
       "jlollobrigida4  Lollobrigida, Johnny"
      ]
     },
     "execution_count": 9,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "grades['name'] = grades.apply(lambda row: f\"{row['last_name']}, {row['first_name']}\", axis=1)\n",
    "del(grades['first_name'])\n",
    "del(grades['last_name'])\n",
    "grades.head()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Add some fake assignments and grades, convert values to integers, and save resulting DataFrame to a CSV file."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 10,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>name</th>\n",
       "      <th>hw0</th>\n",
       "      <th>hw1</th>\n",
       "      <th>hw3</th>\n",
       "      <th>quiz1</th>\n",
       "      <th>quiz2</th>\n",
       "      <th>quiz3</th>\n",
       "      <th>quiz4</th>\n",
       "      <th>quiz5</th>\n",
       "      <th>quiz6</th>\n",
       "      <th>exam1</th>\n",
       "      <th>exam2</th>\n",
       "      <th>exam3</th>\n",
       "      <th>final_exam</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>loginId</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>pguiness0</th>\n",
       "      <td>Guiness, Penelope</td>\n",
       "      <td>88</td>\n",
       "      <td>92</td>\n",
       "      <td>100</td>\n",
       "      <td>66</td>\n",
       "      <td>63</td>\n",
       "      <td>64</td>\n",
       "      <td>59</td>\n",
       "      <td>66</td>\n",
       "      <td>66</td>\n",
       "      <td>87</td>\n",
       "      <td>78</td>\n",
       "      <td>94</td>\n",
       "      <td>74</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>nwahlberg1</th>\n",
       "      <td>Wahlberg, Nick</td>\n",
       "      <td>97</td>\n",
       "      <td>91</td>\n",
       "      <td>92</td>\n",
       "      <td>53</td>\n",
       "      <td>64</td>\n",
       "      <td>70</td>\n",
       "      <td>61</td>\n",
       "      <td>78</td>\n",
       "      <td>70</td>\n",
       "      <td>88</td>\n",
       "      <td>83</td>\n",
       "      <td>90</td>\n",
       "      <td>72</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>echase2</th>\n",
       "      <td>Chase, Ed</td>\n",
       "      <td>87</td>\n",
       "      <td>89</td>\n",
       "      <td>93</td>\n",
       "      <td>83</td>\n",
       "      <td>71</td>\n",
       "      <td>79</td>\n",
       "      <td>70</td>\n",
       "      <td>63</td>\n",
       "      <td>72</td>\n",
       "      <td>93</td>\n",
       "      <td>76</td>\n",
       "      <td>84</td>\n",
       "      <td>69</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>jdavis3</th>\n",
       "      <td>Davis, Jennifer</td>\n",
       "      <td>88</td>\n",
       "      <td>84</td>\n",
       "      <td>98</td>\n",
       "      <td>66</td>\n",
       "      <td>64</td>\n",
       "      <td>62</td>\n",
       "      <td>70</td>\n",
       "      <td>64</td>\n",
       "      <td>73</td>\n",
       "      <td>90</td>\n",
       "      <td>96</td>\n",
       "      <td>83</td>\n",
       "      <td>83</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>jlollobrigida4</th>\n",
       "      <td>Lollobrigida, Johnny</td>\n",
       "      <td>89</td>\n",
       "      <td>84</td>\n",
       "      <td>82</td>\n",
       "      <td>76</td>\n",
       "      <td>74</td>\n",
       "      <td>68</td>\n",
       "      <td>72</td>\n",
       "      <td>62</td>\n",
       "      <td>84</td>\n",
       "      <td>81</td>\n",
       "      <td>76</td>\n",
       "      <td>78</td>\n",
       "      <td>67</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "                                name  hw0  hw1  hw3  quiz1  quiz2  quiz3  \\\n",
       "loginId                                                                    \n",
       "pguiness0          Guiness, Penelope   88   92  100     66     63     64   \n",
       "nwahlberg1            Wahlberg, Nick   97   91   92     53     64     70   \n",
       "echase2                    Chase, Ed   87   89   93     83     71     79   \n",
       "jdavis3              Davis, Jennifer   88   84   98     66     64     62   \n",
       "jlollobrigida4  Lollobrigida, Johnny   89   84   82     76     74     68   \n",
       "\n",
       "                quiz4  quiz5  quiz6  exam1  exam2  exam3  final_exam  \n",
       "loginId                                                               \n",
       "pguiness0          59     66     66     87     78     94          74  \n",
       "nwahlberg1         61     78     70     88     83     90          72  \n",
       "echase2            70     63     72     93     76     84          69  \n",
       "jdavis3            70     64     73     90     96     83          83  \n",
       "jlollobrigida4     72     62     84     81     76     78          67  "
      ]
     },
     "execution_count": 10,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "for hw in [\"hw0\", \"hw1\", \"hw3\"]:\n",
    "    grades[hw] = np.random.normal(90, 5, len(grades))\n",
    "for quiz in [\"quiz1\", \"quiz2\", \"quiz3\", \"quiz4\", \"quiz5\", \"quiz6\"]:\n",
    "    grades[quiz] = np.random.normal(70, 10, len(grades))\n",
    "for exam in [\"exam1\", \"exam2\", \"exam3\", \"final_exam\"]:\n",
    "    grades[exam] = np.random.normal(78, 10, len(grades))\n",
    "# Convert grades to integers\n",
    "for col in grades.columns[1:]:\n",
    "    grades[col] = grades[col].astype('int', copy=False)\n",
    "grades.to_csv(\"sakila-grades.csv\")\n",
    "grades.head()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.6.4"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}