{
 "cells": [
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "# Fairness and Explainability with SageMaker Clarify"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "---\n",
    "\n",
    "This notebook's CI test result for us-west-2 is as follows. CI test results in other regions can be found at the end of the notebook. \n",
    "\n",
    "![This us-west-2 badge failed to load. Check your device's internet connectivity, otherwise the service is currently unavailable](https://h75twx4l60.execute-api.us-west-2.amazonaws.com/sagemaker-nb/us-west-2/sagemaker-clarify|fairness_and_explainability|fairness_and_explainability.ipynb)\n",
    "\n",
    "---"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## Runtime\n",
    "\n",
    "This notebook takes approximately 30 minutes to run.\n",
    "\n",
    "## Contents\n",
    "\n",
    "1. [Overview](#Overview)\n",
    "1. [Prerequisites and Data](#Prerequisites-and-Data)\n",
    "    1. [Import Libraries](#Import-Libraries)\n",
    "    1. [Set Configurations](#Set-Configurations)\n",
    "    1. [Download data](#Download-data)\n",
    "    1. [Loading the data: Adult Dataset](#Loading-the-data:-Adult-Dataset) \n",
    "    1. [Data inspection](#Data-inspection) \n",
    "    1. [Encode and Upload the Dataset](#Encode-and-Upload-the-Dataset) \n",
    "1. [Train and Deploy XGBoost Model](#Train-XGBoost-Model)\n",
    "    1. [Train Model](#Train-Model)\n",
    "    1. [Create Model](#Create-Model)\n",
    "1. [Amazon SageMaker Clarify](#Amazon-SageMaker-Clarify)\n",
    "    1. [Detecting Bias](#Detecting-Bias)\n",
    "        1. [Writing DataConfig](#Writing-DataConfig)\n",
    "        1. [Writing ModelConfig](#Writing-ModelConfig)\n",
    "        1. [Writing ModelPredictedLabelConfig](#Writing-ModelPredictedLabelConfig)\n",
    "        1. [Writing BiasConfig](#Writing-BiasConfig)\n",
    "        1. [Pre-training Bias](#Pre-training-Bias)\n",
    "        1. [Post-training Bias](#Post-training-Bias)\n",
    "        1. [Viewing the Bias Report](#Viewing-the-Bias-Report)\n",
    "    1. [Explaining Predictions](#Explaining-Predictions)\n",
    "        1. [Viewing the Explainability Report](#Viewing-the-Explainability-Report)\n",
    "        1. [Analysis of local explanations](#Analysis-of-local-explanations)\n",
    "1. [Clean Up](#Clean-Up)\n",
    "\n",
    "## Overview\n",
    "Amazon SageMaker Clarify helps improve your machine learning models by detecting potential bias and helping explain how these models make predictions. The fairness and explainability functionality provided by SageMaker Clarify takes a step towards enabling AWS customers to build trustworthy and understandable machine learning models. The product comes with the tools to help you with the following tasks.\n",
    "\n",
    "* Measure biases that can occur during each stage of the ML lifecycle (data collection, model training and tuning, and monitoring of ML models deployed for inference).\n",
    "* Generate model governance reports targeting risk and compliance teams and external regulators.\n",
    "* Provide explanations of the data, models, and monitoring used to assess predictions.\n",
    "\n",
    "This sample notebook walks you through:  \n",
    "1. Key terms and concepts needed to understand SageMaker Clarify\n",
    "1. Measuring the pre-training bias of a dataset and post-training bias of a model\n",
    "1. Explaining the importance of the various input features on the model's decision\n",
    "1. Accessing the reports through SageMaker Studio if you have an instance set up.\n",
    "\n",
    "In doing so, the notebook first trains a [SageMaker XGBoost](https://docs.aws.amazon.com/sagemaker/latest/dg/xgboost.html) model using training dataset, then use [Amazon SageMaker Python SDK](https://sagemaker.readthedocs.io/en/stable/) to launch SageMaker Clarify jobs to analyze an example dataset in CSV format. \n",
    "\n",
    "SageMaker Clarify also supports analyzing dataset in [SageMaker JSON Lines dense format](https://docs.aws.amazon.com/sagemaker/latest/dg/cdf-inference.html#common-in-formats), which is illustrated in [another notebook](https://github.com/aws/amazon-sagemaker-examples/blob/master/sagemaker_processing/fairness_and_explainability/fairness_and_explainability_jsonlines_format.ipynb). Additionally, there is a [peer example available](https://github.com/aws/amazon-sagemaker-examples/blob/main/sagemaker-clarify/fairness_and_explainability/fairness_and_explainability_boto3.ipynb) that utilizes the [AWS SDK for Python](https://aws.amazon.com/sdk-for-python/) to launch SageMaker Clarify jobs to analyze data in CSV format. "
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## Prerequisites and Data\n",
    "### Import Libraries"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {},
   "outputs": [],
   "source": [
    "import pandas as pd\n",
    "import numpy as np\n",
    "import os\n",
    "import boto3\n",
    "from datetime import datetime\n",
    "from sagemaker import get_execution_role, session"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Set Configurations"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "Region: ap-south-1\n",
      "Role: arn:aws:iam::000000000000:role/service-role/SMClarifySageMaker-ExecutionRole\n"
     ]
    }
   ],
   "source": [
    "# Initialize sagemaker session\n",
    "sagemaker_session = session.Session()\n",
    "\n",
    "region = sagemaker_session.boto_region_name\n",
    "print(f\"Region: {region}\")\n",
    "\n",
    "role = get_execution_role()\n",
    "print(f\"Role: {role}\")\n",
    "\n",
    "bucket = sagemaker_session.default_bucket()\n",
    "\n",
    "prefix = \"sagemaker/DEMO-sagemaker-clarify\""
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Download data\n",
    "Data Source: [https://archive.ics.uci.edu/ml/machine-learning-databases/adult/](https://archive.ics.uci.edu/ml/machine-learning-databases/adult/)\n",
    "\n",
    "Let's __download__ the data and save it in the local folder with the name adult.data and adult.test from UCI repository$^{[2]}$.\n",
    "\n",
    "$^{[2]}$Dua Dheeru, and Efi Karra Taniskidou. \"[UCI Machine Learning Repository](http://archive.ics.uci.edu/ml)\". Irvine, CA: University of California, School of Information and Computer Science (2017)."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "adult.data already on disk.\n",
      "adult.test already on disk.\n"
     ]
    }
   ],
   "source": [
    "from sagemaker.s3 import S3Downloader\n",
    "\n",
    "adult_columns = [\n",
    "    \"Age\",\n",
    "    \"Workclass\",\n",
    "    \"fnlwgt\",\n",
    "    \"Education\",\n",
    "    \"Education-Num\",\n",
    "    \"Marital Status\",\n",
    "    \"Occupation\",\n",
    "    \"Relationship\",\n",
    "    \"Ethnic group\",\n",
    "    \"Sex\",\n",
    "    \"Capital Gain\",\n",
    "    \"Capital Loss\",\n",
    "    \"Hours per week\",\n",
    "    \"Country\",\n",
    "    \"Target\",\n",
    "]\n",
    "if not os.path.isfile(\"adult.data\"):\n",
    "    S3Downloader.download(\n",
    "        s3_uri=\"s3://{}/{}\".format(\n",
    "            f\"sagemaker-example-files-prod-{region}\", \"datasets/tabular/uci_adult/adult.data\"\n",
    "        ),\n",
    "        local_path=\"./\",\n",
    "        sagemaker_session=sagemaker_session,\n",
    "    )\n",
    "    print(\"adult.data saved!\")\n",
    "else:\n",
    "    print(\"adult.data already on disk.\")\n",
    "\n",
    "if not os.path.isfile(\"adult.test\"):\n",
    "    S3Downloader.download(\n",
    "        s3_uri=\"s3://{}/{}\".format(\n",
    "            f\"sagemaker-example-files-prod-{region}\", \"datasets/tabular/uci_adult/adult.test\"\n",
    "        ),\n",
    "        local_path=\"./\",\n",
    "        sagemaker_session=sagemaker_session,\n",
    "    )\n",
    "    print(\"adult.test saved!\")\n",
    "else:\n",
    "    print(\"adult.test already on disk.\")"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Loading the data: Adult Dataset\n",
    "From the UCI repository of machine learning datasets, this database contains 14 features concerning demographic characteristics of 45,222 rows (32,561 for training and 12,661 for testing). The task is to predict whether a person has a yearly income that is more or less than $50,000.\n",
    "\n",
    "Here are the features and their possible values:\n",
    "\n",
    "1. **Age**: continuous.\n",
    "1. **Workclass**: Private, Self-emp-not-inc, Self-emp-inc, Federal-gov, Local-gov, State-gov, Without-pay, Never-worked.\n",
    "1. **Fnlwgt**: continuous (the number of people the census takers believe that observation represents).\n",
    "1. **Education**: Bachelors, Some-college, 11th, HS-grad, Prof-school, Assoc-acdm, Assoc-voc, 9th, 7th-8th, 12th, Masters, 1st-4th, 10th, Doctorate, 5th-6th, Preschool.\n",
    "1. **Education-num**: continuous.\n",
    "1. **Marital-status**: Married-civ-spouse, Divorced, Never-married, Separated, Widowed, Married-spouse-absent, Married-AF-spouse.\n",
    "1. **Occupation**: Tech-support, Craft-repair, Other-service, Sales, Exec-managerial, Prof-specialty, Handlers-cleaners, Machine-op-inspct, Adm-clerical, Farming-fishing, Transport-moving, Priv-house-serv, Protective-serv, Armed-Forces.\n",
    "1. **Relationship**: Wife, Own-child, Husband, Not-in-family, Other-relative, Unmarried.\n",
    "1. **Ethnic group**: White, Asian-Pac-Islander, Amer-Indian-Eskimo, Other, Black.\n",
    "1. **Sex**: Female, Male.\n",
    "    * **Note**: this data is extracted from the 1994 Census and enforces a binary option on Sex\n",
    "1. **Capital-gain**: continuous.\n",
    "1. **Capital-loss**: continuous.\n",
    "1. **Hours-per-week**: continuous.\n",
    "1. **Native-country**: United-States, Cambodia, England, Puerto-Rico, Canada, Germany, Outlying-US(Guam-USVI-etc), India, Japan, Greece, South, China, Cuba, Iran, Honduras, Philippines, Italy, Poland, Jamaica, Vietnam, Mexico, Portugal, Ireland, France, Dominican-Republic, Laos, Ecuador, Taiwan, Haiti, Columbia, Hungary, Guatemala, Nicaragua, Scotland, Thailand, Yugoslavia, El-Salvador, Trinadad&Tobago, Peru, Hong, Holand-Netherlands.\n",
    "\n",
    "Next, we specify our binary prediction task: \n",
    "\n",
    "15. **Target**: <=50,000, >$50,000."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {
    "scrolled": true
   },
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Age</th>\n",
       "      <th>Workclass</th>\n",
       "      <th>fnlwgt</th>\n",
       "      <th>Education</th>\n",
       "      <th>Education-Num</th>\n",
       "      <th>Marital Status</th>\n",
       "      <th>Occupation</th>\n",
       "      <th>Relationship</th>\n",
       "      <th>Ethnic group</th>\n",
       "      <th>Sex</th>\n",
       "      <th>Capital Gain</th>\n",
       "      <th>Capital Loss</th>\n",
       "      <th>Hours per week</th>\n",
       "      <th>Country</th>\n",
       "      <th>Target</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>39</td>\n",
       "      <td>State-gov</td>\n",
       "      <td>77516</td>\n",
       "      <td>Bachelors</td>\n",
       "      <td>13</td>\n",
       "      <td>Never-married</td>\n",
       "      <td>Adm-clerical</td>\n",
       "      <td>Not-in-family</td>\n",
       "      <td>White</td>\n",
       "      <td>Male</td>\n",
       "      <td>2174</td>\n",
       "      <td>0</td>\n",
       "      <td>40</td>\n",
       "      <td>United-States</td>\n",
       "      <td>&lt;=50K</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>50</td>\n",
       "      <td>Self-emp-not-inc</td>\n",
       "      <td>83311</td>\n",
       "      <td>Bachelors</td>\n",
       "      <td>13</td>\n",
       "      <td>Married-civ-spouse</td>\n",
       "      <td>Exec-managerial</td>\n",
       "      <td>Husband</td>\n",
       "      <td>White</td>\n",
       "      <td>Male</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>13</td>\n",
       "      <td>United-States</td>\n",
       "      <td>&lt;=50K</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>38</td>\n",
       "      <td>Private</td>\n",
       "      <td>215646</td>\n",
       "      <td>HS-grad</td>\n",
       "      <td>9</td>\n",
       "      <td>Divorced</td>\n",
       "      <td>Handlers-cleaners</td>\n",
       "      <td>Not-in-family</td>\n",
       "      <td>White</td>\n",
       "      <td>Male</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>40</td>\n",
       "      <td>United-States</td>\n",
       "      <td>&lt;=50K</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>53</td>\n",
       "      <td>Private</td>\n",
       "      <td>234721</td>\n",
       "      <td>11th</td>\n",
       "      <td>7</td>\n",
       "      <td>Married-civ-spouse</td>\n",
       "      <td>Handlers-cleaners</td>\n",
       "      <td>Husband</td>\n",
       "      <td>Black</td>\n",
       "      <td>Male</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>40</td>\n",
       "      <td>United-States</td>\n",
       "      <td>&lt;=50K</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>28</td>\n",
       "      <td>Private</td>\n",
       "      <td>338409</td>\n",
       "      <td>Bachelors</td>\n",
       "      <td>13</td>\n",
       "      <td>Married-civ-spouse</td>\n",
       "      <td>Prof-specialty</td>\n",
       "      <td>Wife</td>\n",
       "      <td>Black</td>\n",
       "      <td>Female</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>40</td>\n",
       "      <td>Cuba</td>\n",
       "      <td>&lt;=50K</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "   Age         Workclass  fnlwgt  Education  Education-Num  \\\n",
       "0   39         State-gov   77516  Bachelors             13   \n",
       "1   50  Self-emp-not-inc   83311  Bachelors             13   \n",
       "2   38           Private  215646    HS-grad              9   \n",
       "3   53           Private  234721       11th              7   \n",
       "4   28           Private  338409  Bachelors             13   \n",
       "\n",
       "       Marital Status         Occupation   Relationship Ethnic group     Sex  \\\n",
       "0       Never-married       Adm-clerical  Not-in-family        White    Male   \n",
       "1  Married-civ-spouse    Exec-managerial        Husband        White    Male   \n",
       "2            Divorced  Handlers-cleaners  Not-in-family        White    Male   \n",
       "3  Married-civ-spouse  Handlers-cleaners        Husband        Black    Male   \n",
       "4  Married-civ-spouse     Prof-specialty           Wife        Black  Female   \n",
       "\n",
       "   Capital Gain  Capital Loss  Hours per week        Country Target  \n",
       "0          2174             0              40  United-States  <=50K  \n",
       "1             0             0              13  United-States  <=50K  \n",
       "2             0             0              40  United-States  <=50K  \n",
       "3             0             0              40  United-States  <=50K  \n",
       "4             0             0              40           Cuba  <=50K  "
      ]
     },
     "execution_count": 4,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "training_data = pd.read_csv(\n",
    "    \"adult.data\", names=adult_columns, sep=r\"\\s*,\\s*\", engine=\"python\", na_values=\"?\"\n",
    ").dropna()\n",
    "\n",
    "testing_data = pd.read_csv(\n",
    "    \"adult.test\", names=adult_columns, sep=r\"\\s*,\\s*\", engine=\"python\", na_values=\"?\", skiprows=1\n",
    ").dropna()\n",
    "\n",
    "training_data.head()"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Data inspection\n",
    "Plotting histograms for the distribution of the different features is a good way to visualize the data. Let's plot a few of the features that can be considered _sensitive_.  \n",
    "Let's take a look specifically at the Sex feature of a census respondent. In the first plot we see that there are fewer Female respondents as a whole but especially in the positive outcomes, where they form ~$\\frac{1}{7}$th of respondents."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {
    "scrolled": true
   },
   "outputs": [
    {
     "data": {
      "text/plain": [
       "<AxesSubplot:title={'center':'Counts of Sex'}>"
      ]
     },
     "execution_count": 5,
     "metadata": {},
     "output_type": "execute_result"
    },
    {
     "data": {
      "image/png": "iVBORw0KGgoAAAANSUhEUgAAAYQAAAEICAYAAABfz4NwAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjUuMCwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy8/fFQqAAAACXBIWXMAAAsTAAALEwEAmpwYAAAY2UlEQVR4nO3de7RedX3n8fenhCJqoVyONE2iQYm2kKlhJWZQq4uu2BIvFZwBDdMKtKwVZeFYl3ZmQG11tJkRFWmZJdg4MARGuYyIsCpUEarUEcGDRsK1hItyTAYOiBiqRBO/88fzO/pw8uTcc04u79dae539fPfvt/fv4XI+z/7t/ZydqkKSpF+b6QFIknYOBoIkCTAQJEmNgSBJAgwESVJjIEiSAANB2ikkOSTJTUk2JTl7psejPZOBoF1Skv+QpD/JU0k2Jrkuye9Pw3EryWE7YNcrgceA/arqPT2OOzfJlUkeS/JkknVJTtkB49AebNZMD0AaryTvBs4A3g58CfgZsBw4Fvj6DA5tMl4A3FXb/6boJcB3W7vNwL8BfmuaxqY9RVW5uOwyC7A/8BRwwght9gH+FtjQlr8F9mnbTgG+Pqx9AYe19YuATwJfBDYBtwAvattuam3/tY3hLcDBwD8APwJ+CPwz8GvbGdcrgG8BT7afr+g65s/pBNtTwGt69H0KWDTCez4K+EYbx3eBo7uO+Rgwr71+aWvzOzP979Jl51ucMtKu5uXAs4CrRmjzPjq/IBfR+QW4FHj/OI5xIvBfgQOA9cAqgKp6ddv+0qp6blVdDrwHGAD6gEOA99IJjWdIciCdkDkXOAj4BPDFJAdV1SnAZ4CPtv1+pceYvgl8MsmKJM8ftu85bd9/AxwI/CVwZZK+qvoG8PfAmiT70jnTeH9V3TOOfx7aQxgI2tUcBDxWVVtGaPMnwIeq6tGqGqTzy/2t4zjG56vq1naMz9AJlu35OTAbeEFV/byq/rmqek37vB64r6ouqaotVXUpcA/wx2Mc0wl0zj7+CngwydokL2vb/hS4tqqurapfVNX1QD/wurb9g3TOrG6lc8b0yTEeU3sYA0G7mseBg5OMdP3rt4Hvdb3+XquN1f/rWv8J8NwR2n6MzlnEl5M8kOSMMY5paFxzxjKgqnqiqs6oqiPonImsBb6QJHSuK5yQ5EdDC/D7dIKKqvo5nWmphcDZ2wksyUDQLudm4GnguBHabKDzS3LI81sNOvP/zx7akGRSF2aralNVvaeqXkjn0/67kywbw5iGxvWDCRzzMeDjdELmQOBh4JKq+s2u5TlV9RH45ZTSB4D/BZydZJ/xHlN7BgNBu5SqehL4azrz6ccleXaSvZO8NslHW7NLgfcn6UtycGv/v9u27wJHJFmU5Fl0plPG4xHghUMvkrwhyWHtk/qPga1tGe5a4MXtdtlZSd4CHE7ngvSokpyVZGHr+xvAacD6qnq8vbc/TnJMkr2SPCvJ0e1W1dA5O7gAOBXYCHx4nO9ZewgDQbucqvoE8G46F4oH6XxCfgfwhdbkb+jMod8OrAO+3WpU1b8AHwK+AtzH+G9T/SCdC7Q/SvJmYEHb11N0zl7Oq6qv9hjz48Ab6FyEfhz4z8Ab2qf9sXg2nQvpPwIeoHO28ca274fp3HL7Xn71z+M/0fn/+510ppj+qk0V/RnwZ0leNc73rT1AnE6UJIFnCJKkxkCQJAEGgiSpMRAkScAu/MftDj744Jo/f/5MD0OSdim33XbbY1XV12vbLhsI8+fPp7+/f6aHIUm7lCTDvzH/S04ZSZIAA0GS1BgIkiTAQJAkNQaCJAkwECRJjYEgSQIMBElSYyBIkoAxfFM5yTzgYuC3gF8Aq6vq75IcCFwOzAceAt5cVU+0PmfSeTrTVuCdVfWlVl9M5+lN+9J5gtRfVFW1R/pdDCym8/CQt1TVQ1P2LiVtY/4ZX5zpIexWHvrI62d6CJM2ljOELcB7qup3gaOA05McDpwB3FBVC4Ab2mvathXAEcBy4Lwke7V9nQ+spPOUqQVtO3TC44mqOgw4BzhrCt6bJGkcRg2EqtpYVd9u65uAu4E5dB7Zt6Y1W8OvHnp+LHBZVW2uqgeB9cDSJLOB/arq5vYov4uH9Rna1+eAZe1ZsJKkaTKuawhJ5gNHArcAh1TVRuiEBvC81mwOnWe6DhlotTltfXj9GX2qagvwJHDQeMYmSZqcMQdCkucCVwLvqqofj9S0R61GqI/UZ/gYVibpT9I/ODg42pAlSeMwpkBIsjedMPhMVX2+lR9p00C0n4+2+gAwr6v7XGBDq8/tUX9GnySzgP2BHw4fR1WtrqolVbWkr6/nn/OWJE3QqIHQ5vIvAO6uqk90bboGOLmtnwxc3VVfkWSfJIfSuXh8a5tW2pTkqLbPk4b1GdrX8cCN7TqDJGmajOUBOa8E3gqsS7K21d4LfAS4IsmpwPeBEwCq6s4kVwB30blD6fSq2tr6ncavbju9ri3QCZxLkqync2awYnJvS5I0XqMGQlV9nd5z/ADLttNnFbCqR70fWNij/jQtUCRJM8NvKkuSAANBktQYCJIkwECQJDUGgiQJMBAkSY2BIEkCDARJUmMgSJIAA0GS1BgIkiTAQJAkNQaCJAkwECRJjYEgSQIMBElSYyBIkoCxPVP5wiSPJrmjq3Z5krVteWjo0ZpJ5if5ade2T3X1WZxkXZL1Sc5tz1WmPXv58la/Jcn8qX+bkqTRjOUM4SJgeXehqt5SVYuqahFwJfD5rs33D22rqrd31c8HVgIL2jK0z1OBJ6rqMOAc4KyJvBFJ0uSMGghVdROdB99vo33KfzNw6Uj7SDIb2K+qbq6qAi4GjmubjwXWtPXPAcuGzh4kSdNnstcQXgU8UlX3ddUOTfKdJF9L8qpWmwMMdLUZaLWhbQ8DVNUW4EngoF4HS7IySX+S/sHBwUkOXZLUbbKBcCLPPDvYCDy/qo4E3g18Nsl+QK9P/NV+jrTtmcWq1VW1pKqW9PX1TWLYkqThZk20Y5JZwL8DFg/VqmozsLmt35bkfuDFdM4I5nZ1nwtsaOsDwDxgoO1zf7YzRSVJ2nEmc4bwGuCeqvrlVFCSviR7tfUX0rl4/EBVbQQ2JTmqXR84Cbi6dbsGOLmtHw/c2K4zSJKm0VhuO70UuBl4SZKBJKe2TSvY9mLyq4Hbk3yXzgXit1fV0Kf904D/CawH7geua/ULgIOSrKczzXTGJN6PJGmCRp0yqqoTt1M/pUftSjq3ofZq3w8s7FF/GjhhtHFIknYsv6ksSQIMBElSYyBIkgADQZLUGAiSJMBAkCQ1BoIkCTAQJEmNgSBJAgwESVJjIEiSAANBktQYCJIkwECQJDUGgiQJMBAkSc1Ynph2YZJHk9zRVftgkh8kWduW13VtOzPJ+iT3Jjmmq744ybq27dz2KE2S7JPk8la/Jcn8KX6PkqQxGMsZwkXA8h71c6pqUVuuBUhyOJ1Hax7R+pw39Ixl4HxgJZ3nLC/o2uepwBNVdRhwDnDWBN+LJGkSRg2EqroJ+OFo7ZpjgcuqanNVPUjn+clLk8wG9quqm6uqgIuB47r6rGnrnwOWDZ09SJKmz2SuIbwjye1tSumAVpsDPNzVZqDV5rT14fVn9KmqLcCTwEG9DphkZZL+JP2Dg4OTGLokabiJBsL5wIuARcBG4OxW7/XJvkaoj9Rn22LV6qpaUlVL+vr6xjVgSdLIJhQIVfVIVW2tql8AnwaWtk0DwLyupnOBDa0+t0f9GX2SzAL2Z+xTVJKkKTKhQGjXBIa8CRi6A+kaYEW7c+hQOhePb62qjcCmJEe16wMnAVd39Tm5rR8P3NiuM0iSptGs0RokuRQ4Gjg4yQDwAeDoJIvoTO08BLwNoKruTHIFcBewBTi9qra2XZ1G546lfYHr2gJwAXBJkvV0zgxWTMH7kiSN06iBUFUn9ihfMEL7VcCqHvV+YGGP+tPACaONQ5K0Y/lNZUkSYCBIkhoDQZIEGAiSpMZAkCQBBoIkqTEQJEmAgSBJagwESRJgIEiSGgNBkgQYCJKkxkCQJAEGgiSpMRAkSYCBIElqDARJEjCGQEhyYZJHk9zRVftYknuS3J7kqiS/2erzk/w0ydq2fKqrz+Ik65KsT3Jue7Yy7fnLl7f6LUnmT/3blCSNZixnCBcBy4fVrgcWVtXvAf8CnNm17f6qWtSWt3fVzwdWAgvaMrTPU4Enquow4BzgrHG/C0nSpI0aCFV1E/DDYbUvV9WW9vKbwNyR9pFkNrBfVd1cVQVcDBzXNh8LrGnrnwOWDZ09SJKmz1RcQ/hz4Lqu14cm+U6SryV5VavNAQa62gy02tC2hwFayDwJHNTrQElWJulP0j84ODgFQ5ckDZlUICR5H7AF+EwrbQSeX1VHAu8GPptkP6DXJ/4a2s0I255ZrFpdVUuqaklfX99khi5JGmbWRDsmORl4A7CsTQNRVZuBzW39tiT3Ay+mc0bQPa00F9jQ1geAecBAklnA/gybopIk7XgTOkNIshz4L8Abq+onXfW+JHu19RfSuXj8QFVtBDYlOapdHzgJuLp1uwY4ua0fD9w4FDCSpOkz6hlCkkuBo4GDkwwAH6BzV9E+wPXt+u832x1FrwY+lGQLsBV4e1UNfdo/jc4dS/vSueYwdN3hAuCSJOvpnBmsmJJ3Jkkal1EDoapO7FG+YDttrwSu3M62fmBhj/rTwAmjjUOStGP5TWVJEmAgSJIaA0GSBBgIkqTGQJAkAQaCJKkxECRJgIEgSWoMBEkSYCBIkhoDQZIEGAiSpMZAkCQBBoIkqTEQJEmAgSBJakYNhCQXJnk0yR1dtQOTXJ/kvvbzgK5tZyZZn+TeJMd01RcnWde2ndsepUmSfZJc3uq3JJk/xe9RkjQGYzlDuAhYPqx2BnBDVS0AbmivSXI4nUdgHtH6nDf0jGXgfGAlnecsL+ja56nAE1V1GHAOcNZE34wkaeJGDYSquonOs467HQusaetrgOO66pdV1eaqehBYDyxNMhvYr6purqoCLh7WZ2hfnwOWDZ09SJKmz0SvIRxSVRsB2s/ntfoc4OGudgOtNqetD68/o09VbQGeBA7qddAkK5P0J+kfHByc4NAlSb1M9UXlXp/sa4T6SH22LVatrqolVbWkr69vgkOUJPUya4L9Hkkyu6o2tumgR1t9AJjX1W4usKHV5/aod/cZSDIL2J9tp6h2WfPP+OJMD2G38tBHXj/TQ5B2WxM9Q7gGOLmtnwxc3VVf0e4cOpTOxeNb27TSpiRHtesDJw3rM7Sv44Eb23UGSdI0GvUMIcmlwNHAwUkGgA8AHwGuSHIq8H3gBICqujPJFcBdwBbg9Kra2nZ1Gp07lvYFrmsLwAXAJUnW0zkzWDEl70ySNC6jBkJVnbidTcu2034VsKpHvR9Y2KP+NC1QJEkzx28qS5IAA0GS1BgIkiTAQJAkNQaCJAkwECRJjYEgSQIMBElSYyBIkgADQZLUGAiSJMBAkCQ1BoIkCTAQJEmNgSBJAgwESVIz4UBI8pIka7uWHyd5V5IPJvlBV/11XX3OTLI+yb1JjumqL06yrm07tz1mU5I0jSYcCFV1b1UtqqpFwGLgJ8BVbfM5Q9uq6lqAJIfTeTzmEcBy4Lwke7X25wMr6TyDeUHbLkmaRlM1ZbQMuL+qvjdCm2OBy6pqc1U9CKwHliaZDexXVTdXVQEXA8dN0bgkSWM0VYGwAri06/U7ktye5MIkB7TaHODhrjYDrTanrQ+vS5Km0aQDIcmvA28E/k8rnQ+8CFgEbATOHmrao3uNUO91rJVJ+pP0Dw4OTmbYkqRhpuIM4bXAt6vqEYCqeqSqtlbVL4BPA0tbuwFgXle/ucCGVp/bo76NqlpdVUuqaklfX98UDF2SNGQqAuFEuqaL2jWBIW8C7mjr1wArkuyT5FA6F49vraqNwKYkR7W7i04Crp6CcUmSxmHWZDoneTbwh8DbusofTbKIzrTPQ0PbqurOJFcAdwFbgNOramvrcxpwEbAvcF1bJEnTaFKBUFU/AQ4aVnvrCO1XAat61PuBhZMZiyRpcvymsiQJMBAkSY2BIEkCDARJUmMgSJIAA0GS1BgIkiTAQJAkNQaCJAkwECRJjYEgSQIMBElSYyBIkgADQZLUGAiSJMBAkCQ1BoIkCZhkICR5KMm6JGuT9LfagUmuT3Jf+3lAV/szk6xPcm+SY7rqi9t+1ic5tz1bWZI0jabiDOEPqmpRVS1pr88AbqiqBcAN7TVJDgdWAEcAy4HzkuzV+pwPrAQWtGX5FIxLkjQOO2LK6FhgTVtfAxzXVb+sqjZX1YPAemBpktnAflV1c1UVcHFXH0nSNJlsIBTw5SS3JVnZaodU1UaA9vN5rT4HeLir70CrzWnrw+vbSLIySX+S/sHBwUkOXZLUbdYk+7+yqjYkeR5wfZJ7Rmjb67pAjVDftli1GlgNsGTJkp5tJEkTM6kzhKra0H4+ClwFLAUeadNAtJ+PtuYDwLyu7nOBDa0+t0ddkjSNJhwISZ6T5DeG1oE/Au4ArgFObs1OBq5u69cAK5Lsk+RQOhePb23TSpuSHNXuLjqpq48kaZpMZsroEOCqdofoLOCzVfWPSb4FXJHkVOD7wAkAVXVnkiuAu4AtwOlVtbXt6zTgImBf4Lq2SJKm0YQDoaoeAF7ao/44sGw7fVYBq3rU+4GFEx2LJGny/KayJAkwECRJjYEgSQIMBElSYyBIkgADQZLUGAiSJMBAkCQ1BoIkCTAQJEmNgSBJAgwESVJjIEiSAANBktQYCJIkwECQJDWTeYTmvCT/lOTuJHcm+YtW/2CSHyRZ25bXdfU5M8n6JPcmOaarvjjJurbt3PYoTUnSNJrMIzS3AO+pqm+3ZyvfluT6tu2cqvp4d+MkhwMrgCOA3wa+kuTF7TGa5wMrgW8C1wLL8TGakjStJnyGUFUbq+rbbX0TcDcwZ4QuxwKXVdXmqnoQWA8sTTIb2K+qbq6qAi4GjpvouCRJEzMl1xCSzAeOBG5ppXckuT3JhUkOaLU5wMNd3QZabU5bH17vdZyVSfqT9A8ODk7F0CVJzaQDIclzgSuBd1XVj+lM/7wIWARsBM4eatqje41Q37ZYtbqqllTVkr6+vskOXZLUZVKBkGRvOmHwmar6PEBVPVJVW6vqF8CngaWt+QAwr6v7XGBDq8/tUZckTaPJ3GUU4ALg7qr6RFd9dlezNwF3tPVrgBVJ9klyKLAAuLWqNgKbkhzV9nkScPVExyVJmpjJ3GX0SuCtwLoka1vtvcCJSRbRmfZ5CHgbQFXdmeQK4C46dyid3u4wAjgNuAjYl87dRd5hJEnTbMKBUFVfp/f8/7Uj9FkFrOpR7wcWTnQskqTJ85vKkiTAQJAkNQaCJAkwECRJjYEgSQIMBElSYyBIkgADQZLUGAiSJMBAkCQ1BoIkCTAQJEmNgSBJAgwESVJjIEiSAANBktQYCJIkYCcKhCTLk9ybZH2SM2Z6PJK0p9kpAiHJXsAngdcCh9N5LvPhMzsqSdqz7BSBACwF1lfVA1X1M+Ay4NgZHpMk7VFmzfQAmjnAw12vB4B/O7xRkpXAyvbyqST3TsPY9hQHA4/N9CBGk7NmegSaAf63ObVesL0NO0sgpEettilUrQZW7/jh7HmS9FfVkpkehzSc/21On51lymgAmNf1ei6wYYbGIkl7pJ0lEL4FLEhyaJJfB1YA18zwmCRpj7JTTBlV1ZYk7wC+BOwFXFhVd87wsPY0TsVpZ+V/m9MkVdtM1UuS9kA7y5SRJGmGGQiSJMBA2C0k2Zpkbdcyfwce66EkB++o/WvPkKSSXNL1elaSwST/MEq/o0dro4nbKS4qa9J+WlWLZnoQ0jj8K7Awyb5V9VPgD4EfzPCY9nieIeymkixO8rUktyX5UpLZrf7VJOckuSnJ3UleluTzSe5L8jdd/b/Q+t7ZviHe6xh/muTWdlby9+1vUkljdR3w+rZ+InDp0IYkS5N8I8l32s+XDO+c5DlJLkzyrdbOP3czSQbC7mHfrumiq5LsDfwP4PiqWgxcCKzqav+zqno18CngauB0YCFwSpKDWps/b32XAO/sqgOQ5HeBtwCvbGcnW4E/2XFvUbuhy4AVSZ4F/B5wS9e2e4BXV9WRwF8D/61H//cBN1bVy4A/AD6W5Dk7eMy7NaeMdg/PmDJKspDOL/jrk0Dnux0bu9oPfelvHXBnVW1s/R6g843xx+mEwJtau3nAglYfsgxYDHyrHWNf4NEpfVfarVXV7e1614nAtcM27w+sSbKAzp+x2bvHLv4IeGOSv2yvnwU8H7h7x4x492cg7J5C5xf9y7ezfXP7+Yuu9aHXs5IcDbwGeHlV/STJV+n8zzb8GGuq6sypGrT2SNcAHweOBrrPQj8M/FNVvamFxld79A3w76vKP3I5RZwy2j3dC/QleTlAkr2THDGO/vsDT7Qw+B3gqB5tbgCOT/K8dowDk2z3ryhK23Eh8KGqWjesvj+/ush8ynb6fgn4j2mnqEmO3CEj3IMYCLuh9kyJ44GzknwXWAu8Yhy7+Ec6Zwq30/mk9s0ex7gLeD/w5dbuemD2JIeuPUxVDVTV3/XY9FHgvyf5v3SmPHv5MJ2ppNuT3NFeaxL80xWSJMAzBElSYyBIkgADQZLUGAiSJMBAkCQ1BoIkCTAQJEnN/wcqlWaXRFP9cQAAAABJRU5ErkJggg==",
      "text/plain": [
       "<Figure size 432x288 with 1 Axes>"
      ]
     },
     "metadata": {
      "needs_background": "light"
     },
     "output_type": "display_data"
    }
   ],
   "source": [
    "%matplotlib inline\n",
    "training_data[\"Sex\"].value_counts().sort_values().plot(kind=\"bar\", title=\"Counts of Sex\", rot=0)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "metadata": {
    "scrolled": true
   },
   "outputs": [
    {
     "data": {
      "text/plain": [
       "<AxesSubplot:title={'center':'Counts of Sex earning >$50K'}>"
      ]
     },
     "execution_count": 6,
     "metadata": {},
     "output_type": "execute_result"
    },
    {
     "data": {
      "image/png": "iVBORw0KGgoAAAANSUhEUgAAAX0AAAEICAYAAACzliQjAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjUuMCwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy8/fFQqAAAACXBIWXMAAAsTAAALEwEAmpwYAAAYxElEQVR4nO3dfZRdVX3G8e9jEkIEAsRMYpwJDmAUklSgGUJQa7FBCaImtkaDLySWmmUWrbalqyupreJLWnxrFQvYVDCDL8Qs30iRqDEYFY2EQV7SJKTM4i3TRDKAYEAbSPz1j7NHjzd37txJZu6Q2c9nrbPuOfvsfc4+d26ee+4+594oIjAzszw8Z6g7YGZmjePQNzPLiEPfzCwjDn0zs4w49M3MMuLQNzPLiEPfDiuSJkr6oaQ9kj451P1pBElrJS0c6n4ASFo51H2wQ+PQH+YkvVVSh6QnJe1KAfKKBuw3JL1oEDa9GHgEGBsRl1bZb4ukr0l6RNITkjZLWjQI/WiYiDg/ItqHuh+9kXSZpGfSa6xnOqm0vlXS9yX9StI9ks4trVsk6ZbS8lhJP05/w1GNPpYcOPSHMUl/C3wK+GdgInACcBUwdwi7daheCGyN3r9V+AVgR6r3POAi4OEG9a3fJI0cwn2PlnRsnXWXSXoQuFBSl6QPVFT5SkQcXZruK627HriD4u/xPuCrkpqq7ON44HvAg8BbIuKZgzku60NEeBqGE3As8CQwv0ad0RRvCjvT9ClgdFq3CLilon4AL0rzK4ErgW8Be4BbgZPTuh+muk+lPrwFGA/cCDwOPAb8CHhOL/16GXAb8ER6fFlpn88AT6ftnlul7ZPA6TWOeRbwk9SPu4BzSvt8BJiclk9LdU7pZTunAOvSsWwH3lxadwFFyP2S4g3ostK61vTcXAw8lJ6rRcAtwCeAXwD3A+eX2mwA/qL8d6lR98S0zT0UAXol8MVejqE59fFLwLk1/h5np+M8Jf0Nmnqet7T+shr7eDGwFzimVPYj4N0VxzM+PWef760fngYoG4a6A54G6Q8Lc4B9wMgadT4E/BSYkP4h/wT4cFq3iL5D/zFgJjAyBceqanXT8r8AnwVGpemPAFXp07gUZu9I270wLT+vtN+P1Dim7wE/BhYAJ1SsawYeBV5L8Sn31Wm5Ka1fDtwMjAHuBv6yl30cRRHm70x9/EOKN4xpaf05wB+kfbyU4pPGvLSuNT0316XtjEnP9TPAu4ARwBKKN2GlNhv4/dCvVXcjxRvCEcArKEK9aiCn+s8HLk3H+2B6TZxUUWce8D+AgJVVtnEZxRv0Y8AWYElp3RuBbRX1/x34TOl4tqZ2n632mvA0sJOHd4av5wGPRMS+GnXeBnwoInZHRDfwQYqwrdfXI2JT2seXgNNr1H0GmAS8MCKeiYgfRfpXX+EC4N6I+EJE7IuI64F7gNfX2af5FGeS/wTcL+lOSWemdW8HboqImyLiNxGxDuigeBOAIryOBTZRBOmVvezjdcADEfH51MefAV8D3gQQERsiYnPax90Uwxt/XLGNyyLiqYj4dVp+MCL+MyL2A+3puZrYy/6r1pV0AnAm8P6IeDoibgHW1HqyIuLnEfHJiHgpRUAfB/xU0gZJp6Vq6yg+OfwMOEPSBZJGlDazGjiV4sThXcD7JV2Y1h1N8YZQ9gRwTGl5MsUngs/38pqwAeTQH74eBcb3MWb8Aoqzux4PprJ6/bw0/yuKf+C9+TjQCXxX0n2SltbZp55+NdfToYj4RUQsjYhpFKF5J/BNSaIY558v6fGeieJseFJq+wzFJ4npwCdrBNALgbMqtvM2irNmJJ2VLlx2S3oCeDfF8EXZjorl3z6XEfGrNNvb89lb3RcAj5XKqu2nlk6KIa9OiqGc49I+nqL4RHcpxdn+R4ENPa+tiNgaETsjYn9E/AT4NOkNkGK4bWzFfsZSvIn0uAv4O2CtpDP60V87CA794Wsj8H8UH817s5MiwHqckMqgGI9/bs8KSc8/lM5ExJ6IuDQiTqI4a/9bSbPr6FNPv/73IPb5CMVQxwsoho12AF+IiONK01ERcTmApGbgAxTjyp+UNLqXTe8AflCxnaMjYkla/2WKM+zJEXEsadiisnv9PZ467ALGSXpuqWxyrQaSRkiaI+l6imsMF1AMxbVExA9+29ki0G+mONtvoxi2Or2XzQa/O94twEmSymf2p6Xy3zWI+DRwObBO0vSaR2mHxKE/TEXEE8D7gSslzZP0XEmjJJ0v6WOp2vXAP0pqkjQ+1f9iWncXME3S6ZKOpBj66I+HgfJte6+T9KJ0xv1LYH+aKt0EvDjdajpS0luAqRQXgfsk6aOSpqe2x1CMeXdGxKPp2F4v6bwUdkdKOifd5imKs/xrKC6y7gI+3Mtubkx9fEd6TkdJOlPSqWn9MRRn3P8naSbw1nr6fqgi4kGK4arLJB0h6WxqDItJmgB0UYT8TymuwfxpRPxXeVhQUpuks0pNT6a4CaA7rZ8r6XgVZgLvAW5Iffofik9bH0jP9xsp3jC+VqX/H6P4lPA9SS856CfCahvqiwqeBneiGHbooDhz/znF3TY9d8McCVxBEXC70vyRpbbvo7hAuYNiPLzyQu5HSnXPAbpKy+9O23wceDPwN8ADqR9dwD/V6PMrgNspxn5vB15RWvd7+63S9jPAvRTDCt0UAX1qaf1ZwA8oLjp2p+fjBOC9FBczj0j1XpDW/1Ev+3lJattNMZR2M+muIYqhjQcphjBupLhw+cW0rjU9jyNL21pE7YvmG6i4e6dG3ZMprmnsAdYDK4BrejmGo4HT6ngNnQF8P70OnqT4RFC+WHt9eg6epLj+8p6K9q3pGH5NcafTuX0c+0fSa+Tkof73Mxynniv+ZjYMSfoKcE9EVN5Xf7DbWxkRiwZiWzY0PLxjNoykYaaTJT1H0hyKL+J9c4i7Zc8iQ/ZtQDMbFM8Hvk5xy24XxTDMHQO1cZ/lH/48vGNmlhEP75iZZeRZP7wzfvz4aG1tHepumJkdVm6//fZHIuKAH7Z71od+a2srHR0dQ90NM7PDSvpV1AN4eMfMLCMOfTOzjDj0zcwy4tA3M8uIQ9/MLCMOfTOzjDj0zcwy4tA3M8uIQ9/MLCPP+m/kmtmhaV36raHuwrDywOUXDHUXDonP9M3MMuLQNzPLiEPfzCwjDn0zs4w49M3MMuLQNzPLiEPfzCwjDn0zs4zUFfqSjpP0VUn3SNom6WxJ4yStk3Rvejy+VH+ZpE5J2yWdVyqfIWlzWneFJA3GQZmZWXX1nul/Gvh2RJwCnAZsA5YC6yNiCrA+LSNpKrAAmAbMAa6SNCJt52pgMTAlTXMG6DjMzKwOfYa+pLHAK4FrACLi6Yh4HJgLtKdq7cC8ND8XWBUReyPifqATmClpEjA2IjZGRADXldqYmVkD1HOmfxLQDXxe0h2SPifpKGBiROwCSI8TUv1mYEepfVcqa07zleVmZtYg9YT+SOAPgasj4gzgKdJQTi+qjdNHjfIDNyAtltQhqaO7u7uOLpqZWT3qCf0uoCsibk3LX6V4E3g4DdmQHneX6k8utW8BdqbylirlB4iIFRHRFhFtTU1N9R6LmZn1oc/Qj4ifAzskvSQVzQa2AmuAhalsIXBDml8DLJA0WtKJFBdsN6UhoD2SZqW7di4qtTEzswao9/f0/wr4kqQjgPuAd1K8YayWdDHwEDAfICK2SFpN8cawD7gkIvan7SwBVgJjgLVpMjOzBqkr9CPiTqCtyqrZvdRfDiyvUt4BTO9H/8zMbAD5G7lmZhlx6JuZZcShb2aWEYe+mVlGHPpmZhlx6JuZZcShb2aWEYe+mVlGHPpmZhlx6JuZZcShb2aWEYe+mVlGHPpmZhlx6JuZZcShb2aWEYe+mVlGHPpmZhlx6JuZZcShb2aWEYe+mVlGHPpmZhlx6JuZZcShb2aWEYe+mVlG6gp9SQ9I2izpTkkdqWycpHWS7k2Px5fqL5PUKWm7pPNK5TPSdjolXSFJA39IZmbWm/6c6b8qIk6PiLa0vBRYHxFTgPVpGUlTgQXANGAOcJWkEanN1cBiYEqa5hz6IZiZWb0OZXhnLtCe5tuBeaXyVRGxNyLuBzqBmZImAWMjYmNEBHBdqY2ZmTVAvaEfwHcl3S5pcSqbGBG7ANLjhFTeDOwote1KZc1pvrL8AJIWS+qQ1NHd3V1nF83MrC8j66z38ojYKWkCsE7SPTXqVhunjxrlBxZGrABWALS1tVWtY2Zm/VfXmX5E7EyPu4FvADOBh9OQDelxd6reBUwuNW8BdqbylirlZmbWIH2GvqSjJB3TMw+8BvhvYA2wMFVbCNyQ5tcACySNlnQixQXbTWkIaI+kWemunYtKbczMrAHqGd6ZCHwj3V05EvhyRHxb0m3AakkXAw8B8wEiYouk1cBWYB9wSUTsT9taAqwExgBr02RmZg3SZ+hHxH3AaVXKHwVm99JmObC8SnkHML3/3TQzs4Hgb+SamWXEoW9mlhGHvplZRhz6ZmYZceibmWXEoW9mlhGHvplZRhz6ZmYZceibmWXEoW9mlhGHvplZRhz6ZmYZceibmWXEoW9mlhGHvplZRhz6ZmYZceibmWXEoW9mlhGHvplZRhz6ZmYZceibmWXEoW9mlhGHvplZRuoOfUkjJN0h6ca0PE7SOkn3psfjS3WXSeqUtF3SeaXyGZI2p3VXSNLAHo6ZmdXSnzP99wLbSstLgfURMQVYn5aRNBVYAEwD5gBXSRqR2lwNLAampGnOIfXezMz6pa7Ql9QCXAB8rlQ8F2hP8+3AvFL5qojYGxH3A53ATEmTgLERsTEiAriu1MbMzBqg3jP9TwF/D/ymVDYxInYBpMcJqbwZ2FGq15XKmtN8ZfkBJC2W1CGpo7u7u84umplZX/oMfUmvA3ZHxO11brPaOH3UKD+wMGJFRLRFRFtTU1OduzUzs76MrKPOy4E3SHotcCQwVtIXgYclTYqIXWnoZneq3wVMLrVvAXam8pYq5WZm1iB9nulHxLKIaImIVooLtDdHxNuBNcDCVG0hcEOaXwMskDRa0okUF2w3pSGgPZJmpbt2Liq1MTOzBqjnTL83lwOrJV0MPATMB4iILZJWA1uBfcAlEbE/tVkCrATGAGvTZGZmDdKv0I+IDcCGNP8oMLuXesuB5VXKO4Dp/e2kmZkNDH8j18wsIw59M7OMOPTNzDLi0Dczy4hD38wsIw59M7OMOPTNzDLi0Dczy4hD38wsIw59M7OMOPTNzDLi0Dczy4hD38wsIw59M7OMOPTNzDLi0Dczy4hD38wsIw59M7OMOPTNzDLi0Dczy4hD38wsIw59M7OMOPTNzDLi0Dczy0ifoS/pSEmbJN0laYukD6bycZLWSbo3PR5farNMUqek7ZLOK5XPkLQ5rbtCkgbnsMzMrJp6zvT3An8SEacBpwNzJM0ClgLrI2IKsD4tI2kqsACYBswBrpI0Im3ramAxMCVNcwbuUMzMrC99hn4UnkyLo9IUwFygPZW3A/PS/FxgVUTsjYj7gU5gpqRJwNiI2BgRAVxXamNmZg1Q15i+pBGS7gR2A+si4lZgYkTsAkiPE1L1ZmBHqXlXKmtO85Xl1fa3WFKHpI7u7u5+HI6ZmdVSV+hHxP6IOB1ooThrn16jerVx+qhRXm1/KyKiLSLampqa6umimZnVoV9370TE48AGirH4h9OQDelxd6rWBUwuNWsBdqbylirlZmbWIPXcvdMk6bg0PwY4F7gHWAMsTNUWAjek+TXAAkmjJZ1IccF2UxoC2iNpVrpr56JSGzMza4CRddSZBLSnO3CeA6yOiBslbQRWS7oYeAiYDxARWyStBrYC+4BLImJ/2tYSYCUwBlibJjMza5A+Qz8i7gbOqFL+KDC7lzbLgeVVyjuAWtcDzMxsEPkbuWZmGXHom5llxKFvZpYRh76ZWUYc+mZmGXHom5llxKFvZpYRh76ZWUYc+mZmGXHom5llxKFvZpYRh76ZWUYc+mZmGXHom5llxKFvZpYRh76ZWUYc+mZmGXHom5llxKFvZpYRh76ZWUYc+mZmGXHom5llxKFvZpaRPkNf0mRJ35e0TdIWSe9N5eMkrZN0b3o8vtRmmaROSdslnVcqnyFpc1p3hSQNzmGZmVk19Zzp7wMujYhTgVnAJZKmAkuB9RExBViflknrFgDTgDnAVZJGpG1dDSwGpqRpzgAei5mZ9aHP0I+IXRHxszS/B9gGNANzgfZUrR2Yl+bnAqsiYm9E3A90AjMlTQLGRsTGiAjgulIbMzNrgH6N6UtqBc4AbgUmRsQuKN4YgAmpWjOwo9SsK5U1p/nK8mr7WSypQ1JHd3d3f7poZmY11B36ko4Gvgb8dUT8slbVKmVRo/zAwogVEdEWEW1NTU31dtHMzPpQV+hLGkUR+F+KiK+n4ofTkA3pcXcq7wIml5q3ADtTeUuVcjMza5B67t4RcA2wLSL+tbRqDbAwzS8EbiiVL5A0WtKJFBdsN6UhoD2SZqVtXlRqY2ZmDTCyjjovB94BbJZ0Zyr7B+ByYLWki4GHgPkAEbFF0mpgK8WdP5dExP7UbgmwEhgDrE2TmZk1SJ+hHxG3UH08HmB2L22WA8urlHcA0/vTQTMzGzj+Rq6ZWUYc+mZmGXHom5llxKFvZpYRh76ZWUYc+mZmGXHom5llxKFvZpYRh76ZWUYc+mZmGXHom5llxKFvZpYRh76ZWUYc+mZmGXHom5llxKFvZpYRh76ZWUYc+mZmGXHom5llxKFvZpYRh76ZWUYc+mZmGXHom5llZGRfFSRdC7wO2B0R01PZOOArQCvwAPDmiPhFWrcMuBjYD7wnIr6TymcAK4ExwE3AeyMiBvZwhk7r0m8NdReGjQcuv2Cou2A2bNVzpr8SmFNRthRYHxFTgPVpGUlTgQXAtNTmKkkjUpurgcXAlDRVbtPMzAZZn6EfET8EHqsongu0p/l2YF6pfFVE7I2I+4FOYKakScDYiNiYzu6vK7UxM7MGOdgx/YkRsQsgPU5I5c3AjlK9rlTWnOYry6uStFhSh6SO7u7ug+yimZlVGugLuapSFjXKq4qIFRHRFhFtTU1NA9Y5M7PcHWzoP5yGbEiPu1N5FzC5VK8F2JnKW6qUm5lZAx1s6K8BFqb5hcANpfIFkkZLOpHigu2mNAS0R9IsSQIuKrUxM7MGqeeWzeuBc4DxkrqADwCXA6slXQw8BMwHiIgtklYDW4F9wCURsT9tagm/u2VzbZrMzKyB+gz9iLiwl1Wze6m/HFhepbwDmN6v3pmZ2YDyN3LNzDLi0Dczy4hD38wsIw59M7OMOPTNzDLi0Dczy4hD38wsIw59M7OMOPTNzDLi0Dczy4hD38wsIw59M7OMOPTNzDLi0Dczy4hD38wsIw59M7OMOPTNzDLi0Dczy4hD38wsIw59M7OMOPTNzDLi0Dczy4hD38wsIw59M7OMNDz0Jc2RtF1Sp6Sljd6/mVnOGhr6kkYAVwLnA1OBCyVNbWQfzMxy1ugz/ZlAZ0TcFxFPA6uAuQ3ug5lZtkY2eH/NwI7SchdwVmUlSYuBxWnxSUnbG9C3HIwHHhnqTvRFHx3qHtgQ8etzYL2wWmGjQ19VyuKAgogVwIrB705eJHVERNtQ98OsGr8+G6PRwztdwOTScguws8F9MDPLVqND/zZgiqQTJR0BLADWNLgPZmbZaujwTkTsk/SXwHeAEcC1EbGlkX3InIfM7NnMr88GUMQBQ+pmZjZM+Ru5ZmYZceibmWXEoX+YkLRf0p2lqXUQ9/WApPGDtX3Lh6SQ9IXS8khJ3ZJu7KPdOX3VsYPT6Pv07eD9OiJOH+pOmPXTU8B0SWMi4tfAq4H/HeI+Zc1n+ocxSTMk/UDS7ZK+I2lSKt8g6d8k/VDSNklnSvq6pHslfaTU/pup7Zb0Lehq+3i7pE3p08V/pN9PMuuPtcAFaf5C4PqeFZJmSvqJpDvS40sqG0s6StK1km5L9fzTLYfAoX/4GFMa2vmGpFHAZ4A3RcQM4Fpgean+0xHxSuCzwA3AJcB0YJGk56U6f57atgHvKZUDIOlU4C3Ay9OnjP3A2wbvEG2YWgUskHQk8FLg1tK6e4BXRsQZwPuBf67S/n3AzRFxJvAq4OOSjhrkPg9bHt45fPze8I6k6RQhvk4SFN972FWq3/Olt83AlojYldrdR/Gt6Ecpgv6Nqd5kYEoq7zEbmAHclvYxBtg9oEdlw15E3J2uQV0I3FSx+ligXdIUip9kGVVlE68B3iDp79LykcAJwLbB6fHw5tA/fIkizM/uZf3e9Pib0nzP8khJ5wDnAmdHxK8kbaD4x1S5j/aIWDZQnbZsrQE+AZwDlD9Rfhj4fkS8Mb0xbKjSVsCfRYR/eHEAeHjn8LUdaJJ0NoCkUZKm9aP9scAvUuCfAsyqUmc98CZJE9I+xkmq+st9Zn24FvhQRGyuKD+W313YXdRL2+8Af6X0cVPSGYPSw0w49A9T6f8jeBPwUUl3AXcCL+vHJr5NccZ/N8XZ1k+r7GMr8I/Ad1O9dcCkQ+y6ZSgiuiLi01VWfQz4F0k/phiirObDFMM+d0v677RsB8k/w2BmlhGf6ZuZZcShb2aWEYe+mVlGHPpmZhlx6JuZZcShb2aWEYe+mVlG/h9PcIaPfLaQ0gAAAABJRU5ErkJggg==",
      "text/plain": [
       "<Figure size 432x288 with 1 Axes>"
      ]
     },
     "metadata": {
      "needs_background": "light"
     },
     "output_type": "display_data"
    }
   ],
   "source": [
    "training_data[\"Sex\"].where(training_data[\"Target\"] == \">50K\").value_counts().sort_values().plot(\n",
    "    kind=\"bar\", title=\"Counts of Sex earning >$50K\", rot=0\n",
    ")"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Encode and Upload the Dataset\n",
    "Here we encode the training and test data. Encoding input data is not necessary for SageMaker Clarify, but is necessary for the model."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 7,
   "metadata": {},
   "outputs": [],
   "source": [
    "from sklearn import preprocessing\n",
    "\n",
    "\n",
    "def number_encode_features(df):\n",
    "    result = df.copy()\n",
    "    encoders = {}\n",
    "    for column in result.columns:\n",
    "        if result.dtypes[column] == np.object:\n",
    "            encoders[column] = preprocessing.LabelEncoder()\n",
    "            result[column] = encoders[column].fit_transform(result[column].fillna(\"None\"))\n",
    "    return result, encoders\n",
    "\n",
    "\n",
    "training_data = pd.concat([training_data[\"Target\"], training_data.drop([\"Target\"], axis=1)], axis=1)\n",
    "training_data, _ = number_encode_features(training_data)\n",
    "training_data.to_csv(\"train_data.csv\", index=False, header=False)\n",
    "\n",
    "testing_data, _ = number_encode_features(testing_data)\n",
    "test_features = testing_data.drop([\"Target\"], axis=1)\n",
    "test_target = testing_data[\"Target\"]\n",
    "test_features.to_csv(\"test_features.csv\", index=False, header=False)"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "A quick note about our encoding: the \"Female\" Sex value has been encoded as 0 and \"Male\" as 1."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 8,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Target</th>\n",
       "      <th>Age</th>\n",
       "      <th>Workclass</th>\n",
       "      <th>fnlwgt</th>\n",
       "      <th>Education</th>\n",
       "      <th>Education-Num</th>\n",
       "      <th>Marital Status</th>\n",
       "      <th>Occupation</th>\n",
       "      <th>Relationship</th>\n",
       "      <th>Ethnic group</th>\n",
       "      <th>Sex</th>\n",
       "      <th>Capital Gain</th>\n",
       "      <th>Capital Loss</th>\n",
       "      <th>Hours per week</th>\n",
       "      <th>Country</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>0</td>\n",
       "      <td>39</td>\n",
       "      <td>5</td>\n",
       "      <td>77516</td>\n",
       "      <td>9</td>\n",
       "      <td>13</td>\n",
       "      <td>4</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "      <td>4</td>\n",
       "      <td>1</td>\n",
       "      <td>2174</td>\n",
       "      <td>0</td>\n",
       "      <td>40</td>\n",
       "      <td>38</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>0</td>\n",
       "      <td>50</td>\n",
       "      <td>4</td>\n",
       "      <td>83311</td>\n",
       "      <td>9</td>\n",
       "      <td>13</td>\n",
       "      <td>2</td>\n",
       "      <td>3</td>\n",
       "      <td>0</td>\n",
       "      <td>4</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>13</td>\n",
       "      <td>38</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>0</td>\n",
       "      <td>38</td>\n",
       "      <td>2</td>\n",
       "      <td>215646</td>\n",
       "      <td>11</td>\n",
       "      <td>9</td>\n",
       "      <td>0</td>\n",
       "      <td>5</td>\n",
       "      <td>1</td>\n",
       "      <td>4</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>40</td>\n",
       "      <td>38</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>0</td>\n",
       "      <td>53</td>\n",
       "      <td>2</td>\n",
       "      <td>234721</td>\n",
       "      <td>1</td>\n",
       "      <td>7</td>\n",
       "      <td>2</td>\n",
       "      <td>5</td>\n",
       "      <td>0</td>\n",
       "      <td>2</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>40</td>\n",
       "      <td>38</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>0</td>\n",
       "      <td>28</td>\n",
       "      <td>2</td>\n",
       "      <td>338409</td>\n",
       "      <td>9</td>\n",
       "      <td>13</td>\n",
       "      <td>2</td>\n",
       "      <td>9</td>\n",
       "      <td>5</td>\n",
       "      <td>2</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>40</td>\n",
       "      <td>4</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "   Target  Age  Workclass  fnlwgt  Education  Education-Num  Marital Status  \\\n",
       "0       0   39          5   77516          9             13               4   \n",
       "1       0   50          4   83311          9             13               2   \n",
       "2       0   38          2  215646         11              9               0   \n",
       "3       0   53          2  234721          1              7               2   \n",
       "4       0   28          2  338409          9             13               2   \n",
       "\n",
       "   Occupation  Relationship  Ethnic group  Sex  Capital Gain  Capital Loss  \\\n",
       "0           0             1             4    1          2174             0   \n",
       "1           3             0             4    1             0             0   \n",
       "2           5             1             4    1             0             0   \n",
       "3           5             0             2    1             0             0   \n",
       "4           9             5             2    0             0             0   \n",
       "\n",
       "   Hours per week  Country  \n",
       "0              40       38  \n",
       "1              13       38  \n",
       "2              40       38  \n",
       "3              40       38  \n",
       "4              40        4  "
      ]
     },
     "execution_count": 8,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "training_data.head()"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Lastly, let's upload the data to S3."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 9,
   "metadata": {},
   "outputs": [],
   "source": [
    "from sagemaker.s3 import S3Uploader\n",
    "from sagemaker.inputs import TrainingInput\n",
    "\n",
    "train_uri = S3Uploader.upload(\"train_data.csv\", \"s3://{}/{}\".format(bucket, prefix))\n",
    "train_input = TrainingInput(train_uri, content_type=\"csv\")\n",
    "test_uri = S3Uploader.upload(\"test_features.csv\", \"s3://{}/{}\".format(bucket, prefix))"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Train XGBoost Model\n",
    "#### Train Model\n",
    "Since our focus is on understanding how to use SageMaker Clarify, we keep it simple by using a standard XGBoost model.\n",
    "\n",
    "It takes about 5 minutes for the model to be trained."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 10,
   "metadata": {},
   "outputs": [
    {
     "name": "stderr",
     "output_type": "stream",
     "text": [
      "INFO:sagemaker:Creating training-job with name: sagemaker-xgboost-2023-02-07-05-54-36-442\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "\n",
      "2023-02-07 05:54:36 Starting - Starting the training job..\n",
      "2023-02-07 05:54:50 Starting - Preparing the instances for training........\n",
      "2023-02-07 05:55:32 Downloading - Downloading input data....\n",
      "2023-02-07 05:55:57 Training - Downloading the training image...\n",
      "2023-02-07 05:56:18 Training - Training image download completed. Training in progress.......\n",
      "2023-02-07 05:56:53 Uploading - Uploading generated training model.\n",
      "2023-02-07 05:57:04 Completed - Training job completed\n"
     ]
    }
   ],
   "source": [
    "from sagemaker.image_uris import retrieve\n",
    "from sagemaker.estimator import Estimator\n",
    "\n",
    "# This references the AWS managed XGBoost container\n",
    "xgboost_image_uri = retrieve(\"xgboost\", region, version=\"1.5-1\")\n",
    "\n",
    "xgb = Estimator(\n",
    "    xgboost_image_uri,\n",
    "    role,\n",
    "    instance_count=1,\n",
    "    instance_type=\"ml.m5.xlarge\",\n",
    "    disable_profiler=True,\n",
    "    sagemaker_session=sagemaker_session,\n",
    ")\n",
    "\n",
    "xgb.set_hyperparameters(\n",
    "    max_depth=5,\n",
    "    eta=0.2,\n",
    "    gamma=4,\n",
    "    min_child_weight=6,\n",
    "    subsample=0.8,\n",
    "    objective=\"binary:logistic\",\n",
    "    num_round=800,\n",
    ")\n",
    "\n",
    "xgb.fit({\"train\": train_input}, logs=False)"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "#### Create Model\n",
    "Here we create the SageMaker model."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 11,
   "metadata": {},
   "outputs": [
    {
     "name": "stderr",
     "output_type": "stream",
     "text": [
      "INFO:sagemaker:Creating model with name: DEMO-clarify-model-07-02-2023-05-57-08\n"
     ]
    },
    {
     "data": {
      "text/plain": [
       "'DEMO-clarify-model-07-02-2023-05-57-08'"
      ]
     },
     "execution_count": 11,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "model_name = \"DEMO-clarify-model-{}\".format(datetime.now().strftime(\"%d-%m-%Y-%H-%M-%S\"))\n",
    "model = xgb.create_model(name=model_name)\n",
    "container_def = model.prepare_container_def()\n",
    "sagemaker_session.create_model(model_name, role, container_def)"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## Amazon SageMaker Clarify\n",
    "With your model set up, it's time to explore SageMaker Clarify. For a general overview of how SageMaker Clarify processing jobs work, refer [the provided link](https://docs.aws.amazon.com/sagemaker/latest/dg/clarify-processing-job-configure-how-it-works.html). "
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 12,
   "metadata": {},
   "outputs": [
    {
     "name": "stderr",
     "output_type": "stream",
     "text": [
      "INFO:sagemaker.image_uris:Defaulting to the only supported framework/algorithm version: 1.0.\n",
      "INFO:sagemaker.image_uris:Ignoring unnecessary instance type: None.\n"
     ]
    }
   ],
   "source": [
    "from sagemaker import clarify\n",
    "\n",
    "# Initialize a SageMakerClarifyProcessor to compute bias metrics and model explanations.\n",
    "clarify_processor = clarify.SageMakerClarifyProcessor(\n",
    "    role=role, instance_count=1, instance_type=\"ml.m5.xlarge\", sagemaker_session=sagemaker_session\n",
    ")"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Detecting Bias\n",
    "SageMaker Clarify helps you detect possible [pre-training](https://docs.aws.amazon.com/sagemaker/latest/dg/clarify-detect-data-bias.html) and [post-training](https://docs.aws.amazon.com/sagemaker/latest/dg/clarify-detect-post-training-bias.html) biases using a variety of metrics.\n",
    "\n",
    "#### Writing DataConfig\n",
    "A [DataConfig](https://sagemaker.readthedocs.io/en/stable/api/training/processing.html#sagemaker.clarify.DataConfig) object communicates some basic information about data I/O to SageMaker Clarify. For our example here we provide the below information:\n",
    "\n",
    "* `s3_data_input_path`: S3 URI of the train dataset we uploaded above\n",
    "* `s3_output_path`: S3 URI at which our output report will be uploaded\n",
    "* `label`: Specifies the ground truth label, which is also known as observed label or target attribute. It is used for many bias metrics. In this example, the `Target` column has the ground truth label.\n",
    "* `headers`: The list of column names in the dataset\n",
    "* `dataset_type`: specifies the format of your dataset, for this example as we are using CSV dataset this will be `text/csv`"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 13,
   "metadata": {},
   "outputs": [],
   "source": [
    "bias_report_output_path = \"s3://{}/{}/clarify-bias\".format(bucket, prefix)\n",
    "bias_data_config = clarify.DataConfig(\n",
    "    s3_data_input_path=train_uri,\n",
    "    s3_output_path=bias_report_output_path,\n",
    "    label=\"Target\",\n",
    "    headers=training_data.columns.to_list(),\n",
    "    dataset_type=\"text/csv\",\n",
    ")"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "#### Writing ModelConfig\n",
    "\n",
    "A [ModelConfig](https://sagemaker.readthedocs.io/en/stable/api/training/processing.html#sagemaker.clarify.ModelConfig) object communicates information about your trained model. To avoid additional traffic to the production models, SageMaker Clarify sets up and tears down a dedicated endpoint when processing. For our example here we provide the below information:\n",
    "\n",
    "* `model_name`: name of the concerned model, using name of the xgboost model trained earlier\n",
    "* `instance_type` and `initial_instance_count` specify your preferred instance type and instance count used to run your model on during SageMaker Clarify's processing. The example dataset is small, so a single standard instance is good enough to run this example.\n",
    "* `accept_type` denotes the endpoint response payload format, and `content_type` denotes the payload format of request to the endpoint. As per the example model we created above both of these will be `text/csv`."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 14,
   "metadata": {},
   "outputs": [],
   "source": [
    "model_config = clarify.ModelConfig(\n",
    "    model_name=model_name,\n",
    "    instance_type=\"ml.m5.xlarge\",\n",
    "    instance_count=1,\n",
    "    accept_type=\"text/csv\",\n",
    "    content_type=\"text/csv\",\n",
    ")"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "#### Writing ModelPredictedLabelConfig\n",
    "\n",
    "A [ModelPredictedLabelConfig](https://sagemaker.readthedocs.io/en/stable/api/training/processing.html#sagemaker.clarify.ModelPredictedLabelConfig) provides information on the format of your predictions. XGBoost model outputs probabilities of samples, so SageMaker Clarify invokes the endpoint then uses `probability_threshold` to convert the probability to binary labels for bias analysis. Prediction above the threshold is interpreted as label value `1` and below or equal as label value `0`."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 15,
   "metadata": {},
   "outputs": [],
   "source": [
    "predictions_config = clarify.ModelPredictedLabelConfig(probability_threshold=0.8)"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "#### Writing BiasConfig\n",
    "[BiasConfig](https://sagemaker.readthedocs.io/en/stable/api/training/processing.html#sagemaker.clarify.BiasConfig) contains configuration values for detecting bias using a Clarify container."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 16,
   "metadata": {},
   "outputs": [],
   "source": [
    "bias_config = clarify.BiasConfig(\n",
    "    label_values_or_threshold=[1], facet_name=\"Sex\", facet_values_or_threshold=[0], group_name=\"Age\"\n",
    ")"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "For our demo we provide the following information in BiasConfig API:\n",
    "\n",
    "* `label_values_or_threshold`: List of label value(s) or threshold to indicate positive outcome used for bias metrics. Here positive outcome is earning >$50,000.\n",
    "* `facet_name`: Sensitive columns of the dataset, \"Sex\" is the category\n",
    "* `facet_values_or_threshold`: values of the sensitive group, \"Female\" respondents are the sensitive group.\n",
    "* `group_name`: This example has selected the \"Age\" column which is used to form subgroups for the measurement of bias metric [Conditional Demographic Disparity (CDD)](https://docs.aws.amazon.com/sagemaker/latest/dg/clarify-data-bias-metric-cddl.html) or [Conditional Demographic Disparity in Predicted Labels (CDDPL)](https://docs.aws.amazon.com/sagemaker/latest/dg/clarify-post-training-bias-metric-cddpl.html).\n",
    "\n",
    "SageMaker Clarify can handle both categorical and continuous data for `facet: values_or_threshold` and for `label_values_or_threshold`. In this case we are using categorical data. The results will show if the model has a preference for records of one sex over the other."
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "#### Pre-training Bias\n",
    "Bias can be present in your data before any model training occurs. Inspecting your data for bias before training begins can help detect any data collection gaps, inform your feature engineering, and help you understand what societal biases the data may reflect.\n",
    "\n",
    "Computing pre-training bias metrics does not require a trained model.\n",
    "\n",
    "#### Post-training Bias\n",
    "Computing post-training bias metrics does require a trained model.\n",
    "\n",
    "Unbiased training data (as determined by concepts of fairness measured by bias metric) may still result in biased model predictions after training. Whether this occurs depends on several factors including hyperparameter choices.\n",
    "\n",
    "\n",
    "You can run these options separately with [run_pre_training_bias()](https://sagemaker.readthedocs.io/en/stable/api/training/processing.html#sagemaker.clarify.SageMakerClarifyProcessor.run_pre_training_bias) and [run_post_training_bias()](https://sagemaker.readthedocs.io/en/stable/api/training/processing.html#sagemaker.clarify.SageMakerClarifyProcessor.run_post_training_bias) or at the same time with `run_bias()` as shown below. We use following additional parameters for the api call:\n",
    "\n",
    "* `pre_training_methods`: Pre-training bias metrics to be computed. The detailed description of the metrics can be found on [Measure Pre-training Bias](https://docs.aws.amazon.com/sagemaker/latest/dg/clarify-measure-data-bias.html). This example sets methods to \"all\" to compute all the pre-training bias metrics.\n",
    "* `post_training_methods`: Post-training bias metrics to be computed. The detailed description of the metrics can be found on [Measure Post-training Bias](https://docs.aws.amazon.com/sagemaker/latest/dg/clarify-detect-post-training-bias.html). This example sets methods to \"all\" to compute all the post-training bias metrics."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "# The job takes about 10 minutes to run\n",
    "clarify_processor.run_bias(\n",
    "    data_config=bias_data_config,\n",
    "    bias_config=bias_config,\n",
    "    model_config=model_config,\n",
    "    model_predicted_label_config=predictions_config,\n",
    "    pre_training_methods=\"all\",\n",
    "    post_training_methods=\"all\",\n",
    ")"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "#### Viewing the Bias Report\n",
    "In Studio, you can view the results under the experiments tab.\n",
    "\n",
    "<img src=\"./recordings/bias_report.gif\">\n",
    "\n",
    "Each bias metric has detailed explanations with examples that you can explore.\n",
    "\n",
    "<img src=\"./recordings/bias_detail.gif\">\n",
    "\n",
    "You could also summarize the results in a handy table!\n",
    "\n",
    "<img src=\"./recordings/bias_report_chart.gif\">\n"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "If you're not a Studio user yet, you can access the bias report in PDF, HTML and ipynb formats in the following S3 bucket:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 18,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "'s3://sagemaker-ap-south-1-000000000000/sagemaker/DEMO-sagemaker-clarify/clarify-bias'"
      ]
     },
     "execution_count": 18,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "bias_report_output_path"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Explaining Predictions\n",
    "There are expanding business needs and legislative regulations that require explanations of _why_ a model made the decision it did. SageMaker Clarify uses Kernel SHAP to explain the contribution that each input feature makes to the final decision.\n",
    "\n",
    "For run_explainability API call we need similar `DataConfig` and `ModelConfig` objects we defined above. [SHAPConfig](https://sagemaker.readthedocs.io/en/stable/api/training/processing.html#sagemaker.clarify.SHAPConfig) here is the config class for Kernel SHAP algorithm.\n",
    "\n",
    "For our demo we pass the following information in `SHAPConfig`:\n",
    "\n",
    "* `baseline`: Kernel SHAP algorithm requires a baseline (also known as background dataset). If not provided, a baseline is calculated automatically by SageMaker Clarify using K-means or K-prototypes in the input dataset. Baseline dataset type shall be the same as dataset_type, and baseline samples shall only include features. By definition, baseline should either be a S3 URI to the baseline dataset file, or an in-place list of samples. In this case we chose the latter, and put the mean of the train dataset to the list. For more details on baseline selection please [refer this documentation](https://docs.aws.amazon.com/en_us/sagemaker/latest/dg/clarify-feature-attribute-shap-baselines.html).\n",
    "* `num_samples`: Number of samples to be used in the Kernel SHAP algorithm. This number determines the size of the generated synthetic dataset to compute the SHAP values. \n",
    "* `agg_method`: Aggregation method for global SHAP values. For our example here we are using `mean_abs` i.e. mean of absolute SHAP values for all instances\n",
    "* `save_local_shap_values`: Indicates whether to save the local SHAP values in the output location. Default is True."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 19,
   "metadata": {},
   "outputs": [],
   "source": [
    "explainability_output_path = \"s3://{}/{}/clarify-explainability\".format(bucket, prefix)\n",
    "explainability_data_config = clarify.DataConfig(\n",
    "    s3_data_input_path=train_uri,\n",
    "    s3_output_path=explainability_output_path,\n",
    "    label=\"Target\",\n",
    "    headers=training_data.columns.to_list(),\n",
    "    dataset_type=\"text/csv\",\n",
    ")\n",
    "\n",
    "baseline = [training_data.mean().iloc[1:].values.tolist()]\n",
    "shap_config = clarify.SHAPConfig(\n",
    "    baseline=baseline,\n",
    "    num_samples=15,\n",
    "    agg_method=\"mean_abs\",\n",
    "    save_local_shap_values=True,\n",
    ")"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "# The job takes about 10 minutes to run\n",
    "clarify_processor.run_explainability(\n",
    "    data_config=explainability_data_config,\n",
    "    model_config=model_config,\n",
    "    explainability_config=shap_config,\n",
    ")"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "#### Viewing the Explainability Report\n",
    "As with the bias report, you can view the explainability report in Studio under the experiments tab.\n",
    "\n",
    "\n",
    "<img src=\"./recordings/explainability_detail.gif\">\n",
    "\n",
    "The Model Insights tab contains direct links to the report and model insights.\n",
    "\n",
    "If you're not a Studio user yet, as with the Bias Report, you can access this report at the following S3 bucket."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 21,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "'s3://sagemaker-ap-south-1-000000000000/sagemaker/DEMO-sagemaker-clarify/clarify-explainability'"
      ]
     },
     "execution_count": 21,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "explainability_output_path"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "#### Analysis of local explanations\n",
    "It is possible to visualize the local explanations for single examples in your dataset. You can use the obtained results from running Kernel SHAP algorithm for global explanations.\n",
    "\n",
    "You can simply load the local explanations stored in your output path, and visualize the explanation (i.e., the impact that the single features have on the prediction of your model) for any single example."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 22,
   "metadata": {},
   "outputs": [
    {
     "name": "stderr",
     "output_type": "stream",
     "text": [
      "INFO:botocore.credentials:Found credentials from IAM Role: BaseNotebookInstanceEc2InstanceRole\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "Example number: 111 \n",
      "with model prediction: False\n",
      "\n",
      "Feature values -- Label Target                 0\n",
      "Age                   21\n",
      "Workclass              2\n",
      "fnlwgt            199915\n",
      "Education             15\n",
      "Education-Num         10\n",
      "Marital Status         4\n",
      "Occupation             7\n",
      "Relationship           3\n",
      "Ethnic group           4\n",
      "Sex                    0\n",
      "Capital Gain           0\n",
      "Capital Loss           0\n",
      "Hours per week        40\n",
      "Country               38\n",
      "Name: 120, dtype: int64\n"
     ]
    },
    {
     "data": {
      "text/plain": [
       "<AxesSubplot:title={'center':'Local explanation for the example number 111'}>"
      ]
     },
     "execution_count": 22,
     "metadata": {},
     "output_type": "execute_result"
    },
    {
     "data": {
      "image/png": "iVBORw0KGgoAAAANSUhEUgAAAYkAAAFMCAYAAAA++EC6AAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjUuMCwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy8/fFQqAAAACXBIWXMAAAsTAAALEwEAmpwYAAA4hElEQVR4nO3dedxmc/3H8dd7ZjCWxjrJPmKk4RdprEnJki20CCFRoVVpIy1+UiT9JL8iIksi8hMV2feIGbuQScpYh7KUnc/vj+/3Mue+XOfezve6F/N+Ph73477Oua7zOee+7us6n3O+qyICMzOzTsYM9wGYmdnI5SRhZma1nCTMzKyWk4SZmdVykjAzs1pOEmZmVstJYhSQ9C5JM4d4n5MkhaRxQ7nfvO+dJF3QpdiflPSwpH9LWrQL8YftfRsOo+XvlXSApF8M93GMRk4SgyTpXkkbD/dxjHadTjIRcUpEbNqFfc0F/A+waUQsEBGPFYjpz4EhaUNJl0p6QtK9HZ7/tqRbJb0o6YC255aQdI6kB/J3YdIQHXa/OEnYnGRxYDxw+0A3VOLvi1Fz1/Qf4HjgyzWbzQC+Avy+w3MvA38APlDkAAvzh74wSfNI+mG+KnggP56n8vw2km6S9KSkv0raLK/fTdIdkp6SdI+kPQewz5UlXSjpn5LukvShvH6FvG6NvLykpEclvSsvXybpYEnX5SugsyUtUrOP2uNrFYdJ+qKkRyQ9KGm3yvNbSrox/833tV1JXZF/P56LgNaV9FFJV1W2X0/S9fkYr5e0XuW5y/JV2tX52C6QtFiH418JuKuyr0v6Gfs7kq4Gngbe2BbzZGBZ4Lf52L9SeXonSf/I7/f+lW3GSNo3/+8fk3R63XueX79V/rw8LumPkt6S12+f/w8T8vLmkh6SNDEvH5Hf6yclTZf0jkrMAySdIekX+T27VdJKkvbL/7/7JG1aef1APicLSjoufwbul3SQpLE1rz0g//0n5eO4XdLUyvMhacXK8gmSDsqPW5+5r1Q+c9tK2kLSX/Ln/mttuxwv6Vd5XzdIWq0Se0lJZ0qaJelvkj7Xdpy/zu/Xk8BH2/+WiLguIk4G7un0t0bEiRFxHvBUh+cejoifANd32nbYRYR/BvED3Ats3GH9gcC1wOuBicAfgW/n59YCngA2ISXopYCV83NbAisAAt5JOimtkZ97FzCz5jjmB+4DdgPGAWsAjwKr5Oc/AdwBzAecDxxW2fYy4H5g1RznTOAX+blJQADj+nl8L+a/fS5gi/z8wpXn/yv/zW8BHga27bSfvO6jwFX58SLAv4Bd8t+3Y15etPI3/BVYCZg3Lx9S8161/039if0PYJX8/Fx9fQ4q+zg2H89qwHPAm/Pznyd9PpYG5gF+Cpxac7xrAI8AawNjgV3z/ubJz58CnAAsCjwAbFXZdue8fhzwReAhYHx+7gDgWeA9+fmTgL8B++f/3yeAvw3yc/Kb/DfNT/oOXAfsWfP3tY5ji/z3HQxcW3k+gBUryycAB7V95r5ZOeZZwC+B1+X/2bPAGyv7egH4YH79l/LfPBfpczk9x5qbdDFwD/Cetm23za+dt5fzwsbAvb08/wvggJrnxuW/edJwn996HNdwH8Bo/aE+SfwV2KKy/J7WhyZ/eQ7vZ/zfAHvnx++iPklsD1zZtu6nwLcqy+cAtwK3kE8wef1lVE6owBTg+fyF7fHl78fxPUPPE/0jwDo12/6w9T502g89k8QuwHVt218DfLTyN3y98tyngD/U7LfHvvoZ+8CBfA4q+1i6su46YIf8+A5go8pzS5BOQK96n4GjyBcYlXV3Ae/MjxciJbFbgZ/2cZz/AlbLjw8ALqw8917g38DYvPy6/DcsNJDPCak47zkqJ1FS4r205pgOAC5qi/tMZbmvJPFMh2Neu/L66cy+GDmAngloDPAg8A5SEv5H27HtB/y8su0V/fzevuaSxIhukTBKLQn8vbL897wOYBng3E4bSdoc+BbpingM6cr/1n7sbzlgbUmPV9aNA06uLB9LShR7RMRzbdvf13ascwGdimv6Or7HIuLFyvLTwAJ527WBQ0hXonOTrqDP6MffBq9+P1vHuVRl+aFO+y0U+z4Gp+6YlgPOkvRy5fmXSCfY+9tiLAfsKumzlXVz5+MmIh6XdAawD23l2ZK+CHw8vzaACfT8vz5cefwM8GhEvFRZJh/z4/lxfz4ny+X1D0pqrRtD7+9h+/s0XtK4ts9Sncc6HHP731X9LLxyHBHxslKLwdb7s2Tbd2gscGWnbec0rpMo7wHSl6Vl2bwO0gdthfYNlOoszgQOAxaPiIVIyUTtr+3gPuDyiFio8rNARHwyx16AdOV+HHBAh7LkZdqO9QVScVWp44NUBHAOsExELAgcXdk2+ti2/f1sHWf7CXUw+hO7r+Pr6/l29wGbt/2/xkdEp7/nPuA7ba+dLyJOBZC0OrA7cCrwo9ZGuf7hq8CHSEV+C5GKOfv7/+qkz89JPt7ngMUqxzshIlYZ5D6fJl2MtLxhkHFaXvkblBohLE36DNxHKl6rvs+vi4gtKtsO9P/8muEk0cxcksZXfsaRvrBflzQxV6B+k3SLCelEvZukjXIF5lKSVmb21fUs4MV81d7fJqC/A1aStIukufLPmpLenJ8/ApgeER8ntaw4um37nSVNkTQfqU7h15Wrs5YmxwepKOCfEfGspLWAD1eem0Vq3fHGjlumZLSSpA9LGidpe1KxxO8GsP86JWI/TP2xd3I08B1JywHkz8k2Na89FthL0tpK5ldqBPA6SeNJn6uvkeqjlpL0qbzd60jl9bOAcZK+SbqTaKLPz0lEPAhcAPxA0oT8GV9B0jsHuc+bgA9LGqvUwGOwcVreJun9+Xv6eVJCu5ZUHPikpK9Kmjfvb1VJa/Y3cP5bx5PupJTPB3NXnp8rPz+G9D8ZX63Qz8+1GrjMk5dHBCeJZs4l3dK2fg4ADgKmkcr/bwVuyOuIiOtIX+jDSVd2lwPLRcRTwOeA00llxx8mXXn3KW+7KbAD6aroIeB7pA/aNsBmwF755fsAa0jaqRLiZFJZ70Ok5qGfo02T48s+BRwo6SlS0jy9Evtp4DvA1UoteNZp2/djwFakytfHSM0It4qI9qvYASsU+2DSRcHjkr7Uj9cfQXrvLsjvx7WkMvFOxzeNVCH7v6T3fQazW9YcTKqnOioXIe4MHCRpMqmBwnnAX0hFQ8/SvLikz89J9hHSRcWf8zH/mlTvMhh7k+pLHgd2ItWDNXE2qQ6v1Vjh/RHxQk527wVWJ1VmPwr8DFhwALE3IJ0DziXdaT1DSpgtx+Z1O5IaCDyTj6HlGVK9EMCdzC4+G3bKFSY2B5J0GamVys+G+1hs5PLnZM7mOwkzM6vlJGFmZrVc3GRmZrV8J2FmZrVeU53pFltssZg0adJwH4aZ2agyffr0RyNiYqfnXlNJYtKkSUybNm24D8PMbFSR1D7ywCtc3GRmZrWcJMzMrJaThJmZ1XKSMDOzWk4SZmZWy0nCzMxqOUmYmVktJwkzM6v1mupMZ2ZDb9K+v+/3a+89ZMuuxR5MfOub7yTMzKyWk4SZmdVykjAzs1pOEmZmVstJwszMahVJEpI2k3SXpBmS9u3wvCT9KD9/i6Q1+tpW0vcl3Zlff5akhUocq5mZ9V/jJCFpLPBjYHNgCrCjpCltL9scmJx/9gCO6se2FwKrRsRbgL8A+zU9VjMzG5gSdxJrATMi4p6IeB44Ddim7TXbACdFci2wkKQlets2Ii6IiBfz9tcCSxc4VjMzG4ASSWIp4L7K8sy8rj+v6c+2ALsD53XauaQ9JE2TNG3WrFkDPHQzM+tNiSShDuuin6/pc1tJ+wMvAqd02nlEHBMRUyNi6sSJHadoNTOzQSoxLMdMYJnK8tLAA/18zdy9bStpV2ArYKOIaE88ZmbWZSXuJK4HJktaXtLcwA7AOW2vOQf4SG7ltA7wREQ82Nu2kjYDvgpsHRFPFzhOMzMboMZ3EhHxoqTPAOcDY4HjI+J2SXvl548GzgW2AGYATwO79bZtDv2/wDzAhZIAro2IvZoer5mZ9V+RUWAj4lxSIqiuO7ryOIBP93fbvH7FEsdmZmaD5x7XZmZWy0nCzMxqOUmYmVktJwkzM6vlJGFmZrWcJMzMrJaThJmZ1XKSMDOzWk4SZmZWy0nCzMxqOUmYmVktJwkzM6vlJGFmZrWcJMzMrJaThJmZ1XKSMDOzWk4SZmZWy0nCzMxqOUmYmVktJwkzM6s1brgPwMzMBmfSvr8f0OvvPWTLAe/DdxJmZlbLScLMzGo5SZiZWS0nCTMzq+UkYWZmtZwkzMyslpOEmZnVcpIwM7NaRZKEpM0k3SVphqR9OzwvST/Kz98iaY2+tpW0naTbJb0saWqJ4zQzs4FpnCQkjQV+DGwOTAF2lDSl7WWbA5Pzzx7AUf3Y9jbg/cAVTY/RzMwGp8SdxFrAjIi4JyKeB04Dtml7zTbASZFcCywkaYneto2IOyLirgLHZ2Zmg1QiSSwF3FdZnpnX9ec1/dm2V5L2kDRN0rRZs2YNZFMzM+tDiSShDuuin6/pz7a9iohjImJqREydOHHiQDY1M7M+lBgFdiawTGV5aeCBfr5m7n5sa2Zmw6TEncT1wGRJy0uaG9gBOKftNecAH8mtnNYBnoiIB/u5rZmZDZPGdxIR8aKkzwDnA2OB4yPidkl75eePBs4FtgBmAE8Du/W2LYCk9wFHAhOB30u6KSLe0/R4zcys/4pMOhQR55ISQXXd0ZXHAXy6v9vm9WcBZ5U4PjMzGxz3uDYzs1qevtTMrEuGYnrRbvOdhJmZ1XKSMDOzWk4SZmZWy0nCzMxqOUmYmVktJwkzM6vlJGFmZrWcJMzMrJaThJmZ1XKSMDOzWk4SZmZWy0nCzMxqOUmYmVktJwkzM6vlJGFmZrWcJMzMrJYnHbLXxMQoZtYdvpMwM7NaThJmZlbLScLMzGo5SZiZWS0nCTMzq+UkYWZmtZwkzMyslpOEmZnVcpIwM7NaRZKEpM0k3SVphqR9OzwvST/Kz98iaY2+tpW0iKQLJd2dfy9c4ljNzKz/GicJSWOBHwObA1OAHSVNaXvZ5sDk/LMHcFQ/tt0XuDgiJgMX52UzMxtCJe4k1gJmRMQ9EfE8cBqwTdtrtgFOiuRaYCFJS/Sx7TbAifnxicC2BY7VzMwGoMQAf0sB91WWZwJr9+M1S/Wx7eIR8SBARDwo6fWddi5pD9LdCcsuu2zHAxztA9h1+/i7/fd2+/gdf3jjd/PzM9o/m90+/qE4V5VIEuqwLvr5mv5s26uIOAY4BmDq1KkD2tbM5mwj7YJwJCpR3DQTWKayvDTwQD9f09u2D+ciKfLvRwocq5mZDUCJJHE9MFnS8pLmBnYAzml7zTnAR3Irp3WAJ3JRUm/bngPsmh/vCpxd4FjNzGwAGhc3RcSLkj4DnA+MBY6PiNsl7ZWfPxo4F9gCmAE8DezW27Y59CHA6ZI+BvwD2K7psZqZ2cAUmZkuIs4lJYLquqMrjwP4dH+3zesfAzYqcXxmZjY47nFtZma1nCTMzKyWk4SZmdVykjAzs1pOEmZmVstJwszMajlJmJlZLScJMzOr5SRhZma1nCTMzKyWk4SZmdVykjAzs1pOEmZmVstJwszMajlJmJlZLScJMzOr5SRhZma1nCTMzKyWk4SZmdVykjAzs1pOEmZmVmvccB+A2Uh37yFbDvchmA0b30mYmVkt30lY1/lKfHj5/bcmfCdhZma1nCTMzKyWk4SZmdVykjAzs1pOEmZmVqtR6yZJiwC/AiYB9wIfioh/dXjdZsARwFjgZxFxSG/bS1oU+DWwJnBCRHymyXGOdm6dYmbDpemdxL7AxRExGbg4L/cgaSzwY2BzYAqwo6QpfWz/LPAN4EsNj8/MzBpomiS2AU7Mj08Etu3wmrWAGRFxT0Q8D5yWt6vdPiL+ExFXkZKFmZkNk6ZJYvGIeBAg/359h9csBdxXWZ6Z1/V3+15J2kPSNEnTZs2aNdDNzcysF33WSUi6CHhDh6f27+c+1GFd9HPbPkXEMcAxAFOnTi0W10YP19mYdU+fSSIiNq57TtLDkpaIiAclLQE80uFlM4FlKstLAw/kx/3Z3szMhknT4qZzgF3z412Bszu85npgsqTlJc0N7JC36+/2ZmY2TJomiUOATSTdDWySl5G0pKRzASLiReAzwPnAHcDpEXF7b9vnGPcC/wN8VNLMSosoMzMbIo36SUTEY8BGHdY/AGxRWT4XOLe/2+fnJjU5NjMza849rs3MrJaThJmZ1XKSMDOzWk4SZmZWy0nCzMxqOUmYmVktJwkzM6vlJGFmZrWcJMzMrJaThJmZ1XKSMDOzWk4SZmZWy0nCzMxqOUmYmVktJwkzM6vlJGFmZrWcJMzMrJaThJmZ1XKSMDOzWk4SZmZWy0nCzMxqjRvuAzCb0917yJbDfQhmtXwnYWZmtZwkzMyslpOEmZnVcpIwM7NaThJmZlbLScLMzGo1ShKSFpF0oaS78++Fa163maS7JM2QtG9f20vaRNJ0Sbfm3+9ucpxmZjY4Te8k9gUujojJwMV5uQdJY4EfA5sDU4AdJU3pY/tHgfdGxH8BuwInNzxOMzMbhKZJYhvgxPz4RGDbDq9ZC5gREfdExPPAaXm72u0j4saIeCCvvx0YL2mehsdqZmYD1DRJLB4RDwLk36/v8JqlgPsqyzPzuv5u/wHgxoh4rtMBSNpD0jRJ02bNmjXIP8PMzDrpc1gOSRcBb+jw1P793Ic6rIt+bSitAnwP2LTuNRFxDHAMwNSpU/sV18zM+qfPJBERG9c9J+lhSUtExIOSlgAe6fCymcAyleWlgVZRUu32kpYGzgI+EhF/7cffYmZmhTUtbjqHVLFM/n12h9dcD0yWtLykuYEd8na120taCPg9sF9EXN3wGM3MbJCaJolDgE0k3Q1skpeRtKSkcwEi4kXgM8D5wB3A6RFxe2/b59evCHxD0k35p1N9hZmZdVGjocIj4jFgow7rHwC2qCyfC5w7gO0PAg5qcmxmZtace1ybmVktJwkzM6vlJGFmZrWcJMzMrJaThJmZ1XKSMDOzWk4SZmZWy0nCzMxqOUmYmVktJwkzM6vlJGFmZrWcJMzMrJaThJmZ1XKSMDOzWk4SZmZWy0nCzMxqOUmYmVktJwkzM6vlJGFmZrWcJMzMrJaThJmZ1XKSMDOzWk4SZmZWy0nCzMxqOUmYmVktJwkzM6vlJGFmZrWcJMzMrFajJCFpEUkXSro7/1645nWbSbpL0gxJ+/a1vaS1JN2Uf26W9L4mx2lmZoPT9E5iX+DiiJgMXJyXe5A0FvgxsDkwBdhR0pQ+tr8NmBoRqwObAT+VNK7hsZqZ2QA1TRLbACfmxycC23Z4zVrAjIi4JyKeB07L29VuHxFPR8SLef14IBoep5mZDULTJLF4RDwIkH+/vsNrlgLuqyzPzOt63V7S2pJuB24F9qokjR4k7SFpmqRps2bNavjnmJlZVZ9FOJIuAt7Q4an9+7kPdVjX551BRPwJWEXSm4ETJZ0XEc92eN0xwDEAU6dO9R2HmVlBfSaJiNi47jlJD0taIiIelLQE8EiHl80ElqksLw08kB/3uX1E3CHpP8CqwLS+jreTew/ZcjCbmZnN8ZoWN50D7Jof7wqc3eE11wOTJS0vaW5gh7xd7fb5tePy4+WANwH3NjxWMzMboKZJ4hBgE0l3A5vkZSQtKelcgFyX8BngfOAO4PSIuL237YH1gZsl3QScBXwqIh5teKxmZjZAinjtFONPnTo1pk0bVImUmdkcS9L0iJja6Tn3uDYzs1pOEmZmVstJwszMajlJmJlZLScJMzOr5SRhZma1XlNNYCXNAv4+gE0WA7rZ/8LxHd/xR1/sOTH+chExsdMTr6kkMVCSptW1DXZ8x3f8kRt/NB/7aIvv4iYzM6vlJGFmZrXm9CRxjOM7vuOPyvij+dhHVfw5uk7CzMx6N6ffSZiZWS+cJMzMrJaThJmZ1XKSGEUkzdOfdXMqSYdKmiBpLkkXS3pU0s7DfVwjhaTxkvaR9H+SzpT0BUnjh/u4+kvSepI+LOkjrZ+CsVdofZckvUvS5yQtVDD+gW3LYyWdUip+jrlIyXgtc1SSkLS4pOMknZeXp0j6WOF9vF3S/PnxzpL+J0/BWsI1/Vw3aPn4L5T0F0n3SPqbpHtK7iPvZ4KkRVo/hcJuGhFPAluR5lZfCfhyodhIWknSsZIukHRJ66dU/LyPRSUdKekGSdMlHSFp0ULhTwJWAY4E/hd4M3Byodi0f5fyifBbhWKfDBxGmrVyzfxTsjPamcBLklYEjgOWB35ZMP6ykvaDVy7szgLuLhgf4E+SzpC0hSSVCjquVKBR4gTg58D+efkvwK9IH4pSjgJWk7Qa8JUc+yTgnYMNKOkNwFLAvJLeCrQ+ABOA+Zod7qscB3wBmA68VDg2kvYEDgSeAVpN6wJ4Y4Hwc+XfWwCnRsQ/C35XAM4AjgaOpQvvTXYacAXwgby8E+kzunGB2G+KiNUqy5dKurlA3JaNJH0A+BiwKOm7dnmh2FOBKdG95pgvR8SLkt4H/DAijpR0Y8H4uwGn5ESxIXBeRBxeMD6ki6KNgd2BIyX9CjghIv7SKGpEzDE/wPX5942VdTcV3scN+fc3gY9V1zWIuStwKfBU/t36OQd4f+Hj/1OX/wd3A4t1KfYhwJ3AjaSEMbHk3wNM7+Z7U7cPYFqh2CcA61SW1wZ+Uvj4tyeNGfQP4O0F454BLNHF9/1PwI7AbcDyed1tBeKuUflZG7gJ+HFrXRf/ng2B+4HHSYl63cHGmqP6SUi6jHSFdmFErCFpHeB7ETHoq/wO+7gc+APpymEDYBYpEf1XgdgfiIgzm8bpYx+HAGOB/wOea62PiBsKxf8DKbE9XSJeh/gLA09GxEuS5gMmRMRDhWIfADxCKiqovjf/LBE/7+MwYBpwel71QWCViGhcbCPpDuBNpBM4wLLAHcDLQETEWxrGnwycCNxKKsr6M7BPif+1pEuB1YHr6Pneb900do4/BdgLuCYiTpW0PLB9RBzSMO6lvTwdEfHuJvHb9rUosDOwC/AwqVTgHNL7dkZELD+ouHNYkliDVB67KumKYSLwwYi4peA+3gB8mHTXcqWkZYF3RcRJBWLv02H1E6Srz5uaxs/76PShLvZhzsVlPydduVW/7J8rELtjRWaJ9z7H/1vn8FGiqKy1j6eA+UnFWSLVG/6nsq8JDWL3WjcWEQMZQblT/DuBz0TERblMfB9g94hYpUncHLvjhVxElCrOqu5rYWCZkueFoSDpL6Q6pp9HxMy2574aEd8bVNw5KUkASBpHupoScFdEvFA4/vzAs/lKdiVgZVL5Y+P9SPolqWz2t3nVlsD1eR9nRMShTffRbZKuA64iXW2+3FofEScWiH1kZXE8sBGpqO+DTWO/FuQLlleJiH90Wj+I+BMiNRyorpscEaUraIvLpQxbk+ppbyKVAFweEZ0uzAYTf3Hgu8CSEbF5vnNZNyKK1IdKGgt8v9Tx9og9JyUJSe/vsPoJ4NaIeKTQPqYD7wAWBq4lFR08HRE7FYh9PvCBiPh3Xl4A+DXwPtLdxJQC+1gQ+BapqAxSeeaBEfFE09g5/h8jYr0SsfqxrwWBkwsWScwFfJLZ781lwE8LXQCsHBF35rvdVylR3CfpVlIjAZGS6PKkC6XGV/o5futEuFREbFbiRCjpqohYP99hVU9WouGdVdt+boyIt0r6OOku4luSbmlaBFeJfx650UxErJYvVm8sUQxd2cfFEbFRqXgtc1rrpo8B65IqfQHeRTqRryTpwIgo0RxQEfF0bg54ZEQcKummAnEhlSE/X1l+gTRZyDOSnqvZZqCOJxXFfSgv70L6cHdKsINxqaQ9SHdDXSnXr3gamFww3lGkCvGf5OVd8rqPF4i9D7AH8IMOzwXQuLiv/YSUE9KeTeNWnEDh1oMRsX7+/bqmB9eHcZKWIH3u9+/rxYOwWESc3moGG6klVekWcjdJOodUyd8qoiQi/q9J0DktSbwMvDkiHoZXrnyOIrU6uIIybcYlaV1S08VWu/GxBeJCard9raSz8/J7gVNzEdefC+1jhYj4QGX5vwsmOUj1NQD7VdYVaQIr6bfMvtocA0whfWFKWTN6NiG9pFQT0ojYI//esES8fu7zBklrFgzZ9ROhpNeT7oLI+yhSVEZqln0+cHVEXC/pjZTtx/CfXLEcALnRTJG784pFgMfoeUERpEYogzanJYlJrQSRPQKsFKk9fam6ib1JJ8CzIuL2/GHrrYVDv0XEtyWdS+pQJGCviJiWn25cnJU9I2n9iLgKUuc6Up+GIgbbwqKfDqs8fhH4e3sFXkMvSVohIv4KkP+33ehLsh4wicr3swsNH8aQmmHOahq3omsnQklbk+6yliR9b5cjtcwqUlQWEWdQuaCIiHuY3VelhH1ILY1WkHQ1udFMwfgAP4uIq6sr8ve3kTmtTuInpCKb1ofhA6SeuV8GfjeUV3GDodS1/0rgjxHxn75eP8h9rE5qxrggKRH9E/hoRBS5Yu5mCyRJ34uIr/a1rkH8jUjFKfeQ3pvlgN0ioshFQN7HycAKpMrTVgKKQq2/qs1oXwTuBc6MiGebxs7xu9Z6MN+xvRu4KNcdbAjs2LoDKxB/adKxv52U5K4C9i55kTEEjWZuiIg1+lo34LhzWJIQqWx9/bzqMVIHnU8X3MdEUk/rVeh5W9y4TFnS7qRjX5fUse5K4IqIOLvXDQe3rwkA7a1VCsTtWgukmi9JscrHHG8eZn/R74yIUnVBrfh30N2exUh6HSnx/LtQvDWB+yLioXwi3JN0AfZn4Jsl6puU52zOyeKtEfGypOsiYq2msXP8C0nFua0i552BnSJik0Lx5yPdTSwXEZ9Q6lPypoj4XYHY6wLrAZ8Hqr24JwDvaysiHbA5qrgpIkLSX0l1EB8C/kYas6WkU0iVdVuROufsSqFb+og4HjheqS/Gh4AvkSo7G1fqSdo5In7RViSB8rAWEfE/TfeR43y2Lf6CNKwLkvRJ4FPAGyVVr1pfB1zdeasBxX93RFzSoXXcCpIaVwy2uQ14A/BgwZgASFqV9F4vkpcfBXaNiNsahv4ps4cNWY9U8ftZUieuYyhTrPJ4bs13BWl4i0dId0OlTIyIn1eWT5D0+YLxf04a6mbdvDyTVKLROEkAcwMLkM7n1XPBkxR47+eIJJH7K+xA6nb/GOkkri4VLy0aEcdJ2jtSR5/LlXphNybpZ6TK2IdJdxEfBIr0hCZ14ILOCaebt5slWiD9EjgPOBjYt7L+qUKtpt4JXEJqKNCuccUg9Kh0fx3wZ6X+JKV7Fh9D6gF9ad7nu/K6pk2Sx1be5+2BYyKNDHBmwUYP25Dqxr5Aqn9bkFTZXEprxOBT83LrXFHKChGxvaQdAXKLxCIDi1XOMydEww6RncwRSYI0ns+VwHsjYgaApC90aV+tcsYHJW0JPAAsXSj2oqSWUo+T6goejYgiV1MR8dP88KJuVH5VYnVqgXR6/RZ9y304niB9sastYBaQtEDTFjAxe0iMAyOiR69rpeEbSjis75c0Nn+1/iQiLsst45oaK2lc/ixuRLq7bSlyjqnUwb1MqjMrbXfSyLiHkz6ffyQNrVPK85LmZXal/gpULgIKmUfSMby60UOzou7o0gBTI+mH1NnsV8B9pBE8NwL+1qV9bUW6ylmV1KppOrB14X28mVT++HdgZuHYrxqMsNO6BvHfWfl5O7B0wdjvJTVb/A+pKPFl4PYuvzdFB/0j3dGNyY9XIvUCnqtQ7LOAb+STyCTg68BvCsTdn1SsdzZpcMVWXeeKpCalTWJ/DPhyZfl+UjHKU8AnS773HfZ9WMFYm5I6ps4iFUnfSxqup+Tx3kzq7LkW8LbWT9O4c1rF9fzAtqQrzneTrkjOiogLhvO4+kvSVqTe3BuQenRfA1wZqa6iaeyuVn4NhW61gJG0MqkhwqH0nJ9iAukEVqQZZt5XN3vsLwz8N7MbblwB/HdE/KtA7HWAJYALIl/152LeBaJBb3FJ1wObRcRjefnG/L8dn/e1Qe8RBk/SPyKi41Amg4y3KLAOqdHDtRHxaKnYOf70iHhbyZgw5xQ3Aa/csp5CqvhaBNiOVIbdOEnkVju1GTcKNGEENid9sY+IiAcKxKvqauWX0uB4de9PRMQKTfcBvBARj0kaI2lMRFwqaVCDmrV5E+kOcSF61ks8BXyiQPyqrvTYVxrb54yIKDEvxatExLUd1jWbxyAZ00oQ2Rk59rO5+Kabik1Gkps2X0G6qLuzVNw2v5X0KQqPUjxH3Ul0k6Rde3s+CgxgNxQkLRddqPzSq2dXG8PsFlo3RM9e3oPdx0WkO8WDgcVIna7WjEJjRUlaNyKKzgTYYR83klpqHU6aj+R2SbdGmaHmzwF2iULjcA0FSTMiYsUO68cAM6LhCLyqnxVRwM0RUaQ+UdK7SXdw7yCNLnATqfn6ESXi5310ZZRiJ4lRQK8e3OyVpyg4yFneV9f6eeT4Y0hjHn2Z9EX5bkQUGVIkFyc+Q0pArRYwv2h6JVWJP55URt7+3uxeIn7exwakxHl1RHxPqVf350vciUo6nVTccSE9x/YpcZfbFUodYP8ZEV9vW38QaRiQvRrGb93hdrpraHyCbdvXWNK0qxuSmsc/ExErl4rfLU4SheVOOdtFxON5eWHgtIh4z7AeWD9JuoBUyf8lKv08omGvZaURVHcnNWG8Cjg48vAWpaj7Pa7PILWU+zCp+eVOwB0RsXeJ+N1Wd7c7ku9yc+L/Genk2ur1vxqprubjUahDYLdJupjUKOEaUkvLq6LQyNOVfXRlNAMnicIk3RQRq7etuzEi3loo/lhgcXo2cSs1yNkrlV/VnsqSLo+Gs/dJmknq/PRDZs+M9ooo0CFNXe5xXak0vSUi3pIT3/ml7rLyPlYiJehJlGzGOMrlO6pWA4E/l77A6DZJh5NaGz1Hagl2BWkWvGLjoqlLoxnMURXXQ+QlScu2TtxKs4EVycSSPkua6+FhZk/YE0CxYSfoXj+Pi0jHulr+qWrUIa2mx7VIFfGNe1xXtN6bx3Pv5YdIJ/OSzgCOJl09lx5BtTWfRNUTpKvyg9oqiEeUSAPu3TPcxzFYEfEFgNxrfDdSD+w3APMU3Efx0QzAdxLFSdqM1Iu11ct6A2DPiPhDgdgzgLW7+WXOzWyvBJYhDXg2gdRM8pxu7bOp/GVYmO71uG7t5+OkYVzeQvqSLwB8I2Z3RCyxj640Y8yxDyUlnl/mVTuQkukTwPoR0alHuRUg6TOkSuu3kfo3tVo6XdLFfc4F3BIRb24Ux0miPEmLMbs99DWl2kMrzT+9SRTqZT3cJP0uIrYqEGc+UvPXF/Lym4AtSEOFlxxXqeskHUBqlVW0GWOOfXVEvL3TulItqEabXlo3AeUmw5L0ZVJimN6t72/baAZjSZ1uT4+Ifeu36kdcJ4mylGa4+2ZleQxpCs0SnaGOI7XZ/z09TyBFBt/L+ziRNETy43l5YeAHJVvwVPZVpK5G0hWk5qJ3S1oRuI7UH2YKcH3TL0llP4sCBzB7OOkrgW+XvLPrVjPGHPtmYI+I+FNeXgs4NtJ0msXqzUrq9kl8KFs3dZukar1hsflUXCdR3rKS9ouIg5WGlT6DhoPwSTo5InYhDb98OKnj29zND7Wjt7QSBEBE/EtSt04eNxaKs3BEtGYR2xU4NSI+K2lu0rAoRZIEcBrparDVp2MnUkuwYh3UoruTMn2cNIrwAnn5KeBjuQXRwV3cbxPT6eUkTsMZDbv8fg+piLhcabbN1myDRWbW851EYZJEuoq9ldQe+ryIOLz3rfqM+WdSb+vfkubl7qFwufvNpDFl/pWXFwEuH8lFEW0tsa4Gvh8Rv8nLN0ehIUU61Rcoz3NQIn6ONxdp/J3WcBOXAT+NghPU5DocVS8G7JW75sn07ANzxfAd0cBI+hDwfdJnRqQ6kC9HxK+bxPWdRCFKs3K1HEEaY/9q0hC+a0SD8WtIrV3+ACxPaonyym4pND90xQ+AP0pqfbC2A75TKrjSiLIHkGZ1G8fsDoFN/oZbJB1GGvxtRfIwK5IWanSwr3appB2YPWrtB0lFfyUdBcwF/CQv75LXfbzUDmIU9biu6uZJPDdK2JvUku8mUp3iNfScL3qwsceSmkp3ZUiUiv1JIww8kvc7kdSqsFGS8J1EIblSuU6UaOcu6aiI+GTTOP3YzxTSl0PAxaV6ROfYd5I61E2n0sSzSbm+0hg+e5MGmDs+8lSrSnNFrxARjZsB5nhPkTpEtZofj2F2z+WIAj3fO935lLwbGq3qTuKl+o/k5sFrkgbeW11pUMf/jojtC8Xv+pAo7Y0Pcn3ozU1LAXwnUUhEbJj/KdtFxK+6tI+hSBDLAv8mTdr+yrqCHfaeiIjzCsUC0gQuwCEd1v+RNC9Aqf00ngGwH16StEKrs1juRFa0v8QotTezT+Ibtk7iBeM/G2nQQCTNExF35lZyxeIDtyqNyNCtIVH+IOl8Zk+ctD1wbtOgThIFRZp399OkyszR6vfMbkY3L6mI6y5m93Zt6lJJ3yd1nqu20Co1w17XKI2r9CqFy62/THqP7iHdyS1Hoclv8mfzlLaWaztGxE963XBk6PZJfGYunvwNcKGkf5E6kpbye8oXTQKQW/QtHhFfVppid31y83tS/Wiz+C5uKkvSN0iDzP2KnlcMxSqXh1Kua9kzIvYsFK9TsVyR4rhuy+3QW8aTJneZXvrYc6u4N5G+6HdGRJEZzNTlIWO6SdJZpGT5eVJR6L9IkzFt0YV9vZM0OOR5hRsMzAssGxF3lYqZ4/4O+FpE3NK2firwraadJJ0kCutmO/fhog5jIhlIWgY4NCJ2LBDr3RFxSb4SfJUSnQKVhixZLfKXPleo3hIFJ00aCt04iVeamfe6rkH895KmqJ07IpaXtDppOtzGc5dLui0iVq15rnEnSRc3FTba211L2qeyOAZYgzTlYqn4C5LGn2oV3VxO+rIMukKvrafpq5T4ItaYSZqmtoR3ApfQc1KjlkZjW1WcD5wu6egccy9Sq7kRr3rCjojLW+tIrb9K6JEocwItOTzKAaQ7z8sAIuImlZsffXwvzzWemMlJorChaOfeZdXK2RdJ5ahnFox/PHAbacIhSF/ynwMdr6D76bCmB9Uf6jn74BhgdWYPX91IRHwrPzwwInrcjRY8mXwV2JP0+RSpqfDPCsXutq6cxCXtB3wNmFfSk63VwPOkMdhKeTEinkjdqF5RqhjnekmfiIhjqyuVZjec3jS4i5sKk/QzUjv31hj9uwAvRUSxdu6jWU25+KvWjUTqOR/Di8C9EVFylNmORXudOvHNKaonceDp1mrySTwi9iu0n4NLxaqJfxxwMan3/weAz5HqVBpNmpRjL04a6+t5ZieFqaRRGd4XEQ81iu8kUdZobec+VEU2kq4h9QK9Ki+/HTgsItYtEHsyaXiJKfTscFWkPkhp+IpnI+KlvDwWmCcinu59y37FXpl0tXwoqYVTywTS+zXoegNJp0fEh9R5qHCi0Hwb3dStk7iklXNLqY51bqVa3SkNQrk/sCkpyZ1PGvfr2RLx8z42ZHbx5+1RaIRZJ4nCJN1A6itRbef+65Fe8avZg4O9nzTO/S/y8o6kK+avFdrP6qS7rAVJX5Z/Ah9tdYBrGPsqUn3H4aSy/d1In/Fv9bph/+NfC2wceTY0pTGQLogCc2hL2oY0P/fWVPqokMZXOi33+Rhs7CUi4kGluU1eJbowp3kp3T6JSzomIvYYqlZ3kibkuE+VjNtNThKFSPo8aRiOhYFjgVa58iRg91JZvdskXRERG/S1rsB+JgBExJN9vXYAMVuz6r3SokPSlRHxjkLxu15UJmndiLimVLzRbqhP4t0iaU1SfVyrzu8J0nmhcZ1Bt7niupylSWM2vRn4C+kKeTrw84go2Smn2yZKemOkmcBalaYTmwaVtHNE/KKt9RStirwoM9z5s0q93u9WmuTlfuD1BeK2/EeVcbgkvY3UJ6akG3Ont1XoWWTWeKj23Lz2e6T3RPknosBwIt0SEXvk3xt2cz+SxpNmN1yf2cPAH12wOOg44FMRcWXe3/qkBhsjvqjPSaKQiPgSgNLw1FOB9YB1gU9Lejwipgzn8Q3AF4DLco9fSHdCJTrSzZ9/dxraotTt7OeB+UiVgt8GNgQ6Tg7fIP4ZklpJfwnS0AclnQzcCbwHOJA0HPkdhWIfCrw3IkrFGzJDcBI/iVS015onekfS/2K7QvGfaiUIgIi4SmkssBHPxU2F5X4A65ImplkXWAi4NSKKDK0wFHKP35XzYrEevzn229tbBHVaN8jY20XEGX2ta7iPuejZG7po0+ZWD2jl4c/z/s4vUayiDjPTjRaSTiedxKt1ZQtHRJGTeLcbnEg6nHQBcyopyW1P6jV+JozsYWmcJAqRdAypiOAp4E/AtaTByP41rAfWT5K+EhGH5sc9TqySvluw4rpTE88iPbq7GTvH6vrYR5Kui4i1lGbb+xTwEHBdiRZako4gNUr4DT3HzRrxU7wOwUn8BNKdybV5eW1g14j4VKH4XR8lultc3FTOssA8pNmg7if1xn18OA9ogHYgFUcA7EeaUa9lM1Jb9UGTtC6pCG5iW73EBNJ8vE1ib06a03opST9qi11yPuFPRMSPWwuRZu37BLPnfijhmJx8vkFq5bQA8M3eN+m3CaS+BptW1pXqzd1tN0pap+0kXrKPytrARyS1RjteFrij1Wy4aTPhbtepdJOTRCERsZlSLewqpJPhF4FVJf2TNO59kWaYXaSax52WB2Nu0glvHD3rJZ4kTd7TxAOkyZi2pmcP06dIdSyljJGkiB5jHxWdRjYiWj2gL6fsZFKMpiLPDrp6EiddCFkHLm7qAklLk+ok1gO2AhaNiIWG9aD6UC2WaS+iKVxks1y32uVLGhcRJe8c2uMfRhq6uzX20SeBf0TEFwvE3qe350u0/lKaqewTpMYIr1wglmg51W11fTxaSn2mJL2enq3KSs2jMmr5TqIQSZ8jJYW3Ay+QboWvIbWNvnUYD62/VlMau0a8ehyb3gYQG6inleaTaG/iOegy2VaPYlKRRDd7FH+DdJLdi9ljHx1XKPZQTGh0NqlV0EWMsomMWkmgWydxSVuTpu5dEniEdDFwB+XmURm1nCTKmUSaS/YLEfHgMB/LgEVEo3qBATiFNNfGVqST7a40H2V27/x7q4ZxOpI0DvguqQf3faQEsQypw+QYCpxwI6LkLGt15ouIrw7BfoobgpP4t0lTol6UW5dtSGpBVYSk7YA/RMRTkr5OGl35oJHcqqllzHAfwGtFROwTEb8ejQliiC0aEccBL0TE5bmoY50mAfOQE2OB4yLi7+0/BY75+8AiwBsjYo1Ik/QsTxpapOgItJJWknSxpNvy8lvySaWE30kqPknPEGmdxP8SaTj+jShbcf1CpHnWx0gaExGXkkb5LeUbOUGsT+oDcyJwVMH4XeMkYUOt1a/gQUlbSnorqbd6I5EG3Xs691MpbStSy6ZXOj/lx58ktaoq6VhS67IX8n5uIbU8GzRJT+Xiw71JieIZSU9W1o8G3T6JP640FtcVwCm5uXDJ+q3W3eaWwFERcTaFGz10i4ubbKgdlE/kXyT1bp1AuRZI3ZpsPlotmtpWvtSpDqSh+SLiOvWcd6DRySoihqK+o9vaT+KPUPYkvg1piJUvkHq5L0jq8V7K/ZJ+CmwMfC93WB0VF+lOEjakIuJ3+eETpGEzSurWZPN/lvSRiDipulLSzqQhNEp6VNIK5KFKJH0QKFKEKeniiNior3UjVFdO4pJWBBav9Ph/GThR0gak0RIea7qP7EOkZraHRcTjkpag55DwI5abwNqQknQisHdbr+UfjORmmJKWInU4e4bUDyOANUkT4bwvIu4vuK83kmZEW480bMPfgJ2a1K3kcY/mJ02P+i5m93uZQJon+s1NjrmbOpzEW+s3AO6PPCR/g/i/A76Wi/Wq66cC34qITtPJDnQfY0hziZea6nZI+U7ChtpbWgkCXum1/NYSgdWlSYdyElhb0rtJrWlEOrle3CRuzb7uATZWmuBoDCkxbQ80qYDfkzQ44ZJAtTXNk8CPO20wgvyQzr39n87PNT2JT2pPEAARMU3SpIaxW7FelnSzpGVHY78LJwkbamMkLdwa00rSIpT7HP6c2ZMObUiedKhQbCLNCdKVeUGU5tf4NLAUqT/DRXn5S6R5tE8ZbOyIOAI4QtJnI+LIPjcYWbp9Eu+tD9C8BeK3LAHcLuk6etaXFZnxsZucJGyo/QD4o6Rf5+XtgO8Uij1vRFych874O3CApCtJiWOkO5lUvHQNqcPeV0itX7aNiJuaBG4N3hgRR3Zz8MYu6fZJ/HpJn4iIY6srJX2MnkO8NDUU/WC6wnUSNuQkTQHeTbrKvzgi/lwo7tXAO0idGi8hDbR4SES8qUT8blLP2fTGAo8Cy0aBaS6HasiVbpB0KnBJzUl804hoNJ+HpMWBs4DnmZ0UppIS9Psi4qEm8V8LnCRsSElattP6EmW1SlNE3kFqlfJtUguYQ1sjh45kXR4v68bcAbDH407LI81QncRzD+tWxfLtUXi6YaUJhlon27mBuYD/xAieFbDFScKGVGvUzrw4L6nn8l0RMUePkSPpJWaXVYv03jxNgSlGR/OdREu3T+JDTdK2wFojvKgPcJKwYSZpDWDPiBj0FKmSzunt+dFQOdhNlQRUTT7k5fERMddwHducTNK1EdFoSJqh4IprG1YRcUMuJmpiXdLAe6eSZgUs1qLptWAIB2+0GpLeX1kcQyoyGxVX6E4SNqTa5k0YQxoNs+kosG8ANiGN2vlhUq/rUyPi9oZxzUqp9ud4EbiX1It8xHNxkw0pSdXmqK0vy5kR8Wyh+POQksX3gQNHYb8AsxHFScJeE3Jy2JKUICaR5oc+vuSQGWaDpTRb5ZGkSckCuIo0PM3MYT2wfnCSsCEh6bf0UgbbpHI5jwe1KnAecFpE3DbYWGbdkEcm/iWp0yTAzqQxuTYZvqPqHycJGxKS3pkfvp9Uh/CLvLwjcG+TpoCSXmZ289HqB7px81GzEiTdFBGr97VuJHLFtQ2JiLgcQNK3I2KDylO/lXRFw9ijYlx+m6M9moeWPzUv70i5Yci7yl8uG2oT83DYAEhaHpg4jMdjNhR2J80p8RBpfpAP5nUjnoubbEhJ2ow0X8I9edUkUme684ftoMyslpOEDbncEmnlvHhnRDw3nMdj1i2SjqT3BhtNp9btOhc32ZCQ9JXK4tYRcXP+eU7Sd4ftwMy6axppYMLpwNaVx62fEc93EjYkXguDzJk1MdJH3K3jOwkbKqp53GnZ7LVoVF6RO0nYUImax52WzWyEcHGTDQkPV21zorbJhuaj5+d+VHT0dJIwM7NaLm4yM7NaThJmZlbLScLMzGo5SZiZWS0nCTMzq/X/iNMnelxiHoYAAAAASUVORK5CYII=",
      "text/plain": [
       "<Figure size 432x288 with 1 Axes>"
      ]
     },
     "metadata": {
      "needs_background": "light"
     },
     "output_type": "display_data"
    }
   ],
   "source": [
    "local_explanations_out = pd.read_csv(explainability_output_path + \"/explanations_shap/out.csv\")\n",
    "feature_names = [str.replace(c, \"_label0\", \"\") for c in local_explanations_out.columns.to_series()]\n",
    "local_explanations_out.columns = feature_names\n",
    "\n",
    "selected_example = 111\n",
    "print(\n",
    "    \"Example number:\",\n",
    "    selected_example,\n",
    "    \"\\nwith model prediction:\",\n",
    "    sum(local_explanations_out.iloc[selected_example]) > 0,\n",
    ")\n",
    "print(\"\\nFeature values -- Label\", training_data.iloc[selected_example])\n",
    "local_explanations_out.iloc[selected_example].plot(\n",
    "    kind=\"bar\", title=\"Local explanation for the example number \" + str(selected_example), rot=90\n",
    ")"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "**Note:** You can run both bias and explainability jobs at the same time with `run_bias_and_explainability()`, refer [API Documentation](https://sagemaker.readthedocs.io/en/stable/api/training/processing.html#sagemaker.clarify.SageMakerClarifyProcessor.run_bias_and_explainability) for more details. "
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Clean Up\n",
    "Finally, don't forget to clean up the resources we set up and used for this demo!"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 23,
   "metadata": {},
   "outputs": [
    {
     "name": "stderr",
     "output_type": "stream",
     "text": [
      "INFO:sagemaker:Deleting model with name: DEMO-clarify-model-07-02-2023-05-57-08\n"
     ]
    }
   ],
   "source": [
    "sagemaker_session.delete_model(model_name)"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## Notebook CI Test Results\n",
    "\n",
    "This notebook was tested in multiple regions. The test results are as follows, except for us-west-2 which is shown at the top of the notebook.\n",
    "\n",
    "![This us-east-1 badge failed to load. Check your device's internet connectivity, otherwise the service is currently unavailable](https://h75twx4l60.execute-api.us-west-2.amazonaws.com/sagemaker-nb/us-east-1/sagemaker-clarify|fairness_and_explainability|fairness_and_explainability.ipynb)\n",
    "\n",
    "![This us-east-2 badge failed to load. Check your device's internet connectivity, otherwise the service is currently unavailable](https://h75twx4l60.execute-api.us-west-2.amazonaws.com/sagemaker-nb/us-east-2/sagemaker-clarify|fairness_and_explainability|fairness_and_explainability.ipynb)\n",
    "\n",
    "![This us-west-1 badge failed to load. Check your device's internet connectivity, otherwise the service is currently unavailable](https://h75twx4l60.execute-api.us-west-2.amazonaws.com/sagemaker-nb/us-west-1/sagemaker-clarify|fairness_and_explainability|fairness_and_explainability.ipynb)\n",
    "\n",
    "![This ca-central-1 badge failed to load. Check your device's internet connectivity, otherwise the service is currently unavailable](https://h75twx4l60.execute-api.us-west-2.amazonaws.com/sagemaker-nb/ca-central-1/sagemaker-clarify|fairness_and_explainability|fairness_and_explainability.ipynb)\n",
    "\n",
    "![This sa-east-1 badge failed to load. Check your device's internet connectivity, otherwise the service is currently unavailable](https://h75twx4l60.execute-api.us-west-2.amazonaws.com/sagemaker-nb/sa-east-1/sagemaker-clarify|fairness_and_explainability|fairness_and_explainability.ipynb)\n",
    "\n",
    "![This eu-west-1 badge failed to load. Check your device's internet connectivity, otherwise the service is currently unavailable](https://h75twx4l60.execute-api.us-west-2.amazonaws.com/sagemaker-nb/eu-west-1/sagemaker-clarify|fairness_and_explainability|fairness_and_explainability.ipynb)\n",
    "\n",
    "![This eu-west-2 badge failed to load. Check your device's internet connectivity, otherwise the service is currently unavailable](https://h75twx4l60.execute-api.us-west-2.amazonaws.com/sagemaker-nb/eu-west-2/sagemaker-clarify|fairness_and_explainability|fairness_and_explainability.ipynb)\n",
    "\n",
    "![This eu-west-3 badge failed to load. Check your device's internet connectivity, otherwise the service is currently unavailable](https://h75twx4l60.execute-api.us-west-2.amazonaws.com/sagemaker-nb/eu-west-3/sagemaker-clarify|fairness_and_explainability|fairness_and_explainability.ipynb)\n",
    "\n",
    "![This eu-central-1 badge failed to load. Check your device's internet connectivity, otherwise the service is currently unavailable](https://h75twx4l60.execute-api.us-west-2.amazonaws.com/sagemaker-nb/eu-central-1/sagemaker-clarify|fairness_and_explainability|fairness_and_explainability.ipynb)\n",
    "\n",
    "![This eu-north-1 badge failed to load. Check your device's internet connectivity, otherwise the service is currently unavailable](https://h75twx4l60.execute-api.us-west-2.amazonaws.com/sagemaker-nb/eu-north-1/sagemaker-clarify|fairness_and_explainability|fairness_and_explainability.ipynb)\n",
    "\n",
    "![This ap-southeast-1 badge failed to load. Check your device's internet connectivity, otherwise the service is currently unavailable](https://h75twx4l60.execute-api.us-west-2.amazonaws.com/sagemaker-nb/ap-southeast-1/sagemaker-clarify|fairness_and_explainability|fairness_and_explainability.ipynb)\n",
    "\n",
    "![This ap-southeast-2 badge failed to load. Check your device's internet connectivity, otherwise the service is currently unavailable](https://h75twx4l60.execute-api.us-west-2.amazonaws.com/sagemaker-nb/ap-southeast-2/sagemaker-clarify|fairness_and_explainability|fairness_and_explainability.ipynb)\n",
    "\n",
    "![This ap-northeast-1 badge failed to load. Check your device's internet connectivity, otherwise the service is currently unavailable](https://h75twx4l60.execute-api.us-west-2.amazonaws.com/sagemaker-nb/ap-northeast-1/sagemaker-clarify|fairness_and_explainability|fairness_and_explainability.ipynb)\n",
    "\n",
    "![This ap-northeast-2 badge failed to load. Check your device's internet connectivity, otherwise the service is currently unavailable](https://h75twx4l60.execute-api.us-west-2.amazonaws.com/sagemaker-nb/ap-northeast-2/sagemaker-clarify|fairness_and_explainability|fairness_and_explainability.ipynb)\n",
    "\n",
    "![This ap-south-1 badge failed to load. Check your device's internet connectivity, otherwise the service is currently unavailable](https://h75twx4l60.execute-api.us-west-2.amazonaws.com/sagemaker-nb/ap-south-1/sagemaker-clarify|fairness_and_explainability|fairness_and_explainability.ipynb)\n"
   ]
  }
 ],
 "metadata": {
  "instance_type": "ml.t3.medium",
  "kernelspec": {
   "display_name": "Python 3 (Data Science 3.0)",
   "language": "python",
   "name": "python3__SAGEMAKER_INTERNAL__arn:aws:sagemaker:us-east-1:081325390199:image/sagemaker-data-science-310-v1"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.10.6"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 4
}