{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# [모듈 3.7] 추론 및 결과 분석\n", "\n", "이 노트북은 이전 노트북에서 생성한 앤드포인트를 대상으로 실제 추론을 하여, 평가 결과를 얻습니다. 테스트 데이터 세트는 1000개를 사용하여 결과를 확인 합니다.\n", "- 0. 기본 세이지 메이커 정보 및 기본 변수 로딩\n", "- 1. 테스트 데이터 세트 로딩\n", "- 2. 추론할 Payload 생성\n", "- 3. 추론 실행\n", "- 4. 예측의 확률값을 0, 1로 변화하여 리포팅\n", "- 5. 엔드포인트 삭제\n", "\n", "---\n", "### 노트북 커널\n", "- 이 워크샵은 노트북 커널이 `conda_python3` 를 사용합니다. 다른 커널일 경우 변경 해주세요.\n", "---\n", "\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 0. 기본 세이지 메이커 정보 및 기본 변수 로딩" ] }, { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "import boto3\n", "import sagemaker\n", "import pandas as pd\n", "\n", "region = boto3.Session().region_name\n", "sagemaker_session = sagemaker.session.Session()\n", "role = sagemaker.get_execution_role()\n", "\n", "%store -r \n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "아래는 사용자 정의의 함수를 로딩 할때마다, 캐시에 있는 것보다는 원본을 로딩함." ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [], "source": [ "%load_ext autoreload\n", "%autoreload 2" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 1. 테스트 데이터 세트 로딩" ] }, { "cell_type": "code", "execution_count": 3, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", " | fraud | \n", "vehicle_claim | \n", "total_claim_amount | \n", "customer_age | \n", "months_as_customer | \n", "num_claims_past_year | \n", "num_insurers_past_5_years | \n", "policy_deductable | \n", "policy_annual_premium | \n", "customer_zip | \n", "... | \n", "collision_type_missing | \n", "incident_severity_Major | \n", "incident_severity_Minor | \n", "incident_severity_Totaled | \n", "authorities_contacted_Ambulance | \n", "authorities_contacted_Fire | \n", "authorities_contacted_None | \n", "authorities_contacted_Police | \n", "police_report_available_No | \n", "police_report_available_Yes | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "0 | \n", "23901.432507 | \n", "36201.432507 | \n", "56 | \n", "118 | \n", "0 | \n", "1 | \n", "750 | \n", "3000 | \n", "98039 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "1 | \n", "
1 | \n", "0 | \n", "29095.295736 | \n", "73695.295736 | \n", "36 | \n", "71 | \n", "0 | \n", "1 | \n", "750 | \n", "2650 | \n", "95307 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "1 | \n", "
2 | \n", "0 | \n", "11232.831826 | \n", "25032.831826 | \n", "24 | \n", "11 | \n", "1 | \n", "4 | \n", "750 | \n", "3000 | \n", "98391 | \n", "... | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "
3 | \n", "0 | \n", "11125.579356 | \n", "25125.579356 | \n", "23 | \n", "65 | \n", "0 | \n", "1 | \n", "750 | \n", "3000 | \n", "91302 | \n", "... | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "
4 | \n", "0 | \n", "4529.773913 | \n", "22329.773913 | \n", "37 | \n", "142 | \n", "0 | \n", "1 | \n", "750 | \n", "3000 | \n", "90744 | \n", "... | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "1 | \n", "0 | \n", "
5 rows × 59 columns
\n", "