{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# 이미지 분류 Transfer learning 데모 \n", "\n", "### [(원본)](https://github.com/awslabs/amazon-sagemaker-examples/blob/master/introduction_to_amazon_algorithms/imageclassification_caltech/Image-classification-transfer-learning.ipynb)\n", "\n", "1. [소개](#소개)\n", "2. [사전조건 및 전처리](#사전조건-및-전처리)\n", "3. [이미지 분류 모델을 미세 조정하기](#이미지-분류-모델을-미세-조정하기)\n", "4. [훈련 파라미터](#훈련-파라미터)\n", "5. [훈련](#훈련)\n", "6. [모델 배포하기](#모델-배포하기)\n", " 1. [모델 생성](#모델-생성)\n", " 2. [Batch transform](#Batch-transform)\n", " 3. [실시간 추론](#실시간-추론)\n", "7. [정리](#정리)\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 소개\n", "\n", "Transfer learning에서의 분산된 이미지 분류를 위한 end-to-end 예제에 오신 것을 환영합니다. 이 데모에서는 새로운 데이터셋의 분류를 학습하기 위해서, Amazon SageMaker의 이미지 분류 알고리즘의 Transfer learning 모드를 사용하여 사전 훈련된 모델(Imagenet에서 훈련)을 미세 조정할 것입니다. 특히 사전 훈련된 모델은 [caltech-256 dataset](http://www.vision.caltech.edu/Image_Datasets/Caltech256/)을 사용하여 미세 조정됩니다. \n", "\n", "\n", "시작을 위해서는 권한, 구성 등에 대한 몇 가지 사전조건과 환경을 설정해야 합니다. " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 사전조건 및 전처리\n", "\n", "### 권한 및 환경 변수\n", "\n", "여기에서 AWS 서비스에 대한 연결과 인증을 설정합니다. 이것은 세 가지 항목이 포합니다.\n", "\n", "* 학습과 호스팅 시 데이터를 접근하기 위해 사용되는 role. 이것은 노트북을 시작하는데 사용된 role에서 자동으로 가져옵니다. \n", "* 훈련과 모델 데이터를 위해 사용되는 S3 버킷\n", "* 변경할 필요가 없는 Amazon SageMaker 이미지 분류 docker image" ] }, { "cell_type": "code", "execution_count": 1, "metadata": { "tags": [ "parameters" ] }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "811284229777.dkr.ecr.us-east-1.amazonaws.com/image-classification:1\n", "CPU times: user 947 ms, sys: 76.1 ms, total: 1.02 s\n", "Wall time: 1.08 s\n" ] } ], "source": [ "%%time\n", "import boto3\n", "import re\n", "from sagemaker import get_execution_role\n", "from sagemaker.amazon.amazon_estimator import get_image_uri\n", "\n", "role = get_execution_role()\n", "\n", "bucket='<>' # customize to your bucket\n", "\n", "training_image = get_image_uri(boto3.Session().region_name, 'image-classification')\n", "\n", "print(training_image)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 이미지 분류 모델을 미세 조정하기\n", "\n", "caltech 256 데이터셋은 257개의 카테고리(마지막은 잡다한 데이터를 포함한 카테고리임)로 구성되며 카테고리별로 최소 80개의 이미지에서 최대 약 800개의 이미지를 갖는 30k이미지를 가지고 있습니다. \n", "\n", "이미지 분류 알고리즘은 2가지 입력 포맷을 이용할 수 있습니다. 첫 번째는 [recordio format](https://mxnet.incubator.apache.org/tutorials/basic/record_io.html) 이고 다른 하나는 [lst format](https://mxnet.incubator.apache.org/how_to/recordio.html?highlight=im2rec) 입니다. 두 형식의 파일은 http://data.dmlc.ml/mxnet/data/caltech-256/ 에서 제공합니다. 이 예제에서는 훈련을 위해 recordio 형식을 사용할 것이며 분할한 훈련/검증 [specified here](http://data.dmlc.ml/mxnet/data/caltech-256/) 을 사용할 것입니다. " ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [], "source": [ "import os \n", "import urllib.request\n", "import boto3\n", "\n", "def download(url):\n", " filename = url.split(\"/\")[-1]\n", " if not os.path.exists(filename):\n", " urllib.request.urlretrieve(url, filename)\n", "\n", " \n", "def upload_to_s3(channel, file):\n", " s3 = boto3.resource('s3')\n", " data = open(file, \"rb\")\n", " key = channel + '/' + file\n", " s3.Bucket(bucket).put_object(Key=key, Body=data)\n", "\n", "\n", "# caltech-256\n", "s3_train_key = \"image-classification-transfer-learning/train\"\n", "s3_validation_key = \"image-classification-transfer-learning/validation\"\n", "s3_train = 's3://{}/{}/'.format(bucket, s3_train_key)\n", "s3_validation = 's3://{}/{}/'.format(bucket, s3_validation_key)\n", "\n", "download('http://data.mxnet.io/data/caltech-256/caltech-256-60-train.rec')\n", "upload_to_s3(s3_train_key, 'caltech-256-60-train.rec')\n", "download('http://data.mxnet.io/data/caltech-256/caltech-256-60-val.rec')\n", "upload_to_s3(s3_validation_key, 'caltech-256-60-val.rec')" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "훈련을 위한 올바른 형식의 데이터를 확보했다면 다음 단계는 데이터를 사용하여 실제로 모델을 훈련하는 것입니다. 모델을 훈련하기 전에, 우리는 훈련 파라미터를 설정할 필요가 있습니다. 다음 섹션에서는 파라미터를 상세하게 설명합니다. \n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 훈련 파라미터\n", "\n", "훈련을 위해서 설정이 필요한 파라미터는 두가지 종류가 있습니다. 첫 번째는 Training job을 위한 파라미터들로서 아래 항목들이 포함됩니다: \n", "\n", "* **Input specification**: 훈련데이터가 존재하는 경로를 명시하는 훈련과 검증 채널입니다. 이것은 \"InputDataConfig\" 섹션에서 지정합니다. 설정이 필요한 주요 파라미터는 \"ContentType\"로서 입력 데이터 유형에 따라 \"application/x-recordio\" 이나 \"application/x-image\"로 설정할 수 있고 데이터가 존재하는 버킷과 폴더를 지정하는 S3Uri가 있습니다. \n", "* **Output specification**: 이것은 \"OutputDataConfig\" 섹션에서 명시할 수 있습니다. 훈련 후에 출력을 저장할 수 있는 경로를 지정합니다. \n", "* **Resource config**: 이 섹션은 훈련 데이터를 실행하기 위한 인스턴스 유형과 훈련을 위해 사용되는 호스트의 갯수를 설정합니다. \"InstanceCount\"가 1보다 크면 훈련은 분산된 방식으로 진행될 수 있습니다. \n", "\n", "Apart from the above set of parameters, there are hyperparameters that are specific to the algorithm. These are:\n", "위의 파라미터 셋외에도 알고리즘에서 지정할 하이퍼파라미터들이 있습니다. 그것들은 다음과 같습니다.:\n", "\n", "* **num_layers**: 네트워크의 레이어(depth) 수. 이 샘플에서는 18개를 사용하지만 50, 152와 같은 다른 값들을 사용할 수 있습니다. \n", "* **num_training_samples**: 총 훈련 샘플의 숫자입니다. 현재 분할된 caltech 데이터넷은 15420으로 설정됩니다. \n", "* **num_classes**: 새 데이터셋의 출력 클래스 수입니다. Imagenet은 1000개의 출력 클래스로 훈련되었으나 미세조정을 위해 출력 클래스의 숫자를 변경할 수 있습니다. caltech의 경우 256개의 객체 카테고리와 +1개의 잡다한 클래스를 가지고 있으므로 257를 사용합니다. \n", "* **epochs**: 훈련 epochs 수\n", "* **learning_rate**: 훈련을 위한 Learning rate\n", "* **mini_batch_size**: 각 미니배치에서 사용할 훈련 샘플의 수. 분산 훈련일 경우, 배치당 훈련 샘플의 수는 N * mini_batch_size입니다. 여기서 N은 훈련이 실행되는 호스트 수입니다. " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "훈련 파라미터를 설정한 후에, 훈련을 시작하고 훈련이 완료될까지 상태를 폴링하는데, 이 예제에서는 p2.xlarge 에서 epoch당 10에서 12분의 시간이 걸립니다. 네트워크는 일반적으로 10 epochs 후에 수렴합니다. 그러나 훈련 시간을 절약하기 위해 epoch을 2로 설정했지만, 좋은 모델을 생성하기에 충분하지 않을 수 있습니다. " ] }, { "cell_type": "code", "execution_count": 3, "metadata": { "isConfigCell": true }, "outputs": [], "source": [ "# The algorithm supports multiple network depth (number of layers). They are 18, 34, 50, 101, 152 and 200\n", "# For this training, we will use 18 layers\n", "num_layers = 18\n", "# we need to specify the input image shape for the training data\n", "image_shape = \"3,224,224\"\n", "# we also need to specify the number of training samples in the training set\n", "# for caltech it is 15420\n", "num_training_samples = 15420\n", "# specify the number of output classes\n", "num_classes = 257\n", "# batch size for training\n", "mini_batch_size = 128\n", "# number of epochs\n", "epochs = 2\n", "# learning rate\n", "learning_rate = 0.01\n", "top_k=2\n", "# Since we are using transfer learning, we set use_pretrained_model to 1 so that weights can be \n", "# initialized with pre-trained weights\n", "use_pretrained_model = 1" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 훈련\n", "\n", "Amazon SageMaker의 CreateTrainingJob API를 사용하여 훈련을 실행합니다. " ] }, { "cell_type": "code", "execution_count": 4, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Training job name: DEMO-imageclassification-2019-11-04-14-45-13\n", "\n", "Input Data Location: {'S3DataType': 'S3Prefix', 'S3Uri': 's3://sagemaker-seongshj/image-classification-transfer-learning/train/', 'S3DataDistributionType': 'FullyReplicated'}\n", "CPU times: user 1.28 ms, sys: 5.55 ms, total: 6.83 ms\n", "Wall time: 6.42 ms\n" ] } ], "source": [ "%%time\n", "import time\n", "import boto3\n", "from time import gmtime, strftime\n", "\n", "\n", "s3 = boto3.client('s3')\n", "# create unique job name \n", "job_name_prefix = 'DEMO-imageclassification'\n", "timestamp = time.strftime('-%Y-%m-%d-%H-%M-%S', time.gmtime())\n", "job_name = job_name_prefix + timestamp\n", "training_params = \\\n", "{\n", " # specify the training docker image\n", " \"AlgorithmSpecification\": {\n", " \"TrainingImage\": training_image,\n", " \"TrainingInputMode\": \"File\"\n", " },\n", " \"RoleArn\": role,\n", " \"OutputDataConfig\": {\n", " \"S3OutputPath\": 's3://{}/{}/output'.format(bucket, job_name_prefix)\n", " },\n", " \"ResourceConfig\": {\n", " \"InstanceCount\": 1,\n", " \"InstanceType\": \"ml.p2.xlarge\",\n", " \"VolumeSizeInGB\": 50\n", " },\n", " \"TrainingJobName\": job_name,\n", " \"HyperParameters\": {\n", " \"image_shape\": image_shape,\n", " \"num_layers\": str(num_layers),\n", " \"num_training_samples\": str(num_training_samples),\n", " \"num_classes\": str(num_classes),\n", " \"mini_batch_size\": str(mini_batch_size),\n", " \"epochs\": str(epochs),\n", " \"learning_rate\": str(learning_rate),\n", " \"use_pretrained_model\": str(use_pretrained_model)\n", " },\n", " \"StoppingCondition\": {\n", " \"MaxRuntimeInSeconds\": 360000\n", " },\n", "#Training data should be inside a subdirectory called \"train\"\n", "#Validation data should be inside a subdirectory called \"validation\"\n", "#The algorithm currently only supports fullyreplicated model (where data is copied onto each machine)\n", " \"InputDataConfig\": [\n", " {\n", " \"ChannelName\": \"train\",\n", " \"DataSource\": {\n", " \"S3DataSource\": {\n", " \"S3DataType\": \"S3Prefix\",\n", " \"S3Uri\": s3_train,\n", " \"S3DataDistributionType\": \"FullyReplicated\"\n", " }\n", " },\n", " \"ContentType\": \"application/x-recordio\",\n", " \"CompressionType\": \"None\"\n", " },\n", " {\n", " \"ChannelName\": \"validation\",\n", " \"DataSource\": {\n", " \"S3DataSource\": {\n", " \"S3DataType\": \"S3Prefix\",\n", " \"S3Uri\": s3_validation,\n", " \"S3DataDistributionType\": \"FullyReplicated\"\n", " }\n", " },\n", " \"ContentType\": \"application/x-recordio\",\n", " \"CompressionType\": \"None\"\n", " }\n", " ]\n", "}\n", "print('Training job name: {}'.format(job_name))\n", "print('\\nInput Data Location: {}'.format(training_params['InputDataConfig'][0]['DataSource']['S3DataSource']))" ] }, { "cell_type": "code", "execution_count": 5, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Training job current status: InProgress\n", "Training job ended with status: Completed\n" ] } ], "source": [ "# create the Amazon SageMaker training job\n", "sagemaker = boto3.client(service_name='sagemaker')\n", "sagemaker.create_training_job(**training_params)\n", "\n", "# confirm that the training job has started\n", "status = sagemaker.describe_training_job(TrainingJobName=job_name)['TrainingJobStatus']\n", "print('Training job current status: {}'.format(status))\n", "\n", "try:\n", " # wait for the job to finish and report the ending status\n", " sagemaker.get_waiter('training_job_completed_or_stopped').wait(TrainingJobName=job_name)\n", " training_info = sagemaker.describe_training_job(TrainingJobName=job_name)\n", " status = training_info['TrainingJobStatus']\n", " print(\"Training job ended with status: \" + status)\n", "except:\n", " print('Training failed to start')\n", " # if exception is raised, that means it has failed\n", " message = sagemaker.describe_training_job(TrainingJobName=job_name)['FailureReason']\n", " print('Training failed with the following error: {}'.format(message))" ] }, { "cell_type": "code", "execution_count": 6, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Training job ended with status: Completed\n" ] } ], "source": [ "training_info = sagemaker.describe_training_job(TrainingJobName=job_name)\n", "status = training_info['TrainingJobStatus']\n", "print(\"Training job ended with status: \" + status)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "다음 메시지를 보게 되면, \n", "> `Training job ended with status: Completed`\n", "\n", "훈련이 성공적으로 완료되었고 출력 모델이 `training_params['OutputDataConfig']`에서 지정한 위치에 저장됨을 의미합니다.\n", "\n", "또한 SageMaker 콘솔을 사용하여 Training job의 정보와 상태를 볼 수 있습니다. \"Jobs\" 탭을 클릭하세요. " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 모델 배포하기\n", "\n", "***\n", "\n", "훈련된 모델은 그 자체로는 아무것도 수행하지 않습니다. 이제 추론을 수행하기 위해 모델을 사용하려고 합니다. 이 예제에서는, 주어진 문서를 나타내기 위해 혼합된 토픽들을 예측하는 것을 의미합니다. \n", "\n", "이미지 분류는 현재 추론 입력으로 .jpg와 .png로 인코딩된 이미지 형식만을 지원합니다. 출력은 JSON 형식의 인코딩된 모든 클래스의 확률값이거나 배치변환을 위한 JSON Lines 형식입니다.\n", "\n", "이 섹션은 몇 단계를 포함하고 있습니다. \n", "1. [Create Model](#CreateModel) - 훈련된 결과물로 모델 생성 \n", "1. [Batch Transform](#BatchTransform) - 배치 추론 수행을 위한 transform job 생성\n", "1. [Host the model for realtime inference](#HostTheModel) - 추론 endpoint 생성과 실시간 추론 수행\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### 모델 생성\n", "\n", "이제 훈련된 결과물로 SageMaker 모델을 생성합니다. 모델을 사용하여 Endpoint Configuration을 생성할 수 있습니다. " ] }, { "cell_type": "code", "execution_count": 17, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "model_name: DEMO-image-classification-model--2019-11-04-16-27-33\n", "model_data: s3://sagemaker-seongshj/DEMO-imageclassification/output/DEMO-imageclassification-2019-11-04-14-45-13/output/model.tar.gz\n", "ModelArn: arn:aws:sagemaker:us-east-1:415373942856:model/demo-image-classification-model--2019-11-04-16-27-33\n", "CPU times: user 157 ms, sys: 0 ns, total: 157 ms\n", "Wall time: 438 ms\n" ] } ], "source": [ "%%time\n", "import boto3\n", "from time import gmtime, strftime\n", "\n", "sage = boto3.Session().client(service_name='sagemaker') \n", "\n", "model_name=\"DEMO-image-classification-model-\" + time.strftime('-%Y-%m-%d-%H-%M-%S', time.gmtime())\n", "print(\"model_name: {}\".format(model_name))\n", "info = sage.describe_training_job(TrainingJobName=job_name)\n", "model_data = info['ModelArtifacts']['S3ModelArtifacts']\n", "print(\"model_data: {}\".format(model_data))\n", "\n", "hosting_image = get_image_uri(boto3.Session().region_name, 'image-classification')\n", "\n", "primary_container = {\n", " 'Image': hosting_image,\n", " 'ModelDataUrl': model_data,\n", "}\n", "\n", "create_model_response = sage.create_model(\n", " ModelName = model_name,\n", " ExecutionRoleArn = role,\n", " PrimaryContainer = primary_container)\n", "\n", "print(\"ModelArn: {}\".format(create_model_response['ModelArn']))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### Batch transform\n", "\n", "이제 배치 예측을 수행하기 위해, 위에서 생성한 모델을 사용하여 SageMaker Batch Transform job을 생성합니다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "#### 테스트 데이터 다운로드하기\n" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [ "# Download images under /008.bathtub\n", "!wget -r -np -nH --cut-dirs=2 -P /tmp/ -R \"index.html*\" http://www.vision.caltech.edu/Image_Datasets/Caltech256/images/008.bathtub/\n" ] }, { "cell_type": "code", "execution_count": 19, "metadata": {}, "outputs": [], "source": [ "batch_input = 's3://{}/image-classification-transfer-learning/test/'.format(bucket)\n", "test_images = '/tmp/images/008.bathtub'\n", "\n", "!aws s3 cp $test_images $batch_input --recursive --quiet " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "#### Batch transform job 생성하기" ] }, { "cell_type": "code", "execution_count": 20, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Transform job name: image-classification-model-2019-11-04-16-33-08\n", "\n", "Input Data Location: s3://sagemaker-seongshj/image-classification-transfer-learning/validation/\n" ] } ], "source": [ "timestamp = time.strftime('-%Y-%m-%d-%H-%M-%S', time.gmtime())\n", "batch_job_name = \"image-classification-model\" + timestamp\n", "request = \\\n", "{\n", " \"TransformJobName\": batch_job_name,\n", " \"ModelName\": model_name,\n", " \"MaxConcurrentTransforms\": 16,\n", " \"MaxPayloadInMB\": 6,\n", " \"BatchStrategy\": \"SingleRecord\",\n", " \"TransformOutput\": {\n", " \"S3OutputPath\": 's3://{}/{}/output'.format(bucket, batch_job_name)\n", " },\n", " \"TransformInput\": {\n", " \"DataSource\": {\n", " \"S3DataSource\": {\n", " \"S3DataType\": \"S3Prefix\",\n", " \"S3Uri\": batch_input\n", " }\n", " },\n", " \"ContentType\": \"application/x-image\",\n", " \"SplitType\": \"None\",\n", " \"CompressionType\": \"None\"\n", " },\n", " \"TransformResources\": {\n", " \"InstanceType\": \"ml.p2.xlarge\",\n", " \"InstanceCount\": 1\n", " }\n", "}\n", "\n", "print('Transform job name: {}'.format(batch_job_name))\n", "print('\\nInput Data Location: {}'.format(s3_validation))" ] }, { "cell_type": "code", "execution_count": 21, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Created Transform job with name: image-classification-model-2019-11-04-16-33-08\n", "Transform job ended with status: Completed\n" ] } ], "source": [ "sagemaker = boto3.client('sagemaker')\n", "sagemaker.create_transform_job(**request)\n", "\n", "print(\"Created Transform job with name: \", batch_job_name)\n", "\n", "while(True):\n", " response = sagemaker.describe_transform_job(TransformJobName=batch_job_name)\n", " status = response['TransformJobStatus']\n", " if status == 'Completed':\n", " print(\"Transform job ended with status: \" + status)\n", " break\n", " if status == 'Failed':\n", " message = response['FailureReason']\n", " print('Transform failed with the following error: {}'.format(message))\n", " raise Exception('Transform job failed') \n", " time.sleep(30) " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Job이 완료된 후, 예측 결과를 검사하도록 하겠습니다. epoch를 2로 했기 때문에 좋은 모델을 훈련하기에 충분하지 않아서 정확도는 높지 않을 것입니다. " ] }, { "cell_type": "code", "execution_count": 22, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Sample inputs: ['image-classification-transfer-learning/test/008_0001.jpg', 'image-classification-transfer-learning/test/008_0002.jpg']\n", "Sample output: ['image-classification-model-2019-11-04-16-33-08/output/008_0001.jpg.out', 'image-classification-model-2019-11-04-16-33-08/output/008_0002.jpg.out']\n", "Result: label - bathtub, probability - 0.5867798924446106\n", "Result: label - birdbath, probability - 0.5136487483978271\n", "Result: label - diamond-ring, probability - 0.10593155771493912\n", "Result: label - bathtub, probability - 0.3399357497692108\n", "Result: label - bathtub, probability - 0.49366670846939087\n", "Result: label - washing-machine, probability - 0.21169473230838776\n", "Result: label - bathtub, probability - 0.8909815549850464\n", "Result: label - teapot, probability - 0.8619575500488281\n", "Result: label - bathtub, probability - 0.6042974591255188\n", "Result: label - bathtub, probability - 0.8098751306533813\n" ] }, { "data": { "text/plain": [ "[('bathtub', 0.5867798924446106),\n", " ('birdbath', 0.5136487483978271),\n", " ('diamond-ring', 0.10593155771493912),\n", " ('bathtub', 0.3399357497692108),\n", " ('bathtub', 0.49366670846939087),\n", " ('washing-machine', 0.21169473230838776),\n", " ('bathtub', 0.8909815549850464),\n", " ('teapot', 0.8619575500488281),\n", " ('bathtub', 0.6042974591255188),\n", " ('bathtub', 0.8098751306533813)]" ] }, "execution_count": 22, "metadata": {}, "output_type": "execute_result" } ], "source": [ "from urllib.parse import urlparse\n", "import json\n", "import numpy as np\n", "\n", "s3_client = boto3.client('s3')\n", "object_categories = ['ak47', 'american-flag', 'backpack', 'baseball-bat', 'baseball-glove', 'basketball-hoop', 'bat', 'bathtub', 'bear', 'beer-mug', 'billiards', 'binoculars', 'birdbath', 'blimp', 'bonsai-101', 'boom-box', 'bowling-ball', 'bowling-pin', 'boxing-glove', 'brain-101', 'breadmaker', 'buddha-101', 'bulldozer', 'butterfly', 'cactus', 'cake', 'calculator', 'camel', 'cannon', 'canoe', 'car-tire', 'cartman', 'cd', 'centipede', 'cereal-box', 'chandelier-101', 'chess-board', 'chimp', 'chopsticks', 'cockroach', 'coffee-mug', 'coffin', 'coin', 'comet', 'computer-keyboard', 'computer-monitor', 'computer-mouse', 'conch', 'cormorant', 'covered-wagon', 'cowboy-hat', 'crab-101', 'desk-globe', 'diamond-ring', 'dice', 'dog', 'dolphin-101', 'doorknob', 'drinking-straw', 'duck', 'dumb-bell', 'eiffel-tower', 'electric-guitar-101', 'elephant-101', 'elk', 'ewer-101', 'eyeglasses', 'fern', 'fighter-jet', 'fire-extinguisher', 'fire-hydrant', 'fire-truck', 'fireworks', 'flashlight', 'floppy-disk', 'football-helmet', 'french-horn', 'fried-egg', 'frisbee', 'frog', 'frying-pan', 'galaxy', 'gas-pump', 'giraffe', 'goat', 'golden-gate-bridge', 'goldfish', 'golf-ball', 'goose', 'gorilla', 'grand-piano-101', 'grapes', 'grasshopper', 'guitar-pick', 'hamburger', 'hammock', 'harmonica', 'harp', 'harpsichord', 'hawksbill-101', 'head-phones', 'helicopter-101', 'hibiscus', 'homer-simpson', 'horse', 'horseshoe-crab', 'hot-air-balloon', 'hot-dog', 'hot-tub', 'hourglass', 'house-fly', 'human-skeleton', 'hummingbird', 'ibis-101', 'ice-cream-cone', 'iguana', 'ipod', 'iris', 'jesus-christ', 'joy-stick', 'kangaroo-101', 'kayak', 'ketch-101', 'killer-whale', 'knife', 'ladder', 'laptop-101', 'lathe', 'leopards-101', 'license-plate', 'lightbulb', 'light-house', 'lightning', 'llama-101', 'mailbox', 'mandolin', 'mars', 'mattress', 'megaphone', 'menorah-101', 'microscope', 'microwave', 'minaret', 'minotaur', 'motorbikes-101', 'mountain-bike', 'mushroom', 'mussels', 'necktie', 'octopus', 'ostrich', 'owl', 'palm-pilot', 'palm-tree', 'paperclip', 'paper-shredder', 'pci-card', 'penguin', 'people', 'pez-dispenser', 'photocopier', 'picnic-table', 'playing-card', 'porcupine', 'pram', 'praying-mantis', 'pyramid', 'raccoon', 'radio-telescope', 'rainbow', 'refrigerator', 'revolver-101', 'rifle', 'rotary-phone', 'roulette-wheel', 'saddle', 'saturn', 'school-bus', 'scorpion-101', 'screwdriver', 'segway', 'self-propelled-lawn-mower', 'sextant', 'sheet-music', 'skateboard', 'skunk', 'skyscraper', 'smokestack', 'snail', 'snake', 'sneaker', 'snowmobile', 'soccer-ball', 'socks', 'soda-can', 'spaghetti', 'speed-boat', 'spider', 'spoon', 'stained-glass', 'starfish-101', 'steering-wheel', 'stirrups', 'sunflower-101', 'superman', 'sushi', 'swan', 'swiss-army-knife', 'sword', 'syringe', 'tambourine', 'teapot', 'teddy-bear', 'teepee', 'telephone-box', 'tennis-ball', 'tennis-court', 'tennis-racket', 'theodolite', 'toaster', 'tomato', 'tombstone', 'top-hat', 'touring-bike', 'tower-pisa', 'traffic-light', 'treadmill', 'triceratops', 'tricycle', 'trilobite-101', 'tripod', 't-shirt', 'tuning-fork', 'tweezer', 'umbrella-101', 'unicorn', 'vcr', 'video-projector', 'washing-machine', 'watch-101', 'waterfall', 'watermelon', 'welding-mask', 'wheelbarrow', 'windmill', 'wine-bottle', 'xylophone', 'yarmulke', 'yo-yo', 'zebra', 'airplanes-101', 'car-side-101', 'faces-easy-101', 'greyhound', 'tennis-shoes', 'toad', 'clutter']\n", "\n", "def list_objects(s3_client, bucket, prefix):\n", " response = s3_client.list_objects(Bucket=bucket, Prefix=prefix)\n", " objects = [content['Key'] for content in response['Contents']]\n", " return objects\n", "\n", "def get_label(s3_client, bucket, prefix):\n", " filename = prefix.split('/')[-1]\n", " s3_client.download_file(bucket, prefix, filename)\n", " with open(filename) as f:\n", " data = json.load(f)\n", " index = np.argmax(data['prediction'])\n", " probability = data['prediction'][index]\n", " print(\"Result: label - \" + object_categories[index] + \", probability - \" + str(probability))\n", " return object_categories[index], probability\n", "\n", "inputs = list_objects(s3_client, bucket, urlparse(batch_input).path.lstrip('/'))\n", "print(\"Sample inputs: \" + str(inputs[:2]))\n", "\n", "outputs = list_objects(s3_client, bucket, batch_job_name + \"/output\")\n", "print(\"Sample output: \" + str(outputs[:2]))\n", "\n", "# Check prediction result of the first 2 images\n", "[get_label(s3_client, bucket, prefix) for prefix in outputs[0:10]]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### 실시간 추론\n", "\n", "이제 endpoint로 모델을 호스팅하고 실시간 추론을 수행합니다. \n", "\n", "이 섹션은 몇가지 단계를 포함합니다. \n", "\n", "1. [Endpoint Configuration 생성](#CreateEndpointConfiguration) - Endpoint를 정의하는 configuration 생성\n", "1. [Endpoint 생성](#CreateEndpoint) - inference endpoint를 생성하기 위해 configuration 사용\n", "1. [추론 수행](#PerformInference) - endpoint를 사용하여 일부 입력데이터의 추론 수행\n", "1. [정리](#CleanUp) - endpoint와 모델 삭제" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "#### Endpoint Configuration 생성\n", "\n", "시작 시, A/B 테스팅의 목적과 같이 여러 모델을 호스팅할 수 있는 REST endpoint 구성을 지원합니다. 이것을 지원하기 위해서, 고객은 endpoint configuration을 생성하는데, 그 구성은 분할, 쉐도우 혹은 샘플링 여부와 관계없이 모델 간의 트래픽 분배 방법을 기술합니다. \n", "\n", "추가적으로, endpoint configuration은 모델 배포를 위해 요구되는 인스턴스 유형과 시작 시 autoscaling configuration을 설명합니다. " ] }, { "cell_type": "code", "execution_count": 23, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Endpoint configuration name: DEMO-imageclassification-epc--2019-11-04-16-58-09\n", "Endpoint configuration arn: arn:aws:sagemaker:us-east-1:415373942856:endpoint-config/demo-imageclassification-epc--2019-11-04-16-58-09\n" ] } ], "source": [ "from time import gmtime, strftime\n", "\n", "timestamp = time.strftime('-%Y-%m-%d-%H-%M-%S', time.gmtime())\n", "endpoint_config_name = job_name_prefix + '-epc-' + timestamp\n", "endpoint_config_response = sage.create_endpoint_config(\n", " EndpointConfigName = endpoint_config_name,\n", " ProductionVariants=[{\n", " 'InstanceType':'ml.m4.xlarge',\n", " 'InitialInstanceCount':1,\n", " 'ModelName':model_name,\n", " 'VariantName':'AllTraffic'}])\n", "\n", "print('Endpoint configuration name: {}'.format(endpoint_config_name))\n", "print('Endpoint configuration arn: {}'.format(endpoint_config_response['EndpointConfigArn']))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "#### Endpoint 생성\n", "\n", "마지막으로, 고객은 위에서 정의한 이름과 configuration에서 지정한 모델을 서비스하는 endpoint를 생성합니다. \n", "최종 결과는 검증과 프로덕션 어플리케이션과 통합될 수 있는 endpoint입니다. 이 작업이 완료되기까지 9-11분이 걸립니다. " ] }, { "cell_type": "code", "execution_count": 24, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Endpoint name: DEMO-imageclassification-ep--2019-11-04-17-02-04\n", "EndpointArn = arn:aws:sagemaker:us-east-1:415373942856:endpoint/demo-imageclassification-ep--2019-11-04-17-02-04\n", "CPU times: user 25.6 ms, sys: 0 ns, total: 25.6 ms\n", "Wall time: 222 ms\n" ] } ], "source": [ "%%time\n", "import time\n", "\n", "timestamp = time.strftime('-%Y-%m-%d-%H-%M-%S', time.gmtime())\n", "endpoint_name = job_name_prefix + '-ep-' + timestamp\n", "print('Endpoint name: {}'.format(endpoint_name))\n", "\n", "endpoint_params = {\n", " 'EndpointName': endpoint_name,\n", " 'EndpointConfigName': endpoint_config_name,\n", "}\n", "endpoint_response = sagemaker.create_endpoint(**endpoint_params)\n", "print('EndpointArn = {}'.format(endpoint_response['EndpointArn']))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "마지막으로 endpoint가 생성이 될 수 있습니다. endpoint를 생성하는 데 다소 시간이 걸릴 수 있습니다..." ] }, { "cell_type": "code", "execution_count": 25, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "EndpointStatus = Creating\n", "Endpoint creation ended with EndpointStatus = InService\n" ] } ], "source": [ "# get the status of the endpoint\n", "response = sagemaker.describe_endpoint(EndpointName=endpoint_name)\n", "status = response['EndpointStatus']\n", "print('EndpointStatus = {}'.format(status))\n", "\n", "\n", "# wait until the status has changed\n", "sagemaker.get_waiter('endpoint_in_service').wait(EndpointName=endpoint_name)\n", "\n", "\n", "# print the status of the endpoint\n", "endpoint_response = sagemaker.describe_endpoint(EndpointName=endpoint_name)\n", "status = endpoint_response['EndpointStatus']\n", "print('Endpoint creation ended with EndpointStatus = {}'.format(status))\n", "\n", "if status != 'InService':\n", " raise Exception('Endpoint creation failed.')" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "이 메시지를 보게 된다면,\n", "\n", "> `Endpoint creation ended with EndpointStatus = InService`\n", "\n", "축하드립니다! 이제 제대로 작동하는 추론 endpoint를 가지게 되었습니다. AWS SageMaker 콘솔의 \"Endpoints\" 탭에으로 이동하여 endpoint configuration과 상태를 확인할 수 있습니다. \n", "\n", "마지막으로 endpoint를 호출할 수 있는 runtime 객체를 만들 것입니다. " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "#### 추론 수행\n", "마지막으로, 고객은 이제 모델을 검증할 수 있습니다. 이전 작업의 결과를 사용하여 클라이언트 라이브러리에서 endpoint를 얻을 수 있습니다. 그리고 그 endpoint를 사용하여 훈련된 모델로부터 분류를 생성할 수 있습니다. " ] }, { "cell_type": "code", "execution_count": 26, "metadata": {}, "outputs": [], "source": [ "import boto3\n", "runtime = boto3.Session().client(service_name='runtime.sagemaker') " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "##### 테스트 이미지를 다운로드하기" ] }, { "cell_type": "code", "execution_count": 27, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "--2019-11-04 17:15:01-- http://www.vision.caltech.edu/Image_Datasets/Caltech256/images/008.bathtub/008_0007.jpg\n", "Resolving www.vision.caltech.edu (www.vision.caltech.edu)... 34.208.54.77\n", "Connecting to www.vision.caltech.edu (www.vision.caltech.edu)|34.208.54.77|:80... connected.\n", "HTTP request sent, awaiting response... 200 OK\n", "Length: 23750 (23K) [image/jpeg]\n", "Saving to: ‘/tmp/test.jpg’\n", "\n", "/tmp/test.jpg 100%[===================>] 23.19K --.-KB/s in 0.08s \n", "\n", "2019-11-04 17:15:01 (306 KB/s) - ‘/tmp/test.jpg’ saved [23750/23750]\n", "\n" ] }, { "data": { "image/jpeg": "\n", "text/plain": [ "" ] }, "execution_count": 27, "metadata": {}, "output_type": "execute_result" } ], "source": [ "!wget -O /tmp/test.jpg http://www.vision.caltech.edu/Image_Datasets/Caltech256/images/008.bathtub/008_0007.jpg\n", "file_name = '/tmp/test.jpg'\n", "# test image\n", "from IPython.display import Image\n", "Image(file_name) " ] }, { "cell_type": "code", "execution_count": 28, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Result: label - bathtub, probability - 0.8909816145896912\n" ] } ], "source": [ "import json\n", "import numpy as np\n", "with open(file_name, 'rb') as f:\n", " payload = f.read()\n", " payload = bytearray(payload)\n", "response = runtime.invoke_endpoint(EndpointName=endpoint_name, \n", " ContentType='application/x-image', \n", " Body=payload)\n", "result = response['Body'].read()\n", "# result will be in json format and convert it to ndarray\n", "result = json.loads(result)\n", "# the result will output the probabilities for all classes\n", "# find the class with maximum probability and print the class index\n", "index = np.argmax(result)\n", "object_categories = ['ak47', 'american-flag', 'backpack', 'baseball-bat', 'baseball-glove', 'basketball-hoop', 'bat', 'bathtub', 'bear', 'beer-mug', 'billiards', 'binoculars', 'birdbath', 'blimp', 'bonsai-101', 'boom-box', 'bowling-ball', 'bowling-pin', 'boxing-glove', 'brain-101', 'breadmaker', 'buddha-101', 'bulldozer', 'butterfly', 'cactus', 'cake', 'calculator', 'camel', 'cannon', 'canoe', 'car-tire', 'cartman', 'cd', 'centipede', 'cereal-box', 'chandelier-101', 'chess-board', 'chimp', 'chopsticks', 'cockroach', 'coffee-mug', 'coffin', 'coin', 'comet', 'computer-keyboard', 'computer-monitor', 'computer-mouse', 'conch', 'cormorant', 'covered-wagon', 'cowboy-hat', 'crab-101', 'desk-globe', 'diamond-ring', 'dice', 'dog', 'dolphin-101', 'doorknob', 'drinking-straw', 'duck', 'dumb-bell', 'eiffel-tower', 'electric-guitar-101', 'elephant-101', 'elk', 'ewer-101', 'eyeglasses', 'fern', 'fighter-jet', 'fire-extinguisher', 'fire-hydrant', 'fire-truck', 'fireworks', 'flashlight', 'floppy-disk', 'football-helmet', 'french-horn', 'fried-egg', 'frisbee', 'frog', 'frying-pan', 'galaxy', 'gas-pump', 'giraffe', 'goat', 'golden-gate-bridge', 'goldfish', 'golf-ball', 'goose', 'gorilla', 'grand-piano-101', 'grapes', 'grasshopper', 'guitar-pick', 'hamburger', 'hammock', 'harmonica', 'harp', 'harpsichord', 'hawksbill-101', 'head-phones', 'helicopter-101', 'hibiscus', 'homer-simpson', 'horse', 'horseshoe-crab', 'hot-air-balloon', 'hot-dog', 'hot-tub', 'hourglass', 'house-fly', 'human-skeleton', 'hummingbird', 'ibis-101', 'ice-cream-cone', 'iguana', 'ipod', 'iris', 'jesus-christ', 'joy-stick', 'kangaroo-101', 'kayak', 'ketch-101', 'killer-whale', 'knife', 'ladder', 'laptop-101', 'lathe', 'leopards-101', 'license-plate', 'lightbulb', 'light-house', 'lightning', 'llama-101', 'mailbox', 'mandolin', 'mars', 'mattress', 'megaphone', 'menorah-101', 'microscope', 'microwave', 'minaret', 'minotaur', 'motorbikes-101', 'mountain-bike', 'mushroom', 'mussels', 'necktie', 'octopus', 'ostrich', 'owl', 'palm-pilot', 'palm-tree', 'paperclip', 'paper-shredder', 'pci-card', 'penguin', 'people', 'pez-dispenser', 'photocopier', 'picnic-table', 'playing-card', 'porcupine', 'pram', 'praying-mantis', 'pyramid', 'raccoon', 'radio-telescope', 'rainbow', 'refrigerator', 'revolver-101', 'rifle', 'rotary-phone', 'roulette-wheel', 'saddle', 'saturn', 'school-bus', 'scorpion-101', 'screwdriver', 'segway', 'self-propelled-lawn-mower', 'sextant', 'sheet-music', 'skateboard', 'skunk', 'skyscraper', 'smokestack', 'snail', 'snake', 'sneaker', 'snowmobile', 'soccer-ball', 'socks', 'soda-can', 'spaghetti', 'speed-boat', 'spider', 'spoon', 'stained-glass', 'starfish-101', 'steering-wheel', 'stirrups', 'sunflower-101', 'superman', 'sushi', 'swan', 'swiss-army-knife', 'sword', 'syringe', 'tambourine', 'teapot', 'teddy-bear', 'teepee', 'telephone-box', 'tennis-ball', 'tennis-court', 'tennis-racket', 'theodolite', 'toaster', 'tomato', 'tombstone', 'top-hat', 'touring-bike', 'tower-pisa', 'traffic-light', 'treadmill', 'triceratops', 'tricycle', 'trilobite-101', 'tripod', 't-shirt', 'tuning-fork', 'tweezer', 'umbrella-101', 'unicorn', 'vcr', 'video-projector', 'washing-machine', 'watch-101', 'waterfall', 'watermelon', 'welding-mask', 'wheelbarrow', 'windmill', 'wine-bottle', 'xylophone', 'yarmulke', 'yo-yo', 'zebra', 'airplanes-101', 'car-side-101', 'faces-easy-101', 'greyhound', 'tennis-shoes', 'toad', 'clutter']\n", "print(\"Result: label - \" + object_categories[index] + \", probability - \" + str(result[index]))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 정리\n", "\n", "endpoint 작업이 완료되면 이를 삭제하는데, 뒷단의 인스턴스들도 해제가 됩니다. endpoint를 삭제하기 위해 다음 셀을 실행하시기 바랍니다. " ] }, { "cell_type": "code", "execution_count": 29, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "{'ResponseMetadata': {'RequestId': '543c291e-8aa9-483c-be47-906fd5504e30',\n", " 'HTTPStatusCode': 200,\n", " 'HTTPHeaders': {'x-amzn-requestid': '543c291e-8aa9-483c-be47-906fd5504e30',\n", " 'content-type': 'application/x-amz-json-1.1',\n", " 'content-length': '0',\n", " 'date': 'Mon, 04 Nov 2019 17:19:29 GMT'},\n", " 'RetryAttempts': 0}}" ] }, "execution_count": 29, "metadata": {}, "output_type": "execute_result" } ], "source": [ "sage.delete_endpoint(EndpointName=endpoint_name)" ] }, { "cell_type": "code", "execution_count": null, "metadata": { "collapsed": true, "jupyter": { "outputs_hidden": true } }, "outputs": [], "source": [] } ], "metadata": { "celltoolbar": "Tags", "kernelspec": { "display_name": "conda_mxnet_p36", "language": "python", "name": "conda_mxnet_p36" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.6.5" } }, "nbformat": 4, "nbformat_minor": 4 }