{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Lab 1-1: Train Hugging Face Transformers on Local Environment\n", "\n", "### Multi-Class Classification with Naver Movie dataset and Hugging Face `Trainer` \n", "---" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Introduction\n", "---\n", "\n", "본 모듈에서는 Hugging Face `transformers` 및 `datasets` 라이브러리를 사용하여 한국어 텍스트 감성 분류 파인 튜닝을 수행합니다. 파인 튜닝한 모델은 SageMaker 상에서 실시간 엔드포인트(real-time endpoint)/비동기 엔드포인트(asynchronous endpoint)/배치 변환(batch transform)/서버리스 엔드포인트(serverless endpoint)의 다양한 형태로 배포할 수 있으며, 모델 아티팩트를 Hugging Face Hub에 등록하여 아래와 같이 추론 결과를 웹으로 확인할 수도 있습니다.\n", "\n", "Reference: https://huggingface.co/docs/transformers/training\n", "\n", "_**Note: SageMaker Studio Lab, SageMaker Studio, SageMaker 노트북 인스턴스, 또는 여러분의 로컬 머신에서 이 데모를 실행할 수 있습니다. SageMaker Studio Lab을 사용하는 경우 GPU를 활성화하세요.**_" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [ "import os\n", "\n", "try:\n", " import torch\n", "except ImportError:\n", " os.system('pip install torch==1.8.1')" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "
\n", " \n", "이 예제 노트북은 **transformers v4.11.0** 이상이 필요합니다. \n", "아래 코드 셀은 핸즈온에 필요한 라이브러리들을 설치하고, 주피터 노트북 커널을 셧다운시킵니다. \n", " \n", "노트북 커널이 셧다운된다면, 아래 코드 셀에서 install_needed = False로 변경 후, 코드 셀을 다시 실행해 주세요. 이 작업은 한 번만 수행하면 됩니다. \n", "