{
 "cells": [
  {
   "cell_type": "markdown",
   "id": "96318fea-4fd8-430c-849c-f710c5c137fb",
   "metadata": {},
   "source": [
    "Orignial Code\n",
    "\n",
    "* https://colab.research.google.com/drive/1OQKVceFY_rx4Y74fXlvxyPGAkeyY3Rp9?usp=sharing#scrollTo=QM3wab7on7jH\n",
    "\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 1,
   "id": "549d6e9d-4c67-4cff-b2e3-d9e8a8c83890",
   "metadata": {
    "tags": []
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "/home/ec2-user/SageMaker/Kor-LLM-On-SageMaker/alpaca-lora\n"
     ]
    }
   ],
   "source": [
    "%cd alpaca-lora"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 1,
   "id": "5f4a0d0d-fd6b-4b16-ad3b-c81857d6a075",
   "metadata": {
    "tags": []
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "fatal: destination path 'alpaca-lora' already exists and is not an empty directory.\n",
      "/home/ec2-user/SageMaker/Kor-LLM-On-SageMaker/alpaca-lora\n"
     ]
    }
   ],
   "source": [
    "# !git clone -q https://github.com/kairess/alpaca-lora.git\n",
    "# %cd alpaca-lora\n",
    "# !pip install -r requirements.txt -q\n",
    "# !pip uninstall peft -y -q \n",
    "# !pip install -q git+https://github.com/huggingface/peft.git@e536616888d51b453ed354a6f1e243fecb02ea08"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 1,
   "id": "c8236c8f-c89d-4461-99d5-2b123806503a",
   "metadata": {
    "tags": []
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "test\n"
     ]
    }
   ],
   "source": [
    "print(\"test\")"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 9,
   "id": "9fb20dd2-e6df-4325-ac83-6c3df4731ae4",
   "metadata": {
    "tags": []
   },
   "outputs": [
    {
     "data": {
      "text/plain": [
       "49620"
      ]
     },
     "execution_count": 9,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "len(dataset)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 7,
   "id": "f2cdc8f5-e7ee-4357-bb50-45442ff9426d",
   "metadata": {
    "tags": []
   },
   "outputs": [
    {
     "data": {
      "text/plain": [
       "[{'instruction': '건강을 유지하기 위한 세 가지 팁을 알려주세요.',\n",
       "  'input': '',\n",
       "  'output': '세 가지 팁은 아침식사를 꼭 챙기며, 충분한 수면을 취하고, 적극적으로 운동을 하는 것입니다.'},\n",
       " {'instruction': '세 가지 기본 색은 무엇인가요?',\n",
       "  'input': '',\n",
       "  'output': '기본 색은 빨강, 파랑, 노랑입니다.'},\n",
       " {'instruction': '원자의 구조를 설명하세요.',\n",
       "  'input': '',\n",
       "  'output': '원자는 양성자, 중성자, 전자로 구성되어 있으며, 양성자와 중성자는 원자핵 안에 있고 전자는 주변에 있습니다.'},\n",
       " {'instruction': '대기 오염을 어떻게 줄일 수 있나요?',\n",
       "  'input': '',\n",
       "  'output': '대기 오염을 줄이기 위해 자동차 대신 대중교통을 이용하고, 미세먼지 배출량을 줄이기 위해 차량 정기 검사를 받아야 합니다. 또한 에너지 절약을 위해 전기를 아끼고, 나무를 심어 대기 오염을 줄일 수 있습니다.'},\n",
       " {'instruction': '어려운 결정을 내려야 했던 때를 설명하세요.',\n",
       "  'input': '',\n",
       "  'output': '제가 어려운 결정을 내려야 했던 때는 대학원 졸업 후 직장을 찾아야 했던 때입니다. 다양한 선택지가 있었지만 나의 관심사와 비전에 가장 부합하는 경력을 뽑는데 어려움이 있었습니다. 이 때 여러 사람들의 조언과 현재 상황에 대한 깊은 고민 끝에 적절한 선택을 내리게 되었습니다.'},\n",
       " {'instruction': '홀수 중 하나를 밝히세요.',\n",
       "  'input': '트위터, 인스타그램, 텔레그램',\n",
       "  'output': '텔레그램입니다.'},\n",
       " {'instruction': '다음 분수가 1/4에 해당하는 이유를 설명하세요.',\n",
       "  'input': '4/16',\n",
       "  'output': '분모와 분자를 모두 4로 나눌 수 있기 때문에 1/4에 해당합니다.'},\n",
       " {'instruction': '중요한 진로 결정을 내려야 하는 주인공의 이야기를 3인칭 내레이션으로 단편 소설을 쓰세요.',\n",
       "  'input': '',\n",
       "  'output': '안나는 여러 대학교의 입학 가능성이 있었으나, 제발스러운 직업들을 향해 유혹 당하는 경향이 있어 본인이 가진 진로와 관심사에 맞도록 철저히 검토한 결과, 건축학과를 준비하는 과정에 들어갑니다. 딱 이 시점에서, 안나는 과거의 잘못된 선택 때문에 확고한 결정을 내리기 매우 힘들다는 것에 고통을 겪게 됩니다. 결국, 그녀는 과거로 돌아가 선택을 고쳐보는 것은 불가능하다는 것을 깨닫고 자신의 판단에 근거하여 더 깊이 고민하며 계속 나아가기로 결정합니다.'},\n",
       " {'instruction': '집의 3D 모델을 렌더링합니다.',\n",
       "  'input': '',\n",
       "  'output': '집의 3D 모델링 결과물 입니다. (이미지 첨부)'},\n",
       " {'instruction': '이 문장에 철자와 문법 오류가 있는지 평가하세요.',\n",
       "  'input': '그는 식사를 마치고 식당을 나섰습니다.',\n",
       "  'output': '그 문장에는 철자나 문법에 대한 오류가 없습니다.'}]"
      ]
     },
     "execution_count": 7,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "!wget -q https://github.com/Beomi/KoAlpaca/raw/main/ko_alpaca_data.json\n",
    "\n",
    "import json\n",
    "\n",
    "with open('ko_alpaca_data.json', 'r') as f:\n",
    "    dataset = json.load(f)\n",
    "\n",
    "dataset[:10]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "id": "7bf7c1d1-492b-4963-b9f4-42809b3265c0",
   "metadata": {
    "tags": []
   },
   "outputs": [],
   "source": [
    "import json\n",
    "\n",
    "prompt_template = {\n",
    "    \"description\": \"Alpaca-LoRA Custom 템플릿\",\n",
    "    \"prompt_input\": (\n",
    "        \"Below is an instruction that describes a task, paired with an input that provides further context.\\n\"\n",
    "        \"아래는 작업을 설명하는 명령어와 추가적 맥락을 제공하는 입력이 짝을 이루는 예제입니다.\\n\\n\"\n",
    "        \"Write a response that appropriately completes the request.\\n요청을 적절히 완료하는 응답을 작성하세요.\\n\\n\"\n",
    "        \"### Instruction(명령어):\\n{instruction}\\n\\n### Input(입력):\\n{input}\\n\\n### Response:\\n\"\n",
    "    ),\n",
    "    \"prompt_no_input\": (\n",
    "        \"Below is an instruction that describes a task.\\n\"\n",
    "        \"아래는 작업을 설명하는 명령어입니다.\\n\\n\"\n",
    "        \"Write a response that appropriately completes the request.\\n명령어에 따른 요청을 적절히 완료하는 응답을 작성하세요.\\n\\n\"\n",
    "        \"### Instruction(명령어):\\n{instruction}\\n\\n### Response:\\n\"\n",
    "    ),\n",
    "    \"response_split\": \"### Response:\",\n",
    "}\n",
    "\n",
    "with open('templates/custom.json', 'w', encoding='utf-8') as f:\n",
    "    json.dump(prompt_template, f, ensure_ascii=False)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "id": "a29d125a-0686-45fb-90cc-2aa7001bde01",
   "metadata": {
    "collapsed": true,
    "jupyter": {
     "outputs_hidden": true
    },
    "tags": []
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "\n",
      "===================================BUG REPORT===================================\n",
      "Welcome to bitsandbytes. For bug reports, please run\n",
      "\n",
      "python -m bitsandbytes\n",
      "\n",
      " and submit this information together with your error trace to: https://github.com/TimDettmers/bitsandbytes/issues\n",
      "================================================================================\n",
      "bin /home/ec2-user/anaconda3/envs/python3/lib/python3.10/site-packages/bitsandbytes/libbitsandbytes_cuda110_nocublaslt.so\n",
      "/home/ec2-user/anaconda3/envs/python3/lib/python3.10/site-packages/bitsandbytes/cuda_setup/main.py:145: UserWarning: /home/ec2-user/anaconda3/envs/python3 did not contain ['libcudart.so', 'libcudart.so.11.0', 'libcudart.so.12.0'] as expected! Searching further paths...\n",
      "  warn(msg)\n",
      "/home/ec2-user/anaconda3/envs/python3/lib/python3.10/site-packages/bitsandbytes/cuda_setup/main.py:145: UserWarning: WARNING: The following directories listed in your path were found to be non-existent: {PosixPath('/opt/amazon/efa/lib')}\n",
      "  warn(msg)\n",
      "CUDA SETUP: CUDA runtime path found: /usr/local/cuda-11.0/lib64/libcudart.so\n",
      "CUDA SETUP: Highest compute capability among GPUs detected: 7.0\n",
      "CUDA SETUP: Detected CUDA version 110\n",
      "/home/ec2-user/anaconda3/envs/python3/lib/python3.10/site-packages/bitsandbytes/cuda_setup/main.py:145: UserWarning: WARNING: Compute capability < 7.5 detected! Only slow 8-bit matmul is supported for your GPU!\n",
      "  warn(msg)\n",
      "CUDA SETUP: Loading binary /home/ec2-user/anaconda3/envs/python3/lib/python3.10/site-packages/bitsandbytes/libbitsandbytes_cuda110_nocublaslt.so...\n",
      "Training Alpaca-LoRA model with params:\n",
      "base_model: decapoda-research/llama-7b-hf\n",
      "data_path: ko_alpaca_data.json\n",
      "output_dir: ./output\n",
      "batch_size: 512\n",
      "micro_batch_size: 16\n",
      "num_epochs: 1\n",
      "learning_rate: 0.0005\n",
      "cutoff_len: 256\n",
      "val_set_size: 2000\n",
      "lora_r: 8\n",
      "lora_alpha: 16\n",
      "lora_dropout: 0.05\n",
      "lora_target_modules: ['q_proj', 'v_proj']\n",
      "train_on_inputs: True\n",
      "add_eos_token: False\n",
      "group_by_length: False\n",
      "wandb_project: \n",
      "wandb_run_name: \n",
      "wandb_watch: \n",
      "wandb_log_model: \n",
      "resume_from_checkpoint: False\n",
      "prompt template: custom\n",
      "\n",
      "Downloading (…)lve/main/config.json: 100%|█████| 427/427 [00:00<00:00, 3.05MB/s]\n",
      "Downloading (…)model.bin.index.json: 100%|██| 25.5k/25.5k [00:00<00:00, 113MB/s]\n",
      "Downloading shards:   0%|                                | 0/33 [00:00<?, ?it/s]\n",
      "Downloading (…)l-00001-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00001-of-00033.bin:   5%|▏  | 21.0M/405M [00:00<00:01, 192MB/s]\u001b[A\n",
      "Downloading (…)l-00001-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:01, 200MB/s]\u001b[A\n",
      "Downloading (…)l-00001-of-00033.bin:  23%|▋  | 94.4M/405M [00:00<00:01, 289MB/s]\u001b[A\n",
      "Downloading (…)l-00001-of-00033.bin:  36%|█▍  | 147M/405M [00:00<00:00, 360MB/s]\u001b[A\n",
      "Downloading (…)l-00001-of-00033.bin:  47%|█▊  | 189M/405M [00:00<00:00, 331MB/s]\u001b[A\n",
      "Downloading (…)l-00001-of-00033.bin:  57%|██▎ | 231M/405M [00:00<00:00, 336MB/s]\u001b[A\n",
      "Downloading (…)l-00001-of-00033.bin:  67%|██▋ | 273M/405M [00:00<00:00, 329MB/s]\u001b[A\n",
      "Downloading (…)l-00001-of-00033.bin:  78%|███ | 315M/405M [00:00<00:00, 351MB/s]\u001b[A\n",
      "Downloading (…)l-00001-of-00033.bin:  88%|███▌| 357M/405M [00:01<00:00, 350MB/s]\u001b[A\n",
      "Downloading (…)l-00001-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 327MB/s]\u001b[A\n",
      "Downloading shards:   3%|▋                       | 1/33 [00:01<00:41,  1.31s/it]\n",
      "Downloading (…)l-00002-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00002-of-00033.bin:  13%|▍  | 52.4M/405M [00:00<00:00, 455MB/s]\u001b[A\n",
      "Downloading (…)l-00002-of-00033.bin:  26%|█   | 105M/405M [00:00<00:00, 335MB/s]\u001b[A\n",
      "Downloading (…)l-00002-of-00033.bin:  36%|█▍  | 147M/405M [00:00<00:00, 363MB/s]\u001b[A\n",
      "Downloading (…)l-00002-of-00033.bin:  49%|█▉  | 199M/405M [00:00<00:00, 406MB/s]\u001b[A\n",
      "Downloading (…)l-00002-of-00033.bin:  62%|██▍ | 252M/405M [00:00<00:00, 427MB/s]\u001b[A\n",
      "Downloading (…)l-00002-of-00033.bin:  75%|███ | 304M/405M [00:00<00:00, 398MB/s]\u001b[A\n",
      "Downloading (…)l-00002-of-00033.bin:  88%|███▌| 357M/405M [00:00<00:00, 388MB/s]\u001b[A\n",
      "Downloading (…)l-00002-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 383MB/s]\u001b[A\n",
      "Downloading shards:   6%|█▍                      | 2/33 [00:02<00:36,  1.17s/it]\n",
      "Downloading (…)l-00003-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00003-of-00033.bin:   8%|▏  | 31.5M/405M [00:00<00:01, 194MB/s]\u001b[A\n",
      "Downloading (…)l-00003-of-00033.bin:  16%|▍  | 62.9M/405M [00:00<00:01, 244MB/s]\u001b[A\n",
      "Downloading (…)l-00003-of-00033.bin:  26%|█   | 105M/405M [00:00<00:01, 294MB/s]\u001b[A\n",
      "Downloading (…)l-00003-of-00033.bin:  36%|█▍  | 147M/405M [00:00<00:00, 328MB/s]\u001b[A\n",
      "Downloading (…)l-00003-of-00033.bin:  47%|█▊  | 189M/405M [00:00<00:00, 337MB/s]\u001b[A\n",
      "Downloading (…)l-00003-of-00033.bin:  60%|██▍ | 241M/405M [00:00<00:00, 383MB/s]\u001b[A\n",
      "Downloading (…)l-00003-of-00033.bin:  73%|██▉ | 294M/405M [00:00<00:00, 411MB/s]\u001b[A\n",
      "Downloading (…)l-00003-of-00033.bin:  85%|███▍| 346M/405M [00:00<00:00, 432MB/s]\u001b[A\n",
      "Downloading (…)l-00003-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 380MB/s]\u001b[A\n",
      "Downloading shards:   9%|██▏                     | 3/33 [00:03<00:34,  1.14s/it]\n",
      "Downloading (…)l-00004-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00004-of-00033.bin:   5%|▏  | 21.0M/405M [00:00<00:02, 166MB/s]\u001b[A\n",
      "Downloading (…)l-00004-of-00033.bin:  13%|▍  | 52.4M/405M [00:00<00:01, 219MB/s]\u001b[A\n",
      "Downloading (…)l-00004-of-00033.bin:  23%|▋  | 94.4M/405M [00:00<00:01, 282MB/s]\u001b[A\n",
      "Downloading (…)l-00004-of-00033.bin:  31%|█▏  | 126M/405M [00:00<00:00, 291MB/s]\u001b[A\n",
      "Downloading (…)l-00004-of-00033.bin:  41%|█▋  | 168M/405M [00:00<00:00, 312MB/s]\u001b[A\n",
      "Downloading (…)l-00004-of-00033.bin:  52%|██  | 210M/405M [00:00<00:00, 326MB/s]\u001b[A\n",
      "Downloading (…)l-00004-of-00033.bin:  62%|██▍ | 252M/405M [00:00<00:00, 337MB/s]\u001b[A\n",
      "Downloading (…)l-00004-of-00033.bin:  73%|██▉ | 294M/405M [00:00<00:00, 352MB/s]\u001b[A\n",
      "Downloading (…)l-00004-of-00033.bin:  83%|███▎| 336M/405M [00:01<00:00, 368MB/s]\u001b[A\n",
      "Downloading (…)l-00004-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 335MB/s]\u001b[A\n",
      "Downloading shards:  12%|██▉                     | 4/33 [00:04<00:34,  1.17s/it]\n",
      "Downloading (…)l-00005-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00005-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:00, 411MB/s]\u001b[A\n",
      "Downloading (…)l-00005-of-00033.bin:  21%|▌  | 83.9M/405M [00:00<00:00, 413MB/s]\u001b[A\n",
      "Downloading (…)l-00005-of-00033.bin:  31%|█▏  | 126M/405M [00:00<00:00, 347MB/s]\u001b[A\n",
      "Downloading (…)l-00005-of-00033.bin:  41%|█▋  | 168M/405M [00:00<00:00, 288MB/s]\u001b[A\n",
      "Downloading (…)l-00005-of-00033.bin:  52%|██  | 210M/405M [00:00<00:00, 309MB/s]\u001b[A\n",
      "Downloading (…)l-00005-of-00033.bin:  62%|██▍ | 252M/405M [00:00<00:00, 288MB/s]\u001b[A\n",
      "Downloading (…)l-00005-of-00033.bin:  73%|██▉ | 294M/405M [00:00<00:00, 312MB/s]\u001b[A\n",
      "Downloading (…)l-00005-of-00033.bin:  83%|███▎| 336M/405M [00:01<00:00, 335MB/s]\u001b[A\n",
      "Downloading (…)l-00005-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 334MB/s]\u001b[A\n",
      "Downloading shards:  15%|███▋                    | 5/33 [00:05<00:33,  1.20s/it]\n",
      "Downloading (…)l-00006-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00006-of-00033.bin:   5%|▏  | 21.0M/405M [00:00<00:02, 149MB/s]\u001b[A\n",
      "Downloading (…)l-00006-of-00033.bin:  13%|▍  | 52.4M/405M [00:00<00:01, 211MB/s]\u001b[A\n",
      "Downloading (…)l-00006-of-00033.bin:  26%|█   | 105M/405M [00:00<00:00, 306MB/s]\u001b[A\n",
      "Downloading (…)l-00006-of-00033.bin:  36%|█▍  | 147M/405M [00:00<00:00, 341MB/s]\u001b[A\n",
      "Downloading (…)l-00006-of-00033.bin:  49%|█▉  | 199M/405M [00:00<00:00, 381MB/s]\u001b[A\n",
      "Downloading (…)l-00006-of-00033.bin:  62%|██▍ | 252M/405M [00:00<00:00, 417MB/s]\u001b[A\n",
      "Downloading (…)l-00006-of-00033.bin:  75%|███ | 304M/405M [00:00<00:00, 375MB/s]\u001b[A\n",
      "Downloading (…)l-00006-of-00033.bin:  85%|███▍| 346M/405M [00:00<00:00, 378MB/s]\u001b[A\n",
      "Downloading (…)l-00006-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 341MB/s]\u001b[A\n",
      "Downloading shards:  18%|████▎                   | 6/33 [00:07<00:32,  1.20s/it]\n",
      "Downloading (…)l-00007-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00007-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:01, 356MB/s]\u001b[A\n",
      "Downloading (…)l-00007-of-00033.bin:  23%|▋  | 94.4M/405M [00:00<00:00, 390MB/s]\u001b[A\n",
      "Downloading (…)l-00007-of-00033.bin:  34%|█▎  | 136M/405M [00:00<00:00, 344MB/s]\u001b[A\n",
      "Downloading (…)l-00007-of-00033.bin:  47%|█▊  | 189M/405M [00:00<00:00, 384MB/s]\u001b[A\n",
      "Downloading (…)l-00007-of-00033.bin:  57%|██▎ | 231M/405M [00:00<00:00, 337MB/s]\u001b[A\n",
      "Downloading (…)l-00007-of-00033.bin:  70%|██▊ | 283M/405M [00:00<00:00, 367MB/s]\u001b[A\n",
      "Downloading (…)l-00007-of-00033.bin:  80%|███▏| 325M/405M [00:00<00:00, 345MB/s]\u001b[A\n",
      "Downloading (…)l-00007-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 354MB/s]\u001b[A\n",
      "Downloading shards:  21%|█████                   | 7/33 [00:08<00:30,  1.19s/it]\n",
      "Downloading (…)l-00008-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00008-of-00033.bin:   5%|▏  | 21.0M/405M [00:00<00:02, 153MB/s]\u001b[A\n",
      "Downloading (…)l-00008-of-00033.bin:  13%|▍  | 52.4M/405M [00:00<00:01, 227MB/s]\u001b[A\n",
      "Downloading (…)l-00008-of-00033.bin:  23%|▋  | 94.4M/405M [00:00<00:01, 307MB/s]\u001b[A\n",
      "Downloading (…)l-00008-of-00033.bin:  34%|█▎  | 136M/405M [00:00<00:00, 348MB/s]\u001b[A\n",
      "Downloading (…)l-00008-of-00033.bin:  44%|█▊  | 178M/405M [00:00<00:00, 367MB/s]\u001b[A\n",
      "Downloading (…)l-00008-of-00033.bin:  54%|██▏ | 220M/405M [00:00<00:00, 373MB/s]\u001b[A\n",
      "Downloading (…)l-00008-of-00033.bin:  67%|██▋ | 273M/405M [00:00<00:00, 414MB/s]\u001b[A\n",
      "Downloading (…)l-00008-of-00033.bin:  78%|███ | 315M/405M [00:00<00:00, 392MB/s]\u001b[A\n",
      "Downloading (…)l-00008-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 354MB/s]\u001b[A\n",
      "Downloading shards:  24%|█████▊                  | 8/33 [00:09<00:29,  1.18s/it]\n",
      "Downloading (…)l-00009-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00009-of-00033.bin:   3%|  | 10.5M/405M [00:00<00:04, 96.5MB/s]\u001b[A\n",
      "Downloading (…)l-00009-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:01, 194MB/s]\u001b[A\n",
      "Downloading (…)l-00009-of-00033.bin:  23%|▋  | 94.4M/405M [00:00<00:01, 310MB/s]\u001b[A\n",
      "Downloading (…)l-00009-of-00033.bin:  36%|█▍  | 147M/405M [00:00<00:00, 373MB/s]\u001b[A\n",
      "Downloading (…)l-00009-of-00033.bin:  49%|█▉  | 199M/405M [00:00<00:00, 394MB/s]\u001b[A\n",
      "Downloading (…)l-00009-of-00033.bin:  60%|██▍ | 241M/405M [00:00<00:00, 346MB/s]\u001b[A\n",
      "Downloading (…)l-00009-of-00033.bin:  70%|██▊ | 283M/405M [00:00<00:00, 346MB/s]\u001b[A\n",
      "Downloading (…)l-00009-of-00033.bin:  80%|███▏| 325M/405M [00:00<00:00, 347MB/s]\u001b[A\n",
      "Downloading (…)l-00009-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 347MB/s]\u001b[A\n",
      "Downloading shards:  27%|██████▌                 | 9/33 [00:10<00:28,  1.19s/it]\n",
      "Downloading (…)l-00010-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00010-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:00, 415MB/s]\u001b[A\n",
      "Downloading (…)l-00010-of-00033.bin:  23%|▋  | 94.4M/405M [00:00<00:00, 431MB/s]\u001b[A\n",
      "Downloading (…)l-00010-of-00033.bin:  36%|█▍  | 147M/405M [00:00<00:00, 364MB/s]\u001b[A\n",
      "Downloading (…)l-00010-of-00033.bin:  47%|█▊  | 189M/405M [00:00<00:00, 370MB/s]\u001b[A\n",
      "Downloading (…)l-00010-of-00033.bin:  57%|██▎ | 231M/405M [00:00<00:00, 349MB/s]\u001b[A\n",
      "Downloading (…)l-00010-of-00033.bin:  70%|██▊ | 283M/405M [00:00<00:00, 388MB/s]\u001b[A\n",
      "Downloading (…)l-00010-of-00033.bin:  80%|███▏| 325M/405M [00:00<00:00, 392MB/s]\u001b[A\n",
      "Downloading (…)l-00010-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 368MB/s]\u001b[A\n",
      "Downloading shards:  30%|██████▉                | 10/33 [00:11<00:26,  1.17s/it]\n",
      "Downloading (…)l-00011-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00011-of-00033.bin:   5%|▏  | 21.0M/405M [00:00<00:02, 151MB/s]\u001b[A\n",
      "Downloading (…)l-00011-of-00033.bin:  13%|▍  | 52.4M/405M [00:00<00:01, 221MB/s]\u001b[A\n",
      "Downloading (…)l-00011-of-00033.bin:  26%|█   | 105M/405M [00:00<00:00, 322MB/s]\u001b[A\n",
      "Downloading (…)l-00011-of-00033.bin:  36%|█▍  | 147M/405M [00:00<00:00, 341MB/s]\u001b[A\n",
      "Downloading (…)l-00011-of-00033.bin:  47%|█▊  | 189M/405M [00:00<00:00, 302MB/s]\u001b[A\n",
      "Downloading (…)l-00011-of-00033.bin:  57%|██▎ | 231M/405M [00:00<00:00, 290MB/s]\u001b[A\n",
      "Downloading (…)l-00011-of-00033.bin:  67%|██▋ | 273M/405M [00:00<00:00, 292MB/s]\u001b[A\n",
      "Downloading (…)l-00011-of-00033.bin:  78%|███ | 315M/405M [00:01<00:00, 317MB/s]\u001b[A\n",
      "Downloading (…)l-00011-of-00033.bin:  88%|███▌| 357M/405M [00:01<00:00, 338MB/s]\u001b[A\n",
      "Downloading (…)l-00011-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 315MB/s]\u001b[A\n",
      "Downloading shards:  33%|███████▋               | 11/33 [00:13<00:26,  1.21s/it]\n",
      "Downloading (…)l-00012-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00012-of-00033.bin:   5%|▏  | 21.0M/405M [00:00<00:02, 179MB/s]\u001b[A\n",
      "Downloading (…)l-00012-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:01, 188MB/s]\u001b[A\n",
      "Downloading (…)l-00012-of-00033.bin:  21%|▌  | 83.9M/405M [00:00<00:01, 265MB/s]\u001b[A\n",
      "Downloading (…)l-00012-of-00033.bin:  34%|█▎  | 136M/405M [00:00<00:00, 337MB/s]\u001b[A\n",
      "Downloading (…)l-00012-of-00033.bin:  47%|█▊  | 189M/405M [00:00<00:00, 376MB/s]\u001b[A\n",
      "Downloading (…)l-00012-of-00033.bin:  60%|██▍ | 241M/405M [00:00<00:00, 396MB/s]\u001b[A\n",
      "Downloading (…)l-00012-of-00033.bin:  73%|██▉ | 294M/405M [00:00<00:00, 412MB/s]\u001b[A\n",
      "Downloading (…)l-00012-of-00033.bin:  83%|███▎| 336M/405M [00:00<00:00, 363MB/s]\u001b[A\n",
      "Downloading (…)l-00012-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 347MB/s]\u001b[A\n",
      "Downloading shards:  36%|████████▎              | 12/33 [00:14<00:25,  1.20s/it]\n",
      "Downloading (…)l-00013-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00013-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:00, 382MB/s]\u001b[A\n",
      "Downloading (…)l-00013-of-00033.bin:  21%|▌  | 83.9M/405M [00:00<00:00, 362MB/s]\u001b[A\n",
      "Downloading (…)l-00013-of-00033.bin:  34%|█▎  | 136M/405M [00:00<00:00, 401MB/s]\u001b[A\n",
      "Downloading (…)l-00013-of-00033.bin:  47%|█▊  | 189M/405M [00:00<00:00, 418MB/s]\u001b[A\n",
      "Downloading (…)l-00013-of-00033.bin:  60%|██▍ | 241M/405M [00:00<00:00, 424MB/s]\u001b[A\n",
      "Downloading (…)l-00013-of-00033.bin:  73%|██▉ | 294M/405M [00:00<00:00, 425MB/s]\u001b[A\n",
      "Downloading (…)l-00013-of-00033.bin:  85%|███▍| 346M/405M [00:00<00:00, 429MB/s]\u001b[A\n",
      "Downloading (…)l-00013-of-00033.bin: 100%|████| 405M/405M [00:00<00:00, 418MB/s]\u001b[A\n",
      "Downloading shards:  39%|█████████              | 13/33 [00:15<00:22,  1.14s/it]\n",
      "Downloading (…)l-00014-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00014-of-00033.bin:   5%|▏  | 21.0M/405M [00:00<00:02, 177MB/s]\u001b[A\n",
      "Downloading (…)l-00014-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:02, 174MB/s]\u001b[A\n",
      "Downloading (…)l-00014-of-00033.bin:  21%|▌  | 83.9M/405M [00:00<00:01, 270MB/s]\u001b[A\n",
      "Downloading (…)l-00014-of-00033.bin:  34%|█▎  | 136M/405M [00:00<00:00, 339MB/s]\u001b[A\n",
      "Downloading (…)l-00014-of-00033.bin:  47%|█▊  | 189M/405M [00:00<00:00, 378MB/s]\u001b[A\n",
      "Downloading (…)l-00014-of-00033.bin:  60%|██▍ | 241M/405M [00:00<00:00, 400MB/s]\u001b[A\n",
      "Downloading (…)l-00014-of-00033.bin:  73%|██▉ | 294M/405M [00:00<00:00, 414MB/s]\u001b[A\n",
      "Downloading (…)l-00014-of-00033.bin:  85%|███▍| 346M/405M [00:00<00:00, 420MB/s]\u001b[A\n",
      "Downloading (…)l-00014-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 377MB/s]\u001b[A\n",
      "Downloading shards:  42%|█████████▊             | 14/33 [00:16<00:21,  1.13s/it]\n",
      "Downloading (…)l-00015-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00015-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:00, 417MB/s]\u001b[A\n",
      "Downloading (…)l-00015-of-00033.bin:  23%|▋  | 94.4M/405M [00:00<00:00, 435MB/s]\u001b[A\n",
      "Downloading (…)l-00015-of-00033.bin:  36%|█▍  | 147M/405M [00:00<00:00, 447MB/s]\u001b[A\n",
      "Downloading (…)l-00015-of-00033.bin:  49%|█▉  | 199M/405M [00:00<00:00, 453MB/s]\u001b[A\n",
      "Downloading (…)l-00015-of-00033.bin:  62%|██▍ | 252M/405M [00:00<00:00, 353MB/s]\u001b[A\n",
      "Downloading (…)l-00015-of-00033.bin:  73%|██▉ | 294M/405M [00:00<00:00, 352MB/s]\u001b[A\n",
      "Downloading (…)l-00015-of-00033.bin:  85%|███▍| 346M/405M [00:00<00:00, 384MB/s]\u001b[A\n",
      "Downloading (…)l-00015-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 399MB/s]\u001b[A\n",
      "Downloading shards:  45%|██████████▍            | 15/33 [00:17<00:19,  1.10s/it]\n",
      "Downloading (…)l-00016-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00016-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:00, 391MB/s]\u001b[A\n",
      "Downloading (…)l-00016-of-00033.bin:  23%|▋  | 94.4M/405M [00:00<00:00, 433MB/s]\u001b[A\n",
      "Downloading (…)l-00016-of-00033.bin:  36%|█▍  | 147M/405M [00:00<00:00, 449MB/s]\u001b[A\n",
      "Downloading (…)l-00016-of-00033.bin:  49%|█▉  | 199M/405M [00:00<00:00, 400MB/s]\u001b[A\n",
      "Downloading (…)l-00016-of-00033.bin:  62%|██▍ | 252M/405M [00:00<00:00, 417MB/s]\u001b[A\n",
      "Downloading (…)l-00016-of-00033.bin:  75%|███ | 304M/405M [00:00<00:00, 431MB/s]\u001b[A\n",
      "Downloading (…)l-00016-of-00033.bin:  88%|███▌| 357M/405M [00:00<00:00, 435MB/s]\u001b[A\n",
      "Downloading (…)l-00016-of-00033.bin: 100%|████| 405M/405M [00:00<00:00, 429MB/s]\u001b[A\n",
      "Downloading shards:  48%|███████████▏           | 16/33 [00:18<00:18,  1.06s/it]\n",
      "Downloading (…)l-00017-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00017-of-00033.bin:   5%|▏  | 21.0M/405M [00:00<00:01, 209MB/s]\u001b[A\n",
      "Downloading (…)l-00017-of-00033.bin:  13%|▍  | 52.4M/405M [00:00<00:01, 230MB/s]\u001b[A\n",
      "Downloading (…)l-00017-of-00033.bin:  23%|▋  | 94.4M/405M [00:00<00:01, 301MB/s]\u001b[A\n",
      "Downloading (…)l-00017-of-00033.bin:  36%|█▍  | 147M/405M [00:00<00:00, 366MB/s]\u001b[A\n",
      "Downloading (…)l-00017-of-00033.bin:  47%|█▊  | 189M/405M [00:00<00:00, 362MB/s]\u001b[A\n",
      "Downloading (…)l-00017-of-00033.bin:  60%|██▍ | 241M/405M [00:00<00:00, 387MB/s]\u001b[A\n",
      "Downloading (…)l-00017-of-00033.bin:  70%|██▊ | 283M/405M [00:00<00:00, 364MB/s]\u001b[A\n",
      "Downloading (…)l-00017-of-00033.bin:  83%|███▎| 336M/405M [00:00<00:00, 387MB/s]\u001b[A\n",
      "Downloading (…)l-00017-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 371MB/s]\u001b[A\n",
      "Downloading shards:  52%|███████████▊           | 17/33 [00:19<00:17,  1.08s/it]\n",
      "Downloading (…)l-00018-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00018-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:00, 405MB/s]\u001b[A\n",
      "Downloading (…)l-00018-of-00033.bin:  23%|▋  | 94.4M/405M [00:00<00:00, 444MB/s]\u001b[A\n",
      "Downloading (…)l-00018-of-00033.bin:  36%|█▍  | 147M/405M [00:00<00:00, 459MB/s]\u001b[A\n",
      "Downloading (…)l-00018-of-00033.bin:  49%|█▉  | 199M/405M [00:00<00:00, 457MB/s]\u001b[A\n",
      "Downloading (…)l-00018-of-00033.bin:  62%|██▍ | 252M/405M [00:00<00:00, 458MB/s]\u001b[A\n",
      "Downloading (…)l-00018-of-00033.bin:  75%|███ | 304M/405M [00:00<00:00, 459MB/s]\u001b[A\n",
      "Downloading (…)l-00018-of-00033.bin:  88%|███▌| 357M/405M [00:00<00:00, 403MB/s]\u001b[A\n",
      "Downloading (…)l-00018-of-00033.bin: 100%|████| 405M/405M [00:00<00:00, 425MB/s]\u001b[A\n",
      "Downloading shards:  55%|████████████▌          | 18/33 [00:20<00:15,  1.05s/it]\n",
      "Downloading (…)l-00019-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00019-of-00033.bin:   8%|▏  | 31.5M/405M [00:00<00:01, 237MB/s]\u001b[A\n",
      "Downloading (…)l-00019-of-00033.bin:  16%|▍  | 62.9M/405M [00:00<00:01, 266MB/s]\u001b[A\n",
      "Downloading (…)l-00019-of-00033.bin:  28%|█▏  | 115M/405M [00:00<00:00, 349MB/s]\u001b[A\n",
      "Downloading (…)l-00019-of-00033.bin:  41%|█▋  | 168M/405M [00:00<00:00, 397MB/s]\u001b[A\n",
      "Downloading (…)l-00019-of-00033.bin:  54%|██▏ | 220M/405M [00:00<00:00, 418MB/s]\u001b[A\n",
      "Downloading (…)l-00019-of-00033.bin:  67%|██▋ | 273M/405M [00:00<00:00, 387MB/s]\u001b[A\n",
      "Downloading (…)l-00019-of-00033.bin:  80%|███▏| 325M/405M [00:00<00:00, 400MB/s]\u001b[A\n",
      "Downloading (…)l-00019-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 391MB/s]\u001b[A\n",
      "Downloading shards:  58%|█████████████▏         | 19/33 [00:21<00:14,  1.05s/it]\n",
      "Downloading (…)l-00020-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00020-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:00, 399MB/s]\u001b[A\n",
      "Downloading (…)l-00020-of-00033.bin:  23%|▋  | 94.4M/405M [00:00<00:00, 434MB/s]\u001b[A\n",
      "Downloading (…)l-00020-of-00033.bin:  36%|█▍  | 147M/405M [00:00<00:00, 449MB/s]\u001b[A\n",
      "Downloading (…)l-00020-of-00033.bin:  49%|█▉  | 199M/405M [00:00<00:00, 268MB/s]\u001b[A\n",
      "Downloading (…)l-00020-of-00033.bin:  62%|██▍ | 252M/405M [00:00<00:00, 314MB/s]\u001b[A\n",
      "Downloading (…)l-00020-of-00033.bin:  75%|███ | 304M/405M [00:00<00:00, 351MB/s]\u001b[A\n",
      "Downloading (…)l-00020-of-00033.bin:  85%|███▍| 346M/405M [00:01<00:00, 345MB/s]\u001b[A\n",
      "Downloading (…)l-00020-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 346MB/s]\u001b[A\n",
      "Downloading shards:  61%|█████████████▉         | 20/33 [00:22<00:14,  1.09s/it]\n",
      "Downloading (…)l-00021-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00021-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:00, 387MB/s]\u001b[A\n",
      "Downloading (…)l-00021-of-00033.bin:  23%|▋  | 94.4M/405M [00:00<00:00, 418MB/s]\u001b[A\n",
      "Downloading (…)l-00021-of-00033.bin:  36%|█▍  | 147M/405M [00:00<00:00, 432MB/s]\u001b[A\n",
      "Downloading (…)l-00021-of-00033.bin:  49%|█▉  | 199M/405M [00:00<00:00, 433MB/s]\u001b[A\n",
      "Downloading (…)l-00021-of-00033.bin:  62%|██▍ | 252M/405M [00:00<00:00, 431MB/s]\u001b[A\n",
      "Downloading (…)l-00021-of-00033.bin:  75%|███ | 304M/405M [00:00<00:00, 427MB/s]\u001b[A\n",
      "Downloading (…)l-00021-of-00033.bin:  88%|███▌| 357M/405M [00:00<00:00, 424MB/s]\u001b[A\n",
      "Downloading (…)l-00021-of-00033.bin: 100%|████| 405M/405M [00:00<00:00, 424MB/s]\u001b[A\n",
      "Downloading shards:  64%|██████████████▋        | 21/33 [00:23<00:12,  1.06s/it]\n",
      "Downloading (…)l-00022-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00022-of-00033.bin:   5%|▏  | 21.0M/405M [00:00<00:02, 144MB/s]\u001b[A\n",
      "Downloading (…)l-00022-of-00033.bin:  13%|▍  | 52.4M/405M [00:00<00:01, 219MB/s]\u001b[A\n",
      "Downloading (…)l-00022-of-00033.bin:  26%|█   | 105M/405M [00:00<00:00, 310MB/s]\u001b[A\n",
      "Downloading (…)l-00022-of-00033.bin:  36%|█▍  | 147M/405M [00:00<00:00, 337MB/s]\u001b[A\n",
      "Downloading (…)l-00022-of-00033.bin:  47%|█▊  | 189M/405M [00:00<00:00, 358MB/s]\u001b[A\n",
      "Downloading (…)l-00022-of-00033.bin:  57%|██▎ | 231M/405M [00:00<00:00, 372MB/s]\u001b[A\n",
      "Downloading (…)l-00022-of-00033.bin:  67%|██▋ | 273M/405M [00:00<00:00, 376MB/s]\u001b[A\n",
      "Downloading (…)l-00022-of-00033.bin:  78%|███ | 315M/405M [00:00<00:00, 383MB/s]\u001b[A\n",
      "Downloading (…)l-00022-of-00033.bin:  88%|███▌| 357M/405M [00:01<00:00, 390MB/s]\u001b[A\n",
      "Downloading (…)l-00022-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 356MB/s]\u001b[A\n",
      "Downloading shards:  67%|███████████████▎       | 22/33 [00:24<00:11,  1.09s/it]\n",
      "Downloading (…)l-00023-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00023-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:00, 387MB/s]\u001b[A\n",
      "Downloading (…)l-00023-of-00033.bin:  21%|▌  | 83.9M/405M [00:00<00:00, 398MB/s]\u001b[A\n",
      "Downloading (…)l-00023-of-00033.bin:  34%|█▎  | 136M/405M [00:00<00:00, 411MB/s]\u001b[A\n",
      "Downloading (…)l-00023-of-00033.bin:  44%|█▊  | 178M/405M [00:00<00:00, 413MB/s]\u001b[A\n",
      "Downloading (…)l-00023-of-00033.bin:  54%|██▏ | 220M/405M [00:00<00:00, 415MB/s]\u001b[A\n",
      "Downloading (…)l-00023-of-00033.bin:  67%|██▋ | 273M/405M [00:00<00:00, 423MB/s]\u001b[A\n",
      "Downloading (…)l-00023-of-00033.bin:  80%|███▏| 325M/405M [00:00<00:00, 418MB/s]\u001b[A\n",
      "Downloading (…)l-00023-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 395MB/s]\u001b[A\n",
      "Downloading shards:  70%|████████████████       | 23/33 [00:25<00:10,  1.08s/it]\n",
      "Downloading (…)l-00024-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00024-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:00, 417MB/s]\u001b[A\n",
      "Downloading (…)l-00024-of-00033.bin:  23%|▋  | 94.4M/405M [00:00<00:00, 440MB/s]\u001b[A\n",
      "Downloading (…)l-00024-of-00033.bin:  36%|█▍  | 147M/405M [00:00<00:00, 449MB/s]\u001b[A\n",
      "Downloading (…)l-00024-of-00033.bin:  49%|█▉  | 199M/405M [00:00<00:00, 388MB/s]\u001b[A\n",
      "Downloading (…)l-00024-of-00033.bin:  62%|██▍ | 252M/405M [00:00<00:00, 388MB/s]\u001b[A\n",
      "Downloading (…)l-00024-of-00033.bin:  75%|███ | 304M/405M [00:00<00:00, 403MB/s]\u001b[A\n",
      "Downloading (…)l-00024-of-00033.bin:  88%|███▌| 357M/405M [00:00<00:00, 416MB/s]\u001b[A\n",
      "Downloading (…)l-00024-of-00033.bin: 100%|████| 405M/405M [00:00<00:00, 416MB/s]\u001b[A\n",
      "Downloading shards:  73%|████████████████▋      | 24/33 [00:26<00:09,  1.05s/it]\n",
      "Downloading (…)l-00025-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00025-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:00, 396MB/s]\u001b[A\n",
      "Downloading (…)l-00025-of-00033.bin:  23%|▋  | 94.4M/405M [00:00<00:00, 435MB/s]\u001b[A\n",
      "Downloading (…)l-00025-of-00033.bin:  36%|█▍  | 147M/405M [00:00<00:00, 415MB/s]\u001b[A\n",
      "Downloading (…)l-00025-of-00033.bin:  47%|█▊  | 189M/405M [00:00<00:00, 366MB/s]\u001b[A\n",
      "Downloading (…)l-00025-of-00033.bin:  57%|██▎ | 231M/405M [00:00<00:00, 378MB/s]\u001b[A\n",
      "Downloading (…)l-00025-of-00033.bin:  70%|██▊ | 283M/405M [00:00<00:00, 403MB/s]\u001b[A\n",
      "Downloading (…)l-00025-of-00033.bin:  83%|███▎| 336M/405M [00:00<00:00, 416MB/s]\u001b[A\n",
      "Downloading (…)l-00025-of-00033.bin: 100%|████| 405M/405M [00:00<00:00, 408MB/s]\u001b[A\n",
      "Downloading shards:  76%|█████████████████▍     | 25/33 [00:27<00:08,  1.04s/it]\n",
      "Downloading (…)l-00026-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00026-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:01, 292MB/s]\u001b[A\n",
      "Downloading (…)l-00026-of-00033.bin:  21%|▌  | 83.9M/405M [00:00<00:00, 331MB/s]\u001b[A\n",
      "Downloading (…)l-00026-of-00033.bin:  31%|█▏  | 126M/405M [00:00<00:00, 351MB/s]\u001b[A\n",
      "Downloading (…)l-00026-of-00033.bin:  44%|█▊  | 178M/405M [00:00<00:00, 386MB/s]\u001b[A\n",
      "Downloading (…)l-00026-of-00033.bin:  57%|██▎ | 231M/405M [00:00<00:00, 402MB/s]\u001b[A\n",
      "Downloading (…)l-00026-of-00033.bin:  67%|██▋ | 273M/405M [00:00<00:00, 358MB/s]\u001b[A\n",
      "Downloading (…)l-00026-of-00033.bin:  78%|███ | 315M/405M [00:00<00:00, 370MB/s]\u001b[A\n",
      "Downloading (…)l-00026-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 380MB/s]\u001b[A\n",
      "Downloading shards:  79%|██████████████████     | 26/33 [00:29<00:07,  1.06s/it]\n",
      "Downloading (…)l-00027-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00027-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:00, 396MB/s]\u001b[A\n",
      "Downloading (…)l-00027-of-00033.bin:  23%|▋  | 94.4M/405M [00:00<00:00, 424MB/s]\u001b[A\n",
      "Downloading (…)l-00027-of-00033.bin:  36%|█▍  | 147M/405M [00:00<00:00, 440MB/s]\u001b[A\n",
      "Downloading (…)l-00027-of-00033.bin:  49%|█▉  | 199M/405M [00:00<00:00, 443MB/s]\u001b[A\n",
      "Downloading (…)l-00027-of-00033.bin:  62%|██▍ | 252M/405M [00:00<00:00, 443MB/s]\u001b[A\n",
      "Downloading (…)l-00027-of-00033.bin:  75%|███ | 304M/405M [00:00<00:00, 447MB/s]\u001b[A\n",
      "Downloading (…)l-00027-of-00033.bin:  88%|███▌| 357M/405M [00:00<00:00, 449MB/s]\u001b[A\n",
      "Downloading (…)l-00027-of-00033.bin: 100%|████| 405M/405M [00:00<00:00, 443MB/s]\u001b[A\n",
      "Downloading shards:  82%|██████████████████▊    | 27/33 [00:29<00:06,  1.02s/it]\n",
      "Downloading (…)l-00028-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00028-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:00, 402MB/s]\u001b[A\n",
      "Downloading (…)l-00028-of-00033.bin:  21%|▌  | 83.9M/405M [00:00<00:00, 367MB/s]\u001b[A\n",
      "Downloading (…)l-00028-of-00033.bin:  34%|█▎  | 136M/405M [00:00<00:00, 408MB/s]\u001b[A\n",
      "Downloading (…)l-00028-of-00033.bin:  47%|█▊  | 189M/405M [00:00<00:00, 424MB/s]\u001b[A\n",
      "Downloading (…)l-00028-of-00033.bin:  60%|██▍ | 241M/405M [00:00<00:00, 440MB/s]\u001b[A\n",
      "Downloading (…)l-00028-of-00033.bin:  73%|██▉ | 294M/405M [00:00<00:00, 437MB/s]\u001b[A\n",
      "Downloading (…)l-00028-of-00033.bin:  85%|███▍| 346M/405M [00:00<00:00, 441MB/s]\u001b[A\n",
      "Downloading (…)l-00028-of-00033.bin: 100%|████| 405M/405M [00:00<00:00, 431MB/s]\u001b[A\n",
      "Downloading shards:  85%|███████████████████▌   | 28/33 [00:30<00:05,  1.00s/it]\n",
      "Downloading (…)l-00029-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00029-of-00033.bin:   5%|▏  | 21.0M/405M [00:00<00:02, 170MB/s]\u001b[A\n",
      "Downloading (…)l-00029-of-00033.bin:  13%|▍  | 52.4M/405M [00:00<00:01, 223MB/s]\u001b[A\n",
      "Downloading (…)l-00029-of-00033.bin:  26%|█   | 105M/405M [00:00<00:00, 318MB/s]\u001b[A\n",
      "Downloading (…)l-00029-of-00033.bin:  39%|█▌  | 157M/405M [00:00<00:00, 372MB/s]\u001b[A\n",
      "Downloading (…)l-00029-of-00033.bin:  49%|█▉  | 199M/405M [00:00<00:00, 375MB/s]\u001b[A\n",
      "Downloading (…)l-00029-of-00033.bin:  62%|██▍ | 252M/405M [00:00<00:00, 403MB/s]\u001b[A\n",
      "Downloading (…)l-00029-of-00033.bin:  75%|███ | 304M/405M [00:00<00:00, 421MB/s]\u001b[A\n",
      "Downloading (…)l-00029-of-00033.bin:  88%|███▌| 357M/405M [00:00<00:00, 431MB/s]\u001b[A\n",
      "Downloading (…)l-00029-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 388MB/s]\u001b[A\n",
      "Downloading shards:  88%|████████████████████▏  | 29/33 [00:32<00:04,  1.02s/it]\n",
      "Downloading (…)l-00030-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00030-of-00033.bin:   5%|▏  | 21.0M/405M [00:00<00:02, 152MB/s]\u001b[A\n",
      "Downloading (…)l-00030-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:03, 101MB/s]\u001b[A\n",
      "Downloading (…)l-00030-of-00033.bin:  23%|▋  | 94.4M/405M [00:00<00:01, 212MB/s]\u001b[A\n",
      "Downloading (…)l-00030-of-00033.bin:  36%|█▍  | 147M/405M [00:00<00:00, 283MB/s]\u001b[A\n",
      "Downloading (…)l-00030-of-00033.bin:  47%|█▊  | 189M/405M [00:00<00:00, 306MB/s]\u001b[A\n",
      "Downloading (…)l-00030-of-00033.bin:  60%|██▍ | 241M/405M [00:00<00:00, 347MB/s]\u001b[A\n",
      "Downloading (…)l-00030-of-00033.bin:  73%|██▉ | 294M/405M [00:00<00:00, 379MB/s]\u001b[A\n",
      "Downloading (…)l-00030-of-00033.bin:  85%|███▍| 346M/405M [00:01<00:00, 400MB/s]\u001b[A\n",
      "Downloading (…)l-00030-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 327MB/s]\u001b[A\n",
      "Downloading shards:  91%|████████████████████▉  | 30/33 [00:33<00:03,  1.09s/it]\n",
      "Downloading (…)l-00031-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00031-of-00033.bin:  10%|▎  | 41.9M/405M [00:00<00:00, 383MB/s]\u001b[A\n",
      "Downloading (…)l-00031-of-00033.bin:  23%|▋  | 94.4M/405M [00:00<00:00, 413MB/s]\u001b[A\n",
      "Downloading (…)l-00031-of-00033.bin:  34%|█▎  | 136M/405M [00:00<00:00, 347MB/s]\u001b[A\n",
      "Downloading (…)l-00031-of-00033.bin:  44%|█▊  | 178M/405M [00:00<00:00, 340MB/s]\u001b[A\n",
      "Downloading (…)l-00031-of-00033.bin:  57%|██▎ | 231M/405M [00:00<00:00, 373MB/s]\u001b[A\n",
      "Downloading (…)l-00031-of-00033.bin:  67%|██▋ | 273M/405M [00:00<00:00, 372MB/s]\u001b[A\n",
      "Downloading (…)l-00031-of-00033.bin:  80%|███▏| 325M/405M [00:00<00:00, 397MB/s]\u001b[A\n",
      "Downloading (…)l-00031-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 386MB/s]\u001b[A\n",
      "Downloading shards:  94%|█████████████████████▌ | 31/33 [00:34<00:02,  1.09s/it]\n",
      "Downloading (…)l-00032-of-00033.bin:   0%|           | 0.00/405M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00032-of-00033.bin:   5%|▏  | 21.0M/405M [00:00<00:02, 146MB/s]\u001b[A\n",
      "Downloading (…)l-00032-of-00033.bin:  13%|▍  | 52.4M/405M [00:00<00:01, 224MB/s]\u001b[A\n",
      "Downloading (…)l-00032-of-00033.bin:  26%|█   | 105M/405M [00:00<00:00, 320MB/s]\u001b[A\n",
      "Downloading (…)l-00032-of-00033.bin:  39%|█▌  | 157M/405M [00:00<00:00, 369MB/s]\u001b[A\n",
      "Downloading (…)l-00032-of-00033.bin:  52%|██  | 210M/405M [00:00<00:00, 396MB/s]\u001b[A\n",
      "Downloading (…)l-00032-of-00033.bin:  62%|██▍ | 252M/405M [00:00<00:00, 364MB/s]\u001b[A\n",
      "Downloading (…)l-00032-of-00033.bin:  75%|███ | 304M/405M [00:00<00:00, 387MB/s]\u001b[A\n",
      "Downloading (…)l-00032-of-00033.bin:  88%|███▌| 357M/405M [00:00<00:00, 401MB/s]\u001b[A\n",
      "Downloading (…)l-00032-of-00033.bin: 100%|████| 405M/405M [00:01<00:00, 361MB/s]\u001b[A\n",
      "Downloading shards:  97%|██████████████████████▎| 32/33 [00:35<00:01,  1.11s/it]\n",
      "Downloading (…)l-00033-of-00033.bin:   0%|           | 0.00/524M [00:00<?, ?B/s]\u001b[A\n",
      "Downloading (…)l-00033-of-00033.bin:   4%|   | 21.0M/524M [00:00<00:02, 176MB/s]\u001b[A\n",
      "Downloading (…)l-00033-of-00033.bin:  10%|▎  | 52.4M/524M [00:00<00:02, 223MB/s]\u001b[A\n",
      "Downloading (…)l-00033-of-00033.bin:  18%|▌  | 94.4M/524M [00:00<00:01, 300MB/s]\u001b[A\n",
      "Downloading (…)l-00033-of-00033.bin:  26%|█   | 136M/524M [00:00<00:01, 317MB/s]\u001b[A\n",
      "Downloading (…)l-00033-of-00033.bin:  34%|█▎  | 178M/524M [00:00<00:01, 290MB/s]\u001b[A\n",
      "Downloading (…)l-00033-of-00033.bin:  42%|█▋  | 220M/524M [00:00<00:00, 318MB/s]\u001b[A\n",
      "Downloading (…)l-00033-of-00033.bin:  50%|█▉  | 262M/524M [00:00<00:00, 346MB/s]\u001b[A\n",
      "Downloading (…)l-00033-of-00033.bin:  60%|██▍ | 315M/524M [00:00<00:00, 374MB/s]\u001b[A\n",
      "Downloading (…)l-00033-of-00033.bin:  68%|██▋ | 357M/524M [00:01<00:00, 384MB/s]\u001b[A\n",
      "Downloading (…)l-00033-of-00033.bin:  76%|███ | 398M/524M [00:01<00:00, 371MB/s]\u001b[A\n",
      "Downloading (…)l-00033-of-00033.bin:  86%|███▍| 451M/524M [00:01<00:00, 388MB/s]\u001b[A\n",
      "Downloading (…)l-00033-of-00033.bin: 100%|████| 524M/524M [00:01<00:00, 342MB/s]\u001b[A\n",
      "Downloading shards: 100%|███████████████████████| 33/33 [00:37<00:00,  1.12s/it]\n",
      "Loading checkpoint shards: 100%|████████████████| 33/33 [00:12<00:00,  2.62it/s]\n",
      "Downloading (…)neration_config.json: 100%|█████| 124/124 [00:00<00:00, 1.01MB/s]\n",
      "Downloading tokenizer.model: 100%|███████████| 500k/500k [00:00<00:00, 22.6MB/s]\n",
      "Downloading (…)cial_tokens_map.json: 100%|███| 2.00/2.00 [00:00<00:00, 11.1kB/s]\n",
      "Downloading (…)okenizer_config.json: 100%|█████| 141/141 [00:00<00:00, 1.27MB/s]\n",
      "The tokenizer class you load from this checkpoint is not the same type as the class this function is called from. It may result in unexpected tokenization. \n",
      "The tokenizer class you load from this checkpoint is 'LLaMATokenizer'. \n",
      "The class this function is called from is 'LlamaTokenizer'.\n",
      "Downloading and preparing dataset json/default to /home/ec2-user/.cache/huggingface/datasets/json/default-58acc299344cd293/0.0.0/e347ab1c932092252e717ff3f949105a4dd28b27e842dd53157d2f72e276c2e4...\n",
      "Downloading data files: 100%|███████████████████| 1/1 [00:00<00:00, 5907.47it/s]\n",
      "Extracting data files: 100%|████████████████████| 1/1 [00:00<00:00, 1291.75it/s]\n",
      "Dataset json downloaded and prepared to /home/ec2-user/.cache/huggingface/datasets/json/default-58acc299344cd293/0.0.0/e347ab1c932092252e717ff3f949105a4dd28b27e842dd53157d2f72e276c2e4. Subsequent calls will reuse this data.\n",
      "100%|█████████████████████████████████████████████| 1/1 [00:00<00:00, 15.14it/s]\n",
      "trainable params: 4194304 || all params: 6742609920 || trainable%: 0.06220594176090199\n",
      "{'loss': 1.5183, 'learning_rate': 5e-05, 'epoch': 0.11}                         \n",
      "{'loss': 1.3989, 'learning_rate': 0.0001, 'epoch': 0.21}                        \n",
      "{'loss': 1.0715, 'learning_rate': 0.00015, 'epoch': 0.32}                       \n",
      "{'loss': 0.6596, 'learning_rate': 0.0002, 'epoch': 0.43}                        \n",
      "{'loss': 0.5305, 'learning_rate': 0.00025, 'epoch': 0.54}                       \n",
      "{'loss': 0.5017, 'learning_rate': 0.0003, 'epoch': 0.64}                        \n",
      "{'loss': 0.4874, 'learning_rate': 0.00035, 'epoch': 0.75}                       \n",
      "{'loss': 0.475, 'learning_rate': 0.0004, 'epoch': 0.86}                         \n",
      "{'loss': 0.4665, 'learning_rate': 0.00045000000000000004, 'epoch': 0.97}        \n",
      "{'train_runtime': 10636.2003, 'train_samples_per_second': 4.477, 'train_steps_per_second': 0.009, 'train_loss': 0.7794570435759842, 'epoch': 1.0}\n",
      "100%|████████████████████████████████████████| 93/93 [2:57:16<00:00, 114.37s/it]\n",
      "\n",
      " If there's a warning about missing keys above, please disregard :)\n"
     ]
    }
   ],
   "source": [
    "!python finetune.py \\\n",
    "    --base_model 'decapoda-research/llama-7b-hf' \\\n",
    "    --data_path 'ko_alpaca_data.json' \\\n",
    "    --output_dir './output' \\\n",
    "    --num_epochs 1 \\\n",
    "    --learning_rate 5e-4 \\\n",
    "    --val_set_size 2000 \\\n",
    "    --batch_size 512 \\\n",
    "    --micro_batch_size 16 \\\n",
    "    --prompt_template_name 'custom'"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "id": "103c63b8-fc13-48c5-8bd1-ee877f3adb88",
   "metadata": {
    "tags": []
   },
   "outputs": [
    {
     "data": {
      "text/plain": [
       "'/home/ec2-user/SageMaker/Kor-LLM-On-SageMaker/alpaca-lora'"
      ]
     },
     "execution_count": 3,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "import os\n",
    "\n",
    "os.getcwd()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "1bff404b-4a7e-4ee8-8ce6-5aa26b75c466",
   "metadata": {
    "tags": []
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "\n",
      "===================================BUG REPORT===================================\n",
      "Welcome to bitsandbytes. For bug reports, please run\n",
      "\n",
      "python -m bitsandbytes\n",
      "\n",
      " and submit this information together with your error trace to: https://github.com/TimDettmers/bitsandbytes/issues\n",
      "================================================================================\n",
      "bin /home/ec2-user/anaconda3/envs/python3/lib/python3.10/site-packages/bitsandbytes/libbitsandbytes_cuda110_nocublaslt.so\n",
      "/home/ec2-user/anaconda3/envs/python3/lib/python3.10/site-packages/bitsandbytes/cuda_setup/main.py:145: UserWarning: /home/ec2-user/anaconda3/envs/python3 did not contain ['libcudart.so', 'libcudart.so.11.0', 'libcudart.so.12.0'] as expected! Searching further paths...\n",
      "  warn(msg)\n",
      "/home/ec2-user/anaconda3/envs/python3/lib/python3.10/site-packages/bitsandbytes/cuda_setup/main.py:145: UserWarning: WARNING: The following directories listed in your path were found to be non-existent: {PosixPath('/opt/amazon/efa/lib')}\n",
      "  warn(msg)\n",
      "CUDA SETUP: CUDA runtime path found: /usr/local/cuda-11.0/lib64/libcudart.so\n",
      "CUDA SETUP: Highest compute capability among GPUs detected: 7.0\n",
      "CUDA SETUP: Detected CUDA version 110\n",
      "/home/ec2-user/anaconda3/envs/python3/lib/python3.10/site-packages/bitsandbytes/cuda_setup/main.py:145: UserWarning: WARNING: Compute capability < 7.5 detected! Only slow 8-bit matmul is supported for your GPU!\n",
      "  warn(msg)\n",
      "CUDA SETUP: Loading binary /home/ec2-user/anaconda3/envs/python3/lib/python3.10/site-packages/bitsandbytes/libbitsandbytes_cuda110_nocublaslt.so...\n",
      "The tokenizer class you load from this checkpoint is not the same type as the class this function is called from. It may result in unexpected tokenization. \n",
      "The tokenizer class you load from this checkpoint is 'LLaMATokenizer'. \n",
      "The class this function is called from is 'LlamaTokenizer'.\n",
      "Loading checkpoint shards: 100%|████████████████| 33/33 [00:14<00:00,  2.32it/s]\n",
      "/home/ec2-user/anaconda3/envs/python3/lib/python3.10/site-packages/gradio/inputs.py:27: UserWarning: Usage of gradio.inputs is deprecated, and will not be supported in the future, please import your component from gradio.components\n",
      "  warnings.warn(\n",
      "/home/ec2-user/anaconda3/envs/python3/lib/python3.10/site-packages/gradio/deprecation.py:40: UserWarning: `optional` parameter is deprecated, and it has no effect\n",
      "  warnings.warn(value)\n",
      "/home/ec2-user/anaconda3/envs/python3/lib/python3.10/site-packages/gradio/deprecation.py:40: UserWarning: `numeric` parameter is deprecated, and it has no effect\n",
      "  warnings.warn(value)\n",
      "Running on local URL:  http://0.0.0.0:7860\n",
      "Running on public URL: https://52797cb8e5e7b6fa8c.gradio.live\n",
      "\n",
      "This share link expires in 72 hours. For free permanent hosting and GPU upgrades (NEW!), check out Spaces: https://huggingface.co/spaces\n"
     ]
    }
   ],
   "source": [
    "!python generate.py \\\n",
    "    --base_model 'decapoda-research/llama-7b-hf' \\\n",
    "    --lora_weights 'output' \\\n",
    "    --prompt_template 'custom' \\\n",
    "    --share_gradio"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "99fb545e-0a6d-4211-b83f-d42c4468362a",
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "conda_python3",
   "language": "python",
   "name": "conda_python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.10.8"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 5
}