'''
Test the JobAnalyzer.py module and script.

Copyright Amazon.com, Inc. or its affiliates. All Rights Reserved.
SPDX-License-Identifier: MIT-0
'''

from copy import deepcopy
from CSVLogParser import CSVLogParser
import filecmp
from JobAnalyzer import JobAnalyzer, JobCost, logger as JobAnalyzer_logger
import json
import logging
from MemoryUtils import MEM_GB, MEM_KB, MEM_MB
import os
from os import environ, getenv, listdir, makedirs, path, system
from os.path import abspath, dirname
import pytest
from SchedulerJobInfo import SchedulerJobInfo
import subprocess
from subprocess import CalledProcessError, check_output
from test_SortJobs import order as last_order
import unittest

order = last_order // 100 * 100 + 100
assert order == 600

class TestJobAnalyzer(unittest.TestCase):
    global order

    def __init__(self, name):
        super().__init__(name)
        self._restore_instance_type_info()

    REPO_DIR = abspath(f"{dirname(__file__)}/..")

    CONFIG_FILENAME = path.join(REPO_DIR, 'test_files/JobAnalyzer/config.yml')

    OUTPUT_DIR = path.join(REPO_DIR, 'output/JobAnalyzer')

    INSTANCE_NAME_PATTERN = r'\w\d\w*\.\d{0,2}\w+'

    INPUT_CSV = path.join(REPO_DIR, 'test_files/LSFLogParser/exp_jobs.csv')

    csv_parser = CSVLogParser(INPUT_CSV, None)

    region = 'eu-west-1'

    default_max_mem_gb = (100 * MEM_MB) / MEM_GB

    _jobAnalyzer = None

    def get_jobAnalyzer(self):
        if self._jobAnalyzer:
            return self._jobAnalyzer
        self._use_static_instance_type_info()
        self._jobAnalyzer = JobAnalyzer(self.csv_parser, self.CONFIG_FILENAME, self.OUTPUT_DIR, None, None, None, None)
        if not self._jobAnalyzer.instance_type_info:
            self._jobAnalyzer.get_instance_type_info()
        return self._jobAnalyzer

    def _remove_instance_type_info(self):
        system(f"rm -f {dirname(__file__)+'/../instance_type_info.json'}")

    def _use_static_instance_type_info(self):
        system(f"cp {self.REPO_DIR}/test_files/instance_type_info.json {self.REPO_DIR}/instance_type_info.json")

    def _restore_instance_type_info(self):
        system(f"git restore {dirname(__file__)+'/../instance_type_info.json'}")

    def cleanup_output_files(self):
        system(f"rm -rf {dirname(__file__)+'/../output'}")

    def _remove_credentials(self):
        self.AWS_ACCESS_KEY_ID = getenv('AWS_ACCESS_KEY_ID')
        self.AWS_SECRET_ACCESS_KEY = getenv('AWS_SECRET_ACCESS_KEY')
        self.AWS_SESSION_TOKEN = getenv('AWS_SESSION_TOKEN')
        if self.AWS_ACCESS_KEY_ID:
            del environ['AWS_ACCESS_KEY_ID']
        if self.AWS_SECRET_ACCESS_KEY:
            del environ['AWS_SECRET_ACCESS_KEY']
        if self.AWS_SESSION_TOKEN:
            del environ['AWS_SESSION_TOKEN']

    def _restore_credentials(self):
        if self.AWS_ACCESS_KEY_ID:
            environ['AWS_ACCESS_KEY_ID'] = self.AWS_ACCESS_KEY_ID
        if self.AWS_SECRET_ACCESS_KEY:
            environ['AWS_SECRET_ACCESS_KEY'] = self.AWS_SECRET_ACCESS_KEY
        if self.AWS_SESSION_TOKEN:
            environ['AWS_SESSION_TOKEN'] = self.AWS_SESSION_TOKEN

    def _get_hourly_files(self, dir):
        '''
        Gets the hourly output files for the current job

        Args:
            dir (str): output directory
        Returns:
            [str]: Sorted list of output filenames
        '''
        all_files = listdir(dir)
        output_files = []
        prefix = path.basename("hourly-")
        for file in all_files:
            if file.startswith(prefix) and file[-4:] == ".csv":
                output_file = file
                output_files.append(output_file)
        output_files.sort()
        return output_files

    order += 1
    @pytest.mark.order(order)
    def test_get_ranges(self):
        self.assertEqual(self.get_jobAnalyzer().get_ranges([1,2,3,4,5]),['0-1','1-2','2-3','3-4','4-5','5-'+str(self.get_jobAnalyzer().range_max)])
        self.assertEqual(self.get_jobAnalyzer().get_ranges([50]),['0-50','50-'+str(self.get_jobAnalyzer().range_max)])

    order += 1
    @pytest.mark.order(order)
    def test_read_configuration(self):
        # Test bad filename
        with pytest.raises(FileNotFoundError) as excinfo:
            config = JobAnalyzer.read_configuration(self.CONFIG_FILENAME + 'INVALID')
        print(excinfo.value)

        config = JobAnalyzer.read_configuration(self.CONFIG_FILENAME)
        key_dict = {'version': '',
            'instance_mapping': '',
            'consumption_model_mapping': '',
            'Jobs': ''
        }

        self.assertEqual(key_dict.keys(), config.keys())
        self.assertGreaterEqual(len(config["instance_mapping"]["ram_ranges_GB"]), 2)
        self.assertGreaterEqual(len(config["instance_mapping"]["runtime_ranges_minutes"]), 2)
        self.assertTrue(type(config["instance_mapping"]["instance_prefix_list"]) == list)   # makes sures edits don't change to a string

    order += 1
    @pytest.mark.order(order)
    def test_select_range(self):
        jobAnalyzer = self.get_jobAnalyzer()

        self.assertEqual(jobAnalyzer.select_range(0,[1,5,10,20]),str(jobAnalyzer.range_min)+'-1')
        self.assertEqual(jobAnalyzer.select_range(5,[1,5,10,20]),'1-5')
        self.assertEqual(jobAnalyzer.select_range(14,[1,5,10,20]),'10-20')
        self.assertEqual(jobAnalyzer.select_range(25,[1,5,10,20]),'20-'+str(jobAnalyzer.range_max))

    order += 1
    @pytest.mark.order(order)
    def test_add_job_to_hourly_bucket(self):
        self.cleanup_output_files()
        jobAnalyzer = self.get_jobAnalyzer()
        jobAnalyzer._clear_job_stats

        # Make sure that not jobs in hourly buckets
        self.assertEqual(jobAnalyzer.jobs_by_hours,{})

        # Create a dummy job
        wait_time = int(11.666666666666666 * 60)
        start_time = 1643903745
        submit_time = start_time - wait_time
        run_time = 45 * 60
        finish_time = start_time + run_time
        instance_type = 'r5.4xlarge'
        instance_family = instance_type.split('.')[0]
        job_dict = {'job_id': 107, 'tasks': 1, 'memory_GB': 65.0, 'instance_family': instance_family, 'instance_type': instance_type, 'instance_hourly_cost': jobAnalyzer.instance_type_info[instance_type]['pricing']['OnDemand'], 'instance_count': 1}
        job = SchedulerJobInfo(job_dict['job_id'], num_cores=1, max_mem_gb=job_dict['memory_GB'], num_hosts=job_dict['tasks'], submit_time=submit_time, start_time=start_time, finish_time=finish_time, wait_time=wait_time)
        job_cost_data = JobCost(job, run_time/60<= 60, job_dict['instance_family'], job_dict['instance_type'], job_dict['instance_hourly_cost'])

        # Expected contents of hourly csv file
        job_log = '2022-02-03T15:55:45,107,1,45.0,65.0,11.6667,r5.4xlarge,r5,True,1.128,0.846\n'

        batch_size = int(jobAnalyzer.config['consumption_model_mapping']['job_file_batch_size'])
        for i in range(1,batch_size):
            jobAnalyzer._add_job_to_hourly_bucket(job_cost_data)
            count = 0
            for j in jobAnalyzer.jobs_by_hours:
                count += len(jobAnalyzer.jobs_by_hours[j])
            self.assertEqual(i,count)
        jobAnalyzer._add_job_to_hourly_bucket(job_cost_data)
        self.assertEqual(jobAnalyzer.jobs_by_hours, {})
        with open(path.join(jobAnalyzer._output_dir, 'hourly-456639.csv'), 'r') as job_log_file:
            lines = job_log_file.readlines()
        self.assertEqual(len(lines), batch_size+1)
        for i in range(1,batch_size):
            self.assertEqual(lines[i], job_log)

    order += 1
    @pytest.mark.order(order)
    def test_missing_parser(self):
        self.cleanup_output_files()
        with pytest.raises(CalledProcessError) as excinfo:
            check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--output-dir', 'output'], stderr=subprocess.STDOUT, encoding='utf8')
        print(excinfo.value)
        print(excinfo.value.output)
        assert('The following arguments are required: parser' in excinfo.value.output)
        assert(excinfo.value.returncode == 2)

    order += 1
    @pytest.mark.order(order)
    def test_csv_bad_credentials(self):
        try:
            self.cleanup_output_files()
            self.maxDiff = None
            self._remove_credentials()
            self._remove_instance_type_info()

            output = check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--output-dir', 'output/JobAnalyzer/lsf', 'csv', '--input-csv', 'test_files/LSFLogParser/exp_jobs.csv'], stderr=subprocess.STDOUT, encoding='utf8', env=environ)
            print(output)
            assert(False)
        except CalledProcessError as e:
            print(e.output)
            assert('Failed to get EC2 instance types' in e.output)
            assert('Configure your AWS CLI credentials.' in e.output or 'Update your AWS CLI credentials.' in e.output)

        finally:
            self._restore_credentials()
            self._remove_instance_type_info()
            self._restore_instance_type_info()

    order += 1
    @pytest.mark.order(order)
    def test_add_job_to_collector(self):
        '''
            * Tests the empty job_data_collector
            * Adds jobs to job_data_Collector and verifies the results
        '''
        # Test the empty dict
        jobAnalyzer = self.get_jobAnalyzer()
        jobAnalyzer._clear_job_stats()
        jobs = jobAnalyzer.job_data_collector

        config = jobAnalyzer.config
        assert(len(jobs.keys()) == len(config["instance_mapping"]["ram_ranges_GB"])+1)
        for key in jobs:
            self.assertEqual(len(jobs[key]), len(config["instance_mapping"]["runtime_ranges_minutes"])+1)
            for value in jobs[key]:
                self.assertEqual(jobs[key][value]['number_of_jobs'], 0)
                self.assertEqual(jobs[key][value]['total_duration_minutes'], 0)
                self.assertEqual(jobs[key][value]['total_wait_minutes'], 0)

        JobAnalyzer_logger.setLevel(logging.DEBUG)

        # Fill collector with jobs and test results
        submit_time = 0
        start_time = 2*60
        wait_time = start_time - submit_time
        finish_time = start_time + 3*60
        job = SchedulerJobInfo(job_id=1, num_cores=1, max_mem_gb=0.8, num_hosts=1, submit_time=submit_time, start_time=start_time, finish_time=finish_time, wait_time=wait_time)
        jobAnalyzer._add_job_to_collector(job)
        try:
            self.assertEqual(jobs['0-1']['1-5']['number_of_jobs'], 1)
            self.assertEqual(jobs['0-1']['1-5']['total_duration_minutes'], 3)
            self.assertEqual(jobs['0-1']['1-5']['total_wait_minutes'], 2)
        except:
            print(json.dumps(jobs, indent=4))
            raise

        exp_jobs = deepcopy(jobs)

        job_dict = {'job_id':2, 'tasks': 3, 'memory_GB': 0.5, 'wait_time_minutes': 2.5, 'runtime_minutes': 4.5, 'instance_count': 1}
        job = SchedulerJobInfo(job_dict['job_id'], num_cores=1, max_mem_gb=job_dict['memory_GB'], num_hosts=job_dict['tasks'], submit_time=0, start_time=int(job_dict['wait_time_minutes']*60), finish_time=int(job_dict['wait_time_minutes']*60) + int(job_dict['runtime_minutes']*60), wait_time=int(job_dict['wait_time_minutes']*60))
        jobAnalyzer._add_job_to_collector(job)
        exp_jobs['0-1']['1-5']['number_of_jobs'] += 1
        exp_jobs['0-1']['1-5']['total_duration_minutes'] += job_dict['runtime_minutes']
        exp_jobs['0-1']['1-5']['total_wait_minutes'] += job_dict['wait_time_minutes']
        try:
            assert(jobs['0-1']['1-5']['number_of_jobs'] == exp_jobs['0-1']['1-5']['number_of_jobs'])
            assert(jobs['0-1']['1-5']['total_duration_minutes'] == exp_jobs['0-1']['1-5']['total_duration_minutes'])
            assert(jobs['0-1']['1-5']['total_wait_minutes'] == exp_jobs['0-1']['1-5']['total_wait_minutes'])
        except:
            print(json.dumps(jobs, indent=4))
            raise

        job_dict = {'job_id':3, 'tasks': 3, 'memory_GB': 6, 'wait_time_minutes': 2.1, 'runtime_minutes': 4.1, 'instance_count': 1}
        mem_per_instance = job_dict['memory_GB']/job_dict['tasks']
        job = SchedulerJobInfo(job_dict['job_id'], num_cores=1, max_mem_gb=job_dict['memory_GB'], num_hosts=job_dict['tasks'], submit_time=0, start_time=int(job_dict['wait_time_minutes']*60), finish_time=int(job_dict['wait_time_minutes']*60 + job_dict['runtime_minutes']*60), wait_time=int(job_dict['wait_time_minutes']*60))
        print(f"job {job.job_id} run_time={job.run_time}")
        jobAnalyzer._add_job_to_collector(job)
        exp_jobs['1-2']['1-5']['number_of_jobs'] += 1
        exp_jobs['1-2']['1-5']['total_duration_minutes'] += job_dict['runtime_minutes']
        exp_jobs['1-2']['1-5']['total_wait_minutes'] += job_dict['wait_time_minutes']
        try:
            assert(jobs['1-2']['1-5']['number_of_jobs'] == exp_jobs['1-2']['1-5']['number_of_jobs'])
            assert(jobs['1-2']['1-5']['total_duration_minutes'] == exp_jobs['1-2']['1-5']['total_duration_minutes'])
            assert(jobs['1-2']['1-5']['total_wait_minutes'] == exp_jobs['1-2']['1-5']['total_wait_minutes'])
        except:
            print(json.dumps(jobs, indent=4))
            raise

        job_dict = {'job_id':4, 'tasks': 5, 'memory_GB': 9.0, 'wait_time_minutes': 0.3, 'runtime_minutes': 3.2, 'instance_count': 1}
        job = SchedulerJobInfo(job_dict['job_id'], num_cores=1, max_mem_gb=job_dict['memory_GB'], num_hosts=job_dict['tasks'], submit_time=0, start_time=int(job_dict['wait_time_minutes']*60), finish_time=int(job_dict['wait_time_minutes']*60) + int(job_dict['runtime_minutes']*60), wait_time=int(job_dict['wait_time_minutes']*60))
        jobAnalyzer._add_job_to_collector(job)
        exp_jobs['1-2']['1-5']['number_of_jobs'] += 1
        exp_jobs['1-2']['1-5']['total_duration_minutes'] += job_dict['runtime_minutes']
        exp_jobs['1-2']['1-5']['total_wait_minutes'] += job_dict['wait_time_minutes']
        try:
            assert(jobs['1-2']['1-5']['number_of_jobs'] == exp_jobs['1-2']['1-5']['number_of_jobs'])
            assert(jobs['1-2']['1-5']['total_duration_minutes'] == exp_jobs['1-2']['1-5']['total_duration_minutes'])
            assert(jobs['1-2']['1-5']['total_wait_minutes'] == exp_jobs['1-2']['1-5']['total_wait_minutes'])
        except:
            print(json.dumps(jobs, indent=4))
            raise

    order += 1
    @pytest.mark.order(order)
    def test_get_lowest_priced_instance(self):
        self._use_static_instance_type_info()

        jobAnalyzer = self.get_jobAnalyzer()

        (t1, price1) = jobAnalyzer.get_lowest_priced_instance(['c5.large'], False)
        (t2, price2) = jobAnalyzer.get_lowest_priced_instance(['c5.xlarge'], False)
        (t3, price3) = jobAnalyzer.get_lowest_priced_instance(['c5.2xlarge'], False)

        self.assertAlmostEqual(price2/price1,2,0)
        self.assertAlmostEqual(price3/price2,2,0)

        (instance_type, price) = jobAnalyzer.get_lowest_priced_instance(['c5.2xlarge', 'c5.large', 'c5.xlarge'], False)
        assert(instance_type == 'c5.large')
        assert(price == price1)

        self._restore_instance_type_info()

    def check_get_instance_by_spec(self, min_mem_gb: float, min_cores: int, min_freq: float, exp_instance_types: [str]):
        jobAnalyzer = self.get_jobAnalyzer()

        instance_type_info = jobAnalyzer.instance_type_info

        exp_instance_types.sort()

        print(f"min_mem_gb: {min_mem_gb}")
        print(f"min_cores:  {min_cores}")
        print(f"min_freq:   {min_freq}")
        print(f"exp_num_instance_types: {len(exp_instance_types)}")
        instance_types = jobAnalyzer.get_instance_by_spec(min_mem_gb, min_cores, min_freq)
        instance_types.sort()
        print(f"instance_types: {json.dumps(instance_types, indent=4)}")
        print(f"num_instance_types: {len(instance_types)}")
        for instance_type in instance_types:
            mem_gb = instance_type_info[instance_type]['MemoryInMiB'] / 1024
            cores = instance_type_info[instance_type]['DefaultCores']
            freq = instance_type_info[instance_type]['SustainedClockSpeedInGhz']
            print(f"instance_type: {instance_type:15} mem_gb={mem_gb:6} cores={cores:3} freq={freq}")
            assert(mem_gb >= min_mem_gb)
            assert(cores >= min_cores)
            assert(freq >= min_freq)
            assert(instance_type in exp_instance_types)
        for instance_type in exp_instance_types:
            assert(instance_type in instance_types)
        for idx in range(max(len(instance_types), len(exp_instance_types))):
            assert(instance_types[idx] == exp_instance_types[idx])
        assert(len(instance_types) == len(exp_instance_types))

    order += 1
    @pytest.mark.order(order)
    def test_get_instance_by_spec(self):
        self._use_static_instance_type_info()

        jobAnalyzer = self.get_jobAnalyzer()

        if not jobAnalyzer.instance_type_info:
            jobAnalyzer.get_instance_type_info()

        # all instance types in the allowlist
        min_mem_gb = 1
        min_cores = 1
        min_freq = 1
        exp_instance_types = [
            "c5.12xlarge",
            "c5.18xlarge",
            "c5.24xlarge",
            "c5.2xlarge",
            "c5.4xlarge",
            "c5.9xlarge",
            "c5.large",
            "c5.xlarge",
            "c6a.12xlarge",
            "c6a.16xlarge",
            "c6a.24xlarge",
            "c6a.2xlarge",
            "c6a.32xlarge",
            "c6a.48xlarge",
            "c6a.4xlarge",
            "c6a.8xlarge",
            "c6a.large",
            "c6a.xlarge",
            "c6i.12xlarge",
            "c6i.16xlarge",
            "c6i.24xlarge",
            "c6i.2xlarge",
            "c6i.32xlarge",
            "c6i.4xlarge",
            "c6i.8xlarge",
            "c6i.large",
            "c6i.xlarge",
            "c6id.12xlarge",
            "c6id.16xlarge",
            "c6id.24xlarge",
            "c6id.2xlarge",
            "c6id.32xlarge",
            "c6id.4xlarge",
            "c6id.8xlarge",
            "c6id.large",
            "c6id.xlarge",
            "c6in.12xlarge",
            "c6in.16xlarge",
            "c6in.24xlarge",
            "c6in.2xlarge",
            "c6in.32xlarge",
            "c6in.4xlarge",
            "c6in.8xlarge",
            "c6in.large",
            "c6in.xlarge",
            "m5.12xlarge",
            "m5.16xlarge",
            "m5.24xlarge",
            "m5.2xlarge",
            "m5.4xlarge",
            "m5.8xlarge",
            "m5.large",
            "m5.xlarge",
            "m6a.12xlarge",
            "m6a.16xlarge",
            "m6a.24xlarge",
            "m6a.2xlarge",
            "m6a.32xlarge",
            "m6a.4xlarge",
            "m6a.48xlarge",
            "m6a.8xlarge",
            "m6a.large",
            "m6a.xlarge",
            "m6i.12xlarge",
            "m6i.16xlarge",
            "m6i.24xlarge",
            "m6i.2xlarge",
            "m6i.32xlarge",
            "m6i.4xlarge",
            "m6i.8xlarge",
            "m6i.large",
            "m6i.xlarge",
            "m6id.12xlarge",
            "m6id.16xlarge",
            "m6id.24xlarge",
            "m6id.2xlarge",
            "m6id.32xlarge",
            "m6id.4xlarge",
            "m6id.8xlarge",
            "m6id.large",
            "m6id.xlarge",
            "m6idn.12xlarge",
            "m6idn.16xlarge",
            "m6idn.24xlarge",
            "m6idn.2xlarge",
            "m6idn.32xlarge",
            "m6idn.4xlarge",
            "m6idn.8xlarge",
            "m6idn.large",
            "m6idn.xlarge",
            "m6in.12xlarge",
            "m6in.16xlarge",
            "m6in.24xlarge",
            "m6in.2xlarge",
            "m6in.32xlarge",
            "m6in.4xlarge",
            "m6in.8xlarge",
            "m6in.large",
            "m6in.xlarge",
            "r5.12xlarge",
            "r5.16xlarge",
            "r5.24xlarge",
            "r5.2xlarge",
            "r5.4xlarge",
            "r5.8xlarge",
            "r5.large",
            "r5.xlarge",
            "r6i.12xlarge",
            "r6i.16xlarge",
            "r6i.24xlarge",
            "r6i.2xlarge",
            "r6i.32xlarge",
            "r6i.4xlarge",
            "r6i.8xlarge",
            "r6i.large",
            "r6i.xlarge",
            "r6id.12xlarge",
            "r6id.16xlarge",
            "r6id.24xlarge",
            "r6id.2xlarge",
            "r6id.32xlarge",
            "r6id.4xlarge",
            "r6id.8xlarge",
            "r6id.large",
            "r6id.xlarge",
            "r6idn.12xlarge",
            "r6idn.16xlarge",
            "r6idn.24xlarge",
            "r6idn.2xlarge",
            "r6idn.32xlarge",
            "r6idn.4xlarge",
            "r6idn.8xlarge",
            "r6idn.large",
            "r6idn.xlarge",
            "r6in.12xlarge",
            "r6in.16xlarge",
            "r6in.24xlarge",
            "r6in.2xlarge",
            "r6in.32xlarge",
            "r6in.4xlarge",
            "r6in.8xlarge",
            "r6in.large",
            "r6in.xlarge",
            "x2idn.16xlarge",
            "x2idn.24xlarge",
            "x2idn.32xlarge",
            "x2iedn.16xlarge",
            "x2iedn.24xlarge",
            "x2iedn.2xlarge",
            "x2iedn.32xlarge",
            "x2iedn.4xlarge",
            "x2iedn.8xlarge",
            "x2iedn.xlarge",
            "x2iezn.12xlarge",
            "x2iezn.2xlarge",
            "x2iezn.4xlarge",
            "x2iezn.6xlarge",
            "x2iezn.8xlarge",
            "z1d.12xlarge",
            "z1d.2xlarge",
            "z1d.3xlarge",
            "z1d.6xlarge",
            "z1d.large",
            "z1d.xlarge"
        ]
        self.check_get_instance_by_spec(min_mem_gb, min_cores, min_freq, exp_instance_types)

        min_mem_gb = 1537
        min_cores = 17
        min_freq = 4.5
        exp_instance_types = [
        ]
        self.check_get_instance_by_spec(min_mem_gb, min_cores, min_freq, exp_instance_types)

        min_mem_gb = 1536
        min_cores = 17
        min_freq = 4.5
        exp_num_instance_types = 1
        exp_instance_types = [
            "x2iezn.12xlarge",
        ]
        self.check_get_instance_by_spec(min_mem_gb, min_cores, min_freq, exp_instance_types)

        min_mem_gb = 1535
        min_cores = 17
        min_freq = 4.5
        exp_num_instance_types = 1
        exp_instance_types = [
            "x2iezn.12xlarge",
        ]
        self.check_get_instance_by_spec(min_mem_gb, min_cores, min_freq, exp_instance_types)

        min_mem_gb = 768
        min_cores = 16
        min_freq = 4.5
        exp_num_instance_types = 2
        exp_instance_types = [
            "x2iezn.12xlarge",
            "x2iezn.8xlarge",
        ]
        self.check_get_instance_by_spec(min_mem_gb, min_cores, min_freq, exp_instance_types)

        min_mem_gb = 768
        min_cores = 1
        min_freq = 3
        exp_instance_types = [
            "m6a.48xlarge",
            "r5.24xlarge",
            "r6i.24xlarge",
            "r6i.32xlarge",
            "r6id.24xlarge",
            "r6id.32xlarge",
            "r6idn.24xlarge",
            "r6idn.32xlarge",
            "r6in.24xlarge",
            "r6in.32xlarge",
            "x2idn.16xlarge",
            "x2idn.24xlarge",
            "x2idn.32xlarge",
            "x2iedn.16xlarge",
            "x2iedn.24xlarge",
            "x2iedn.32xlarge",
            "x2iedn.8xlarge",
            "x2iezn.12xlarge",
            "x2iezn.6xlarge",
            "x2iezn.8xlarge",
        ]
        self.check_get_instance_by_spec(min_mem_gb, min_cores, min_freq, exp_instance_types)

        min_mem_gb = 32
        min_cores = 24
        min_freq = 2
        exp_instance_types = [
            "c5.12xlarge",
            "c5.18xlarge",
            "c5.24xlarge",
            "c6a.12xlarge",
            "c6a.16xlarge",
            "c6a.24xlarge",
            "c6a.32xlarge",
            "c6a.48xlarge",
            "c6i.12xlarge",
            "c6i.16xlarge",
            "c6i.24xlarge",
            "c6i.32xlarge",
            "c6id.12xlarge",
            "c6id.16xlarge",
            "c6id.24xlarge",
            "c6id.32xlarge",
            "c6in.12xlarge",
            "c6in.16xlarge",
            "c6in.24xlarge",
            "c6in.32xlarge",
            "m5.12xlarge",
            "m5.16xlarge",
            "m5.24xlarge",
            "m6a.12xlarge",
            "m6a.16xlarge",
            "m6a.24xlarge",
            "m6a.32xlarge",
            "m6a.48xlarge",
            "m6i.12xlarge",
            "m6i.16xlarge",
            "m6i.24xlarge",
            "m6i.32xlarge",
            "m6id.12xlarge",
            "m6id.16xlarge",
            "m6id.24xlarge",
            "m6id.32xlarge",
            "m6idn.12xlarge",
            "m6idn.16xlarge",
            "m6idn.24xlarge",
            "m6idn.32xlarge",
            "m6in.12xlarge",
            "m6in.16xlarge",
            "m6in.24xlarge",
            "m6in.32xlarge",
            "r5.12xlarge",
            "r5.16xlarge",
            "r5.24xlarge",
            "r6i.12xlarge",
            "r6i.16xlarge",
            "r6i.24xlarge",
            "r6i.32xlarge",
            "r6id.12xlarge",
            "r6id.16xlarge",
            "r6id.24xlarge",
            "r6id.32xlarge",
            "r6idn.12xlarge",
            "r6idn.16xlarge",
            "r6idn.24xlarge",
            "r6idn.32xlarge",
            "r6in.12xlarge",
            "r6in.16xlarge",
            "r6in.24xlarge",
            "r6in.32xlarge",
            "x2idn.16xlarge",
            "x2idn.24xlarge",
            "x2idn.32xlarge",
            "x2iedn.16xlarge",
            "x2iedn.24xlarge",
            "x2iedn.32xlarge",
            "x2iezn.12xlarge",
            "z1d.12xlarge",
        ]
        self.check_get_instance_by_spec(min_mem_gb, min_cores, min_freq, exp_instance_types)

        min_mem_gb = 1
        min_cores = 47
        min_freq = 1
        exp_num_instance_types = 11
        exp_instance_types = [
            "c5.24xlarge",
            "c6a.24xlarge",
            "c6a.32xlarge",
            "c6a.48xlarge",
            "c6i.24xlarge",
            "c6i.32xlarge",
            "c6id.24xlarge",
            "c6id.32xlarge",
            "c6in.24xlarge",
            "c6in.32xlarge",
            "m5.24xlarge",
            "m6a.24xlarge",
            "m6a.32xlarge",
            "m6a.48xlarge",
            "m6i.24xlarge",
            "m6i.32xlarge",
            "m6id.24xlarge",
            "m6id.32xlarge",
            "m6idn.24xlarge",
            "m6idn.32xlarge",
            "m6in.24xlarge",
            "m6in.32xlarge",
            "r5.24xlarge",
            "r6i.24xlarge",
            "r6i.32xlarge",
            "r6id.24xlarge",
            "r6id.32xlarge",
            "r6idn.24xlarge",
            "r6idn.32xlarge",
            "r6in.24xlarge",
            "r6in.32xlarge",
            "x2idn.24xlarge",
            "x2idn.32xlarge",
            "x2iedn.24xlarge",
            "x2iedn.32xlarge",
        ]
        self.check_get_instance_by_spec(min_mem_gb, min_cores, min_freq, exp_instance_types)

        self._restore_instance_type_info()

    order += 1
    @pytest.mark.order(order)
    def test_get_instance_by_pricing(self):
        self._use_static_instance_type_info()

        jobAnalyzer = self.get_jobAnalyzer()

        if not jobAnalyzer.instance_type_info:
            jobAnalyzer.get_instance_type_info()

        exp_instance_family_counts = {
            'c5': 8,
            'c6a': 10,
            'c6i': 9,
            'c6id': 9,
            'c6in': 9,
            'm5': 8,
            'm6a': 10,
            'm6i': 9,
            'm6id': 9,
            'm6idn': 9,
            'm6in': 9,
            'r5': 8,
            'r6i': 9,
            'r6id': 9,
            'r6idn': 9,
            'r6in': 9,
            'z1d': 6,
            'x2idn': 3,
            'x2iedn': 7,
            'x2iezn': 5,
        }
        act_instance_family_counts = {}
        for instance_type in jobAnalyzer.instance_types:
            instance_family = instance_type.split('.')[0]
            act_instance_family_counts[instance_family] = act_instance_family_counts.get(instance_family, 0) + 1
        missing_exp_instance_families = {}
        for instance_family, act_count in act_instance_family_counts.items():
            if instance_family not in exp_instance_family_counts:
                missing_exp_instance_families[instance_family] = act_count
                continue
            assert(act_count == exp_instance_family_counts[instance_family])
        missing_act_instance_families = {}
        for instance_family, exp_count in exp_instance_family_counts.items():
            if instance_family not in act_instance_family_counts:
                missing_act_instance_families[instance_family] = exp_count
                continue
            assert(instance_family in act_instance_family_counts)
        assert len(missing_exp_instance_families) == 0
        assert len(missing_act_instance_families) == 0

        (instance_type, price) = jobAnalyzer.get_lowest_priced_instance(['c5.large', 'c6i.large', 'c6id.large'], False)
        exp_instance_type = 'c6i.large'
        assert(instance_type == exp_instance_type)
        assert(price == jobAnalyzer.instance_type_info[exp_instance_type]['pricing']['OnDemand'])

        (instance_type, price) = jobAnalyzer.get_lowest_priced_instance(['c5.large', 'c6i.large', 'c6id.large'], True)
        exp_instance_type = 'c5.large'
        assert(instance_type == exp_instance_type)
        assert(price == jobAnalyzer.instance_type_info[exp_instance_type]['pricing']['spot']['max'])

        (instance_type, price) = jobAnalyzer.get_lowest_priced_instance(['c6id.xlarge', 'c6i.xlarge', 'c5.xlarge'], False)
        exp_instance_type = 'c6i.xlarge'
        assert(instance_type == exp_instance_type)
        assert(price == jobAnalyzer.instance_type_info[exp_instance_type]['pricing']['OnDemand'])

        (instance_type, price) = jobAnalyzer.get_lowest_priced_instance(['c6id.xlarge', 'c6i.xlarge', 'c5.xlarge'], True)
        exp_instance_type = 'c5.xlarge'
        assert(instance_type == exp_instance_type)
        assert(price == jobAnalyzer.instance_type_info[exp_instance_type]['pricing']['spot']['max'])

        (instance_type, price) = jobAnalyzer.get_lowest_priced_instance(['c6i.8xlarge', 'r5.8xlarge'], False)
        exp_instance_type = 'c6i.8xlarge'
        assert(instance_type == exp_instance_type)
        assert(price == jobAnalyzer.instance_type_info[exp_instance_type]['pricing']['OnDemand'])

        (instance_type, price) = jobAnalyzer.get_lowest_priced_instance(['c6i.8xlarge', 'r5.8xlarge'], True)
        exp_instance_type = 'r5.8xlarge'
        assert(instance_type == exp_instance_type)
        assert(price == jobAnalyzer.instance_type_info[exp_instance_type]['pricing']['spot']['max'])

        self._restore_instance_type_info()

    order += 1
    @pytest.mark.order(order)
    def test_multi_hour_jobs(self):
        '''
        Test JobAnalyzer when jobs are longer than an hour.
        '''
        # Remove credentials to ensure instance_type_info.json is used.
        self._remove_credentials()

        self.cleanup_output_files()
        jobs_csv = 'test_files/JobAnalyzer/multi-hour/jobs.csv'
        output_dir = 'output/JobAnalyzer/multi-hour'
        # Put this in a try block so that can print the output if an unexpected exception occurs.
        try:
            check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--output-dir', output_dir, '-d', 'csv', '--input-csv', jobs_csv], stderr=subprocess.STDOUT, encoding='utf8')
        except CalledProcessError as e:
            print(f"returncode: {e.returncode}")
            print(f"output:\n{e.stdout}")
            raise
        csv_files_dir = output_dir
        csv_files = [
            'hourly-457718.csv',
            'hourly_stats.csv',
            'summary.csv'
            ]
        for csv_file in csv_files:
            assert(filecmp.cmp(path.join(csv_files_dir, csv_file), path.join(output_dir, csv_file), shallow=False))

        self._restore_credentials()

    order += 1
    @pytest.mark.order(order)
    def test_from_accelerator(self):
        '''
        Test JobAnalyzer when parsing jobs from Accelerator logs.
        '''
        try:
            result = subprocess.run(["nc", "-h"], stdout=subprocess.PIPE, stderr=subprocess.STDOUT, encoding='UTF-8') # nosec
        except FileNotFoundError as e:
            print(f"Cannot find nc command.")
            return
        except CalledProcessError as e:
            print(f"'nc -h' failed.")
            print(f"returncode: {e.returncode}")
            print(f"output:\n{e.stdout}")
            return
        output = result.stdout
        if result.returncode != 2 or 'Altair Engineering.' not in output:
            print(f"Unexpected result from 'nc -h'\nreturncode: expected 2, actual {result.returncode}\noutput:\n{output}")
            if 'Usage: nc' in output:
                print(f"'nc -h' called ncat (netcat), not Altair nc.")
            print(f"'nc -h' failed.")
            return

        self._remove_credentials()

        self._use_static_instance_type_info()

        self.cleanup_output_files()
        test_files_dir = 'test_files/AcceleratorLogParser'
        expected_output_csv = path.join(test_files_dir, 'exp_jobs.csv')
        output_dir = 'output/JobAnalyzer/accelerator'
        output_csv = path.join(output_dir, 'jobs.csv')
        # Put this in a try block so that can print the output if an unexpected exception occurs.
        try:
            check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--output-csv', output_csv, '--output-dir', output_dir, 'accelerator', '--logfile-dir', test_files_dir], stderr=subprocess.STDOUT, encoding='utf8')
        except CalledProcessError as e:
            print(f"returncode: {e.returncode}")
            print(f"output:\n{e.stdout}")
            raise
        assert(filecmp.cmp(output_csv, expected_output_csv, shallow=False))

        csv_files = [
            'hourly_stats.csv',
            'summary.csv'
            ]
        for csv_file in csv_files:
            assert(path.exists(csv_file))

        self._restore_instance_type_info()

        self._restore_credentials()

    order += 1
    @pytest.mark.order(order)
    def test_from_accelerator_sql_file(self):
        '''
        Test JobAnalyzer when parsing jobs from Accelerator sql output.
        '''
        self._remove_credentials()

        self._use_static_instance_type_info()

        self.cleanup_output_files()

        test_files_dir = 'test_files/AcceleratorLogParser'
        sql_input_file = path.join(test_files_dir, 'sql_output.txt')
        expected_output_csv = path.join(test_files_dir, 'exp_jobs.csv')
        output_dir = 'output/JobAnalyzer/accelerator'
        output_csv = path.join(output_dir, 'jobs.csv')
        exp_output_csv = path.join(test_files_dir, 'exp_jobs.csv')
        # Put this in a try block so that can print the output if an unexpected exception occurs.
        try:
            output = check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--output-csv', output_csv, '--output-dir', output_dir, 'accelerator', '--sql-input-file', sql_input_file], stderr=subprocess.STDOUT, encoding='utf8')
        except CalledProcessError as e:
            print(f"returncode: {e.returncode}")
            print(f"output:\n{e.stdout}")
            raise
        print(f"output:\n{output}")
        assert(filecmp.cmp(output_csv, expected_output_csv, shallow=False))

        csv_files = [
            'hourly_stats.csv',
            'summary.csv'
            ]
        exp_csv_files_dir = 'test_files/JobAnalyzer/accelerator'
        exp_csv_files = self._get_hourly_files(exp_csv_files_dir) + csv_files
        act_csv_files = self._get_hourly_files(output_dir) + csv_files
        print(f"exp_csv_files: {exp_csv_files}")
        print(f"act_csv_files: {act_csv_files}")
        for exp_csv_file in exp_csv_files:
            assert(exp_csv_file in act_csv_files)
        for act_csv_file in exp_csv_files:
            assert(act_csv_file in exp_csv_files)
        for csv_file in exp_csv_files:
            assert(filecmp.cmp(path.join(output_dir, csv_file), path.join(exp_csv_files_dir, csv_file), shallow=False))

        self._restore_instance_type_info()

        self._restore_credentials()

    order += 1
    @pytest.mark.order(order)
    def test_from_accelerator_csv(self):
        self._remove_credentials()

        self._use_static_instance_type_info()

        self.cleanup_output_files()
        test_files_dir = 'test_files/AcceleratorLogParser'
        input_csv = path.join(test_files_dir, 'exp_jobs.csv')
        output_dir = 'output/JobAnalyzer/accelerator'
        output_csv = path.join(output_dir, 'jobs.csv')
        expected_output_csv = input_csv
        try:
            output = check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--output-csv', output_csv, '--output-dir', output_dir, 'csv', '--input-csv', input_csv], stderr=subprocess.STDOUT, encoding='utf8')
        except CalledProcessError as e:
            print(f"returncode: {e.returncode}")
            print(f"output:\n{e.stdout}")
            raise
        print(f"output:\n{output}")

        assert(filecmp.cmp(output_csv, expected_output_csv, shallow=False))

        exp_csv_files_dir = 'test_files/JobAnalyzer/accelerator'
        exp_csv_files = self._get_hourly_files(exp_csv_files_dir)
        act_csv_files = self._get_hourly_files(output_dir)
        for exp_csv_file in exp_csv_files:
            assert(exp_csv_file in act_csv_files)
        for act_csv_file in exp_csv_files:
            assert(act_csv_file in exp_csv_files)
        csv_files = exp_csv_files + [
            'hourly_stats.csv',
            'summary.csv'
            ]
        for csv_file in csv_files:
            assert(filecmp.cmp(path.join(output_dir, csv_file), path.join(exp_csv_files_dir, csv_file), shallow=False))

        self._restore_instance_type_info()

        self._restore_credentials()

    order += 1
    @pytest.mark.order(order)
    def test_from_lsf(self):
        '''
        Test JobAnalyzer when parsing jobs from LSF logs.
        '''
        self._remove_credentials()
        try:
            self._use_static_instance_type_info()

            self.cleanup_output_files()
            test_files_dir = 'test_files/LSFLogParser'
            expected_output_csv = path.join(test_files_dir, 'exp_jobs.csv')
            output_dir = 'output/JobAnalyzer/lsf'
            output_csv = path.join(output_dir, 'jobs.csv')
            # Put this in a try block so that can print the output if an unexpected exception occurs.
            try:
                output = check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--output-csv', output_csv, '--output-dir', output_dir, '--debug', 'lsf', '--logfile-dir', test_files_dir, '--default-max-mem-gb', str(self.default_max_mem_gb)], stderr=subprocess.STDOUT, encoding='utf8')
            except CalledProcessError as e:
                print(e.output)
                raise
            print(f"output:\n{output}")

            assert(filecmp.cmp(expected_output_csv, output_csv, shallow=False))

            exp_csv_files_dir = 'test_files/JobAnalyzer/lsf'
            exp_csv_files = self._get_hourly_files(exp_csv_files_dir)
            act_csv_files = self._get_hourly_files(output_dir)
            for exp_csv_file in exp_csv_files:
                assert(exp_csv_file in act_csv_files)
            for act_csv_file in exp_csv_files:
                assert(act_csv_file in exp_csv_files)
            csv_files = exp_csv_files + [
                'hourly_stats.csv',
                'summary.csv'
                ]
            for csv_file in csv_files:
                assert(filecmp.cmp(path.join(output_dir, csv_file), path.join(exp_csv_files_dir, csv_file), shallow=False))
        finally:
            self._restore_instance_type_info()

            self._restore_credentials()

    order += 1
    @pytest.mark.order(order)
    def test_from_lsf_csv(self):
        try:
            self._remove_credentials()

            self._use_static_instance_type_info()

            self.cleanup_output_files()
            test_files_dir = 'test_files/LSFLogParser'
            input_csv = path.join(test_files_dir, 'exp_jobs.csv')
            output_dir = 'output/JobAnalyzer/lsf'
            output_csv = path.join(output_dir, 'jobs.csv')
            expected_output_csv = input_csv
            try:
                output = check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--output-csv', output_csv, '--output-dir', output_dir, 'csv', '--input-csv', input_csv], stderr=subprocess.STDOUT, encoding='utf8')
            except CalledProcessError as e:
                print(e.output)
                raise
            print(f"output:\n{output}")

            assert(filecmp.cmp(expected_output_csv, output_csv, shallow=False))

            exp_csv_files_dir = 'test_files/JobAnalyzer/lsf'
            exp_csv_files = self._get_hourly_files(exp_csv_files_dir)
            act_csv_files = self._get_hourly_files(output_dir)
            for exp_csv_file in exp_csv_files:
                assert(exp_csv_file in act_csv_files)
            for act_csv_file in exp_csv_files:
                assert(act_csv_file in exp_csv_files)
            csv_files = exp_csv_files + [
                'hourly_stats.csv',
                'summary.csv'
                ]
            for csv_file in csv_files:
                assert(filecmp.cmp(path.join(exp_csv_files_dir, csv_file), path.join(output_dir, csv_file), shallow=False))
        finally:
            self._restore_instance_type_info()
            self._restore_credentials()

    order += 1
    @pytest.mark.order(order)
    def test_from_slurm_sacct_file_multi_node(self):
        self._remove_credentials()

        self._use_static_instance_type_info()

        self.cleanup_output_files()
        sacct_input_file = 'test_files/SlurmLogParser/multi-node/sacct-output.txt'
        output_dir = 'output/JobAnalyzer/slurm/multi-node'
        exp_csv_files_dir = 'test_files/JobAnalyzer/slurm/multi-node'
        # Put this in a try block so that can print the output if an unexpected exception occurs.
        try:
            output = check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--output-dir', output_dir, '--debug', 'slurm', '--sacct-input-file', sacct_input_file], stderr=subprocess.STDOUT, encoding='utf8')
        except CalledProcessError as e:
            print(e.output)
            raise
        print(f"output:\n{output}")

        exp_csv_files = self._get_hourly_files(exp_csv_files_dir)
        act_csv_files = self._get_hourly_files(output_dir)
        for exp_csv_file in exp_csv_files:
            assert(exp_csv_file in act_csv_files)
        for act_csv_file in exp_csv_files:
            assert(act_csv_file in exp_csv_files)
        csv_files = exp_csv_files + [
            'hourly_stats.csv',
            'summary.csv'
            ]
        for csv_file in csv_files:
            assert(filecmp.cmp(path.join(output_dir, csv_file), path.join(exp_csv_files_dir, csv_file), shallow=False))

        self._restore_instance_type_info()

        self._restore_credentials()

    order += 1
    @pytest.mark.order(order)
    def test_from_slurm_sacct_file_array(self):
        # Make sure can run w/o credentials
        self._remove_credentials()

        self._use_static_instance_type_info()

        self.cleanup_output_files()
        sacct_input_file = 'test_files/SlurmLogParser/array/sacct-output.txt'
        output_dir = 'output/JobAnalyzer/slurm/array'
        exp_csv_files_dir = 'test_files/JobAnalyzer/slurm/array'
        # Put this in a try block so that can print the output if an unexpected exception occurs.
        try:
            output = check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--output-dir', output_dir, '--debug', 'slurm', '--sacct-input-file', sacct_input_file], stderr=subprocess.STDOUT, encoding='utf8')
        except CalledProcessError as e:
            print(e.output)
            raise
        print(f"output:\n{output}")

        exp_csv_files = self._get_hourly_files(exp_csv_files_dir)
        act_csv_files = self._get_hourly_files(output_dir)
        for exp_csv_file in exp_csv_files:
            assert(exp_csv_file in act_csv_files)
        for act_csv_file in exp_csv_files:
            assert(act_csv_file in exp_csv_files)
        csv_files = exp_csv_files + [
            'hourly_stats.csv',
            'summary.csv'
            ]
        for csv_file in csv_files:
            assert(filecmp.cmp(path.join(output_dir, csv_file), path.join(exp_csv_files_dir, csv_file), shallow=False))

        self._restore_instance_type_info()

        self._restore_credentials()

    order += 1
    @pytest.mark.order(order)
    def test_from_slurm_sacct_file_long(self):
        self._remove_credentials()

        self._use_static_instance_type_info()

        self.cleanup_output_files()
        sacct_input_file = 'test_files/SlurmLogParser/sacct-output-v2.txt'
        output_dir = 'output/JobAnalyzer/slurm/long'
        exp_csv_files_dir = 'test_files/JobAnalyzer/slurm/long'
        # Put this in a try block so that can print the output if an unexpected exception occurs.
        try:
            output = check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--output-dir', output_dir, 'slurm', '--sacct-input-file', sacct_input_file], stderr=subprocess.STDOUT, encoding='utf8')
        except CalledProcessError as e:
            print(e.output)
            raise
        print(f"output:\n{output}")

        exp_csv_files = self._get_hourly_files(exp_csv_files_dir)
        act_csv_files = self._get_hourly_files(output_dir)
        for exp_csv_file in exp_csv_files:
            assert(exp_csv_file in act_csv_files)
        for act_csv_file in exp_csv_files:
            assert(act_csv_file in exp_csv_files)
        csv_files = exp_csv_files + [
            'hourly_stats.csv',
            'summary.csv'
            ]
        for csv_file in csv_files:
            assert(filecmp.cmp(path.join(output_dir, csv_file), path.join(exp_csv_files_dir, csv_file), shallow=False))

        self._restore_instance_type_info()

        self._restore_credentials()

    order += 1
    @pytest.mark.order(order)
    def test_from_slurm(self):
        # Only run this test if sacct is in the path so can run tests on instances without slurm
        try:
            check_output(["squeue"]) # nosec
        except (CalledProcessError, FileNotFoundError) as e:
            print(f"Slurm is not installed or available in the path.")
            return

        self._remove_credentials()

        self._use_static_instance_type_info()

        output = check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--output-dir', 'output/JobAnalyzer/slurm', 'slurm'], stderr=subprocess.STDOUT, encoding='utf8')

        self.cleanup_output_files()
        output_dir = 'output/JobAnalyzer/slurm'
        # Put this in a try block so that can print the output if an unexpected exception occurs.
        try:
            output = check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--output-dir', output_dir, 'slurm'], stderr=subprocess.STDOUT, encoding='utf8')
        except CalledProcessError as e:
            print(e.output)
            raise

        self._restore_instance_type_info()

        self._restore_credentials()

    order += 1
    @pytest.mark.order(order)
    def _run_filter_test(self, test_files_dir, output_dir, exp_csv_files_dir, queues=None, projects=None):
        self._remove_credentials()

        self._use_static_instance_type_info()

        self.cleanup_output_files()
        input_csv = path.join(test_files_dir, 'jobs.csv')
        output_csv = path.join(output_dir, 'jobs.csv')
        expected_output_csv = path.join(exp_csv_files_dir, 'exp_jobs.csv')
        args = ['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--output-csv', output_csv, '--output-dir', output_dir]
        if queues:
            args.extend(['--queues', queues])
            print(f"args: {args}")
        if projects:
            args.extend(['--projects', projects])
            print(f"args: {args}")
        args.extend(['-d', 'csv', '--input-csv', input_csv])
        print(f"args: {args}")
        try:
            output = check_output(args, stderr=subprocess.STDOUT, encoding='utf8')
        except CalledProcessError as e:
            print(e.output)
            raise
        print(f"output:\n{output}")

        assert(filecmp.cmp(output_csv, expected_output_csv, shallow=False))

        exp_csv_files = self._get_hourly_files(exp_csv_files_dir)
        act_csv_files = self._get_hourly_files(output_dir)
        for exp_csv_file in exp_csv_files:
            assert(exp_csv_file in act_csv_files)
        for act_csv_file in exp_csv_files:
            assert(act_csv_file in exp_csv_files)
        csv_files = exp_csv_files + [
            'hourly_stats.csv',
            'summary.csv'
            ]
        for csv_file in csv_files:
            assert(filecmp.cmp(path.join(output_dir, csv_file), path.join(exp_csv_files_dir, csv_file), shallow=False))

        self._restore_instance_type_info()

        self._restore_credentials()

    order += 1
    @pytest.mark.order(order)
    def test_filter_queues_include_queue1(self):
        test_files_dir = 'test_files/JobAnalyzer/filter_queues'
        output_dir = 'output/JobAnalyzer/filter_queues/include_queue1'
        exp_csv_files_dir = path.join(test_files_dir, 'include_queue1')
        self._run_filter_test(test_files_dir, output_dir, exp_csv_files_dir, queues="'queue1'")

    order += 1
    @pytest.mark.order(order)
    def test_filter_queues_exclude_queue1(self):
        test_files_dir = 'test_files/JobAnalyzer/filter_queues'
        output_dir = 'output/JobAnalyzer/filter_queues/exclude_queue1'
        exp_csv_files_dir = 'test_files/JobAnalyzer/filter_queues/exclude_queue1'
        self._run_filter_test(test_files_dir, output_dir, exp_csv_files_dir, queues="'-queue1,.*'")

    order += 1
    @pytest.mark.order(order)
    def test_filter_queues_include_queue1_exclude_queue1(self):
        test_files_dir = 'test_files/JobAnalyzer/filter_queues'
        output_dir = 'output/JobAnalyzer/filter_queues/include_queue1_exclude_queue1'
        exp_csv_files_dir = 'test_files/JobAnalyzer/filter_queues/include_queue1'
        self._run_filter_test(test_files_dir, output_dir, exp_csv_files_dir, queues="'queue1,-queue1'")

    order += 1
    @pytest.mark.order(order)
    def test_filter_queues_include_queue2(self):
        test_files_dir = 'test_files/JobAnalyzer/filter_queues'
        output_dir = 'output/JobAnalyzer/filter_queues/include_queue2'
        exp_csv_files_dir = path.join(test_files_dir, 'include_queue2')
        self._run_filter_test(test_files_dir, output_dir, exp_csv_files_dir, queues="'queue2'")

    order += 1
    @pytest.mark.order(order)
    def test_issue_13_no_instance_types_found(self):
        self._use_static_instance_type_info()

        self.cleanup_output_files()
        test_files_dir = 'test_files/JobAnalyzer/issues/13'
        config_file = path.join(test_files_dir, 'config-eu-west-1.yml')
        input_csv = path.join(test_files_dir, 'exp_jobs.csv')
        output_dir = 'output/JobAnalyzer/issues/13'
        output_csv = path.join(output_dir, 'jobs.csv')
        expected_output_csv = input_csv
        with pytest.raises(CalledProcessError) as excinfo:
            check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--config', config_file, '--output-csv', output_csv, '--output-dir', output_dir, 'csv', '--input-csv', input_csv], stderr=subprocess.STDOUT, encoding='utf8')
        print(excinfo.value)
        print(excinfo.value.output)
        assert('No instance types selected by instance_mapping' in excinfo.value.output)
        assert(excinfo.value.returncode == 2)

        self._restore_instance_type_info()

    order += 1
    @pytest.mark.order(order)
    def test_issue_13_no_spot_pricing(self):
        self._use_static_instance_type_info()

        self.cleanup_output_files()
        test_files_dir = 'test_files/JobAnalyzer/issues/13'
        config_file = path.join(test_files_dir, 'config-us-east-2.yml')
        input_csv = path.join(test_files_dir, 'exp_jobs.csv')
        output_dir = 'output/JobAnalyzer/issues/13'
        output_csv = path.join(output_dir, 'jobs.csv')
        expected_output_csv = input_csv
        try:
            output = check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--config', config_file, '--output-csv', output_csv, '--output-dir', output_dir, 'csv', '--input-csv', input_csv], stderr=subprocess.STDOUT, encoding='utf8')
        except CalledProcessError as e:
            print(e.output)
            raise
        print(f"output:\n{output}")

        assert(filecmp.cmp(expected_output_csv, output_csv, shallow=False))

        exp_csv_files_dir = 'test_files/JobAnalyzer/issues/13'
        exp_csv_files = self._get_hourly_files(exp_csv_files_dir)
        act_csv_files = self._get_hourly_files(output_dir)
        for exp_csv_file in exp_csv_files:
            assert(exp_csv_file in act_csv_files)
        for act_csv_file in exp_csv_files:
            assert(act_csv_file in exp_csv_files)
        csv_files = exp_csv_files + [
            'hourly_stats.csv',
            'summary.csv'
            ]
        for csv_file in csv_files:
            assert(filecmp.cmp(path.join(output_dir, csv_file), path.join(exp_csv_files_dir, csv_file), shallow=False))

        self._restore_instance_type_info()

    order += 1
    @pytest.mark.order(order)
    def test_issue_31_negative_wait_time(self):
        self._use_static_instance_type_info()

        self.cleanup_output_files()
        test_files_dir = 'test_files/JobAnalyzer/issues/31'
        input_csv = path.join(test_files_dir, 'jobs.csv')
        output_dir = 'output/JobAnalyzer/issues/31'
        output_csv = path.join(output_dir, 'jobs.csv')
        expected_output_csv = path.join(test_files_dir, 'exp_jobs.csv')
        try:
            output = check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--config', self.CONFIG_FILENAME, '--output-csv', output_csv, '--output-dir', output_dir, 'csv', '--input-csv', input_csv], stderr=subprocess.STDOUT, encoding='utf8')
        except CalledProcessError as e:
            print(e.output)
            raise
        print(f"output:\n{output}")

        assert(filecmp.cmp(output_csv, expected_output_csv, shallow=False))

        exp_csv_files_dir = 'test_files/JobAnalyzer/issues/31'
        exp_csv_files = self._get_hourly_files(exp_csv_files_dir)
        act_csv_files = self._get_hourly_files(output_dir)
        for exp_csv_file in exp_csv_files:
            assert(exp_csv_file in act_csv_files)
        for act_csv_file in exp_csv_files:
            assert(act_csv_file in exp_csv_files)
        csv_files = exp_csv_files + [
            'hourly_stats.csv',
            'summary.csv'
            ]
        for csv_file in csv_files:
            assert(filecmp.cmp(path.join(exp_csv_files_dir, csv_file), path.join(output_dir, csv_file), shallow=False))

        self._restore_instance_type_info()

    order += 1
    @pytest.mark.order(order)
    def test_issue_72_starttime_endtime_scenario_1(self):
        try:
            self._remove_credentials()
            self._use_static_instance_type_info()

            test_files_dir = 'test_files/JobAnalyzer/issues/72'
            input_csv = path.join(test_files_dir, 'jobs.csv')
            output_dir = 'output/JobAnalyzer/issues/72'
            output_csv = path.join(output_dir, 'jobs.csv')

            #----------------------------------------------
            # Scenario 1
            #
            # starttime and endtime before the first job
            #----------------------------------------------
            starttime = '2022-02-13T00:00:00'
            endtime = '2022-02-13T02:00:00'
            exp_results_dir = path.join(test_files_dir, 'scenario_1')
            exp_output_csv = path.join(exp_results_dir, 'exp_jobs.csv')
            self.cleanup_output_files()
            try:
                output = check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--output-csv', output_csv, '--output-dir', output_dir, '--starttime', starttime, '--endtime', endtime, 'csv', '--input-csv', input_csv], stderr=subprocess.STDOUT, encoding='utf8')
            except CalledProcessError as e:
                print(e.output)
                raise
            print(f"output:\n{output}")
            assert(filecmp.cmp(exp_output_csv, output_csv, shallow=False))
            exp_csv_files = self._get_hourly_files(exp_results_dir)
            act_csv_files = self._get_hourly_files(output_dir)
            for exp_csv_file in exp_csv_files:
                assert(exp_csv_file in act_csv_files)
            for act_csv_file in exp_csv_files:
                assert(act_csv_file in exp_csv_files)
            csv_files = exp_csv_files
            for csv_file in csv_files:
                assert(filecmp.cmp(path.join(exp_results_dir, csv_file), path.join(output_dir, csv_file), shallow=False))

        finally:
            self._restore_instance_type_info()
            self._restore_credentials()

    order += 1
    @pytest.mark.order(order)
    def test_issue_72_starttime_endtime_scenario_2(self):
        try:
            self._remove_credentials()
            self._use_static_instance_type_info()

            test_files_dir = 'test_files/JobAnalyzer/issues/72'
            input_csv = path.join(test_files_dir, 'jobs.csv')
            output_dir = 'output/JobAnalyzer/issues/72'
            output_csv = path.join(output_dir, 'jobs.csv')

            #----------------------------------------------
            # Scenario 2
            #
            # starttime before 1st job to make sure initial empty hours are filled
            #----------------------------------------------
            starttime = '2022-02-14T07:00:00'
            endtime = '2022-02-14T09:00:00'
            exp_results_dir = path.join(test_files_dir, 'scenario_2')
            exp_output_csv = path.join(exp_results_dir, 'exp_jobs.csv')
            self.cleanup_output_files()
            try:
                output = check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--output-csv', output_csv, '--output-dir', output_dir, '--starttime', starttime, '--endtime', endtime, 'csv', '--input-csv', input_csv], stderr=subprocess.STDOUT, encoding='utf8')
            except CalledProcessError as e:
                print(e.output)
                raise
            print(f"output:\n{output}")
            assert(filecmp.cmp(exp_output_csv, output_csv, shallow=False))
            exp_csv_files = self._get_hourly_files(exp_results_dir)
            act_csv_files = self._get_hourly_files(output_dir)
            for exp_csv_file in exp_csv_files:
                assert(exp_csv_file in act_csv_files)
            for act_csv_file in exp_csv_files:
                assert(act_csv_file in exp_csv_files)
            csv_files = exp_csv_files + [
                'hourly_stats.csv',
                'summary.csv'
                ]
            for csv_file in csv_files:
                assert(filecmp.cmp(path.join(exp_results_dir, csv_file), path.join(output_dir, csv_file), shallow=False))
        finally:
            self._restore_instance_type_info()
            self._restore_credentials()

    order += 1
    @pytest.mark.order(order)
    def test_issue_72_starttime_endtime_scenario_3(self):
        try:
            self._remove_credentials()
            self._use_static_instance_type_info()

            test_files_dir = 'test_files/JobAnalyzer/issues/72'
            input_csv = path.join(test_files_dir, 'jobs.csv')
            output_dir = 'output/JobAnalyzer/issues/72'
            output_csv = path.join(output_dir, 'jobs.csv')

            #----------------------------------------------
            # Scenario 3
            #
            # starttime after 1st job to make sure initial jobs are excluded
            #----------------------------------------------
            starttime = '2022-02-14T08:00:00'
            endtime = '2022-02-14T09:00:00'
            exp_results_dir = path.join(test_files_dir, 'scenario_3')
            exp_output_csv = path.join(exp_results_dir, 'exp_jobs.csv')
            self.cleanup_output_files()
            try:
                output = check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--output-csv', output_csv, '--output-dir', output_dir, '--starttime', starttime, '--endtime', endtime, 'csv', '--input-csv', input_csv], stderr=subprocess.STDOUT, encoding='utf8')
            except CalledProcessError as e:
                print(e.output)
                raise
            print(f"output:\n{output}")
            assert(filecmp.cmp(exp_output_csv, output_csv, shallow=False))
            exp_csv_files = self._get_hourly_files(exp_results_dir)
            act_csv_files = self._get_hourly_files(output_dir)
            for exp_csv_file in exp_csv_files:
                assert(exp_csv_file in act_csv_files)
            for act_csv_file in exp_csv_files:
                assert(act_csv_file in exp_csv_files)
            csv_files = exp_csv_files + [
                'hourly_stats.csv',
                'summary.csv'
                ]
            for csv_file in csv_files:
                assert(filecmp.cmp(path.join(exp_results_dir, csv_file), path.join(output_dir, csv_file), shallow=False))
        finally:
            self._restore_instance_type_info()
            self._restore_credentials()

    order += 1
    @pytest.mark.order(order)
    def test_issue_72_starttime_endtime_scenario_4(self):
        try:
            self._remove_credentials()
            self._use_static_instance_type_info()

            test_files_dir = 'test_files/JobAnalyzer/issues/72'
            input_csv = path.join(test_files_dir, 'jobs.csv')
            output_dir = 'output/JobAnalyzer/issues/72'
            output_csv = path.join(output_dir, 'jobs.csv')

            #----------------------------------------------
            # Scenario 4
            #
            # endtime after last job to make sure that file is padded at end
            #----------------------------------------------
            starttime = '2022-02-01T00:00:00'
            endtime = '2022-02-28T23:59:59'
            exp_results_dir = path.join(test_files_dir, 'scenario_4')
            exp_output_csv = path.join(exp_results_dir, 'exp_jobs.csv')
            self.cleanup_output_files()
            try:
                output = check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--output-csv', output_csv, '--output-dir', output_dir, '--starttime', starttime, '--endtime', endtime, 'csv', '--input-csv', input_csv], stderr=subprocess.STDOUT, encoding='utf8')
            except CalledProcessError as e:
                print(e.output)
                raise
            print(f"output:\n{output}")
            assert(filecmp.cmp(exp_output_csv, output_csv, shallow=False))
            exp_csv_files = self._get_hourly_files(exp_results_dir)
            act_csv_files = self._get_hourly_files(output_dir)
            for exp_csv_file in exp_csv_files:
                assert(exp_csv_file in act_csv_files)
            for act_csv_file in exp_csv_files:
                assert(act_csv_file in exp_csv_files)
            csv_files = exp_csv_files + [
                'hourly_stats.csv',
                'summary.csv'
                ]
            for csv_file in csv_files:
                assert(filecmp.cmp(path.join(exp_results_dir, csv_file), path.join(output_dir, csv_file), shallow=False))
        finally:
            self._restore_instance_type_info()
            self._restore_credentials()

    order += 1
    @pytest.mark.order(order)
    def test_issue_73_existing_hourly_files(self):
        try:
            self._remove_credentials()

            self._use_static_instance_type_info()

            self.cleanup_output_files()

            test_files_dir = 'test_files/JobAnalyzer/issues/73'
            output_dir = 'output/issues/73'

            makedirs(output_dir)
            cmd = f"cp {test_files_dir}/hourly-*.csv {output_dir}"
            print(cmd)
            system(cmd)
            cmd = f"ls {output_dir}"
            print(cmd)
            system(cmd)

            # Put this in a try block so that can print the output if an unexpected exception occurs.
            try:
                output = check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--output-dir', output_dir, 'hourly_stats'], stderr=subprocess.STDOUT, encoding='utf8')
            except CalledProcessError as e:
                print(e.output)
                raise
            print(f"output:\n{output}")

            exp_csv_files_dir = test_files_dir
            exp_csv_files = self._get_hourly_files(exp_csv_files_dir)
            act_csv_files = self._get_hourly_files(output_dir)
            for exp_csv_file in exp_csv_files:
                assert(exp_csv_file in act_csv_files)
            for act_csv_file in exp_csv_files:
                assert(act_csv_file in exp_csv_files)
            csv_files = exp_csv_files + [
                'hourly_stats.csv'
                ]
            for csv_file in csv_files:
                assert(filecmp.cmp(path.join(output_dir, csv_file), path.join(exp_csv_files_dir, csv_file), shallow=False))
        finally:
            self._restore_instance_type_info()
            self._restore_credentials()

    order += 1
    @pytest.mark.order(order)
    def test_issue_74_hpc(self):
        self._use_static_instance_type_info()

        self.cleanup_output_files()
        test_files_dir = 'test_files/JobAnalyzer/issues/74'
        config_file = path.join(test_files_dir, 'config.yml')
        input_csv = path.join(test_files_dir, 'jobs.csv')
        output_dir = 'output/JobAnalyzer/issues/74'
        output_csv = path.join(output_dir, 'jobs.csv')
        expected_output_csv = path.join(test_files_dir, 'exp_jobs.csv')
        try:
            output = check_output(['./JobAnalyzer.py', '--disable-version-check', '--acknowledge-config', '--config', config_file, '--output-csv', output_csv, '--output-dir', output_dir, 'csv', '--input-csv', input_csv], stderr=subprocess.STDOUT, encoding='utf8')
        except CalledProcessError as e:
            print(e.output)
            raise
        print(f"output:\n{output}")

        assert(filecmp.cmp(output_csv, expected_output_csv, shallow=False))

        exp_csv_files_dir = 'test_files/JobAnalyzer/issues/74'
        exp_csv_files = self._get_hourly_files(exp_csv_files_dir)
        act_csv_files = self._get_hourly_files(output_dir)
        for exp_csv_file in exp_csv_files:
            assert(exp_csv_file in act_csv_files)
        for act_csv_file in exp_csv_files:
            assert(act_csv_file in exp_csv_files)
        csv_files = exp_csv_files + [
            'hourly_stats.csv',
            'summary.csv'
            ]
        for csv_file in csv_files:
            assert(filecmp.cmp(path.join(output_dir, csv_file), path.join(exp_csv_files_dir, csv_file), shallow=False))

        self._restore_instance_type_info()

    order += 1
    @pytest.mark.order(order)
    def test_get_instances(self):
        try:
            self.cleanup_output_files()

            self._remove_instance_type_info()

            jobAnalyzer = self.get_jobAnalyzer()

            jobAnalyzer.get_instance_type_info()

            exp_instance_family_counts = {
                'c5': 8,
                'c6a': 10,
                'c6i': 9,
                'c6id': 9,
                'c6in': 9,
                'm5': 8,
                'm6a': 10,
                'm6i': 9,
                'm6id': 9,
                'm6idn': 9,
                'm6in': 9,
                'r5': 8,
                'r6i': 9,
                'r6id': 9,
                'r6idn': 9,
                'r6in': 9,
                'z1d': 6,
                'x2idn': 3,
                'x2iedn': 7,
                'x2iezn': 5,
            }
            act_instance_family_counts = {}
            for instance_type in jobAnalyzer.instance_types:
                instance_family = instance_type.split('.')[0]
                act_instance_family_counts[instance_family] = act_instance_family_counts.get(instance_family, 0) + 1
            missing_exp_instance_families = {}
            for instance_family, act_count in act_instance_family_counts.items():
                if instance_family not in exp_instance_family_counts:
                    missing_exp_instance_families[instance_family] = act_count
                    continue
                assert(act_count == exp_instance_family_counts[instance_family])
            missing_act_instance_families = {}
            for instance_family, exp_count in exp_instance_family_counts.items():
                if instance_family not in act_instance_family_counts:
                    missing_act_instance_families[instance_family] = exp_count
                    continue
                assert(instance_family in act_instance_family_counts)
            assert len(missing_exp_instance_families) == 0
            assert len(missing_act_instance_families) == 0
            len(jobAnalyzer.instance_types) == 63

            # Make sure get same result with cached instance_type_info.json
            jobAnalyzer.get_instance_type_info()

            act_instance_family_counts = {}
            for instance_type in jobAnalyzer.instance_types:
                instance_family = instance_type.split('.')[0]
                act_instance_family_counts[instance_family] = act_instance_family_counts.get(instance_family, 0) + 1
            missing_exp_instance_families = {}
            for instance_family, act_count in act_instance_family_counts.items():
                if instance_family not in exp_instance_family_counts:
                    missing_exp_instance_families[instance_family] = act_count
                    continue
                assert(act_count == exp_instance_family_counts[instance_family])
            missing_act_instance_families = {}
            for instance_family, exp_count in exp_instance_family_counts.items():
                if instance_family not in act_instance_family_counts:
                    missing_act_instance_families[instance_family] = exp_count
                    continue
                assert(instance_family in act_instance_family_counts)
            assert len(missing_exp_instance_families) == 0
            assert len(missing_act_instance_families) == 0
            len(jobAnalyzer.instance_types) == 63
        finally:
            self._remove_instance_type_info()
            self._restore_instance_type_info()