import threading, time, cv2, ultralytics, torch, numpy as np, json
from datetime import datetime, timezone
import onnxruntime as ort
from .greengrass_mqtt_ipc import GreengrassMqtt
from .tensorrt_utils import TrtModel
from .utils import IOUtils, classes2names, classescount

MODEL_HEIGHT, MODEL_WIDTH = 640, 640
io_utuls = IOUtils(conf=0.3, iou=0.5, max_det=300, agnostic_nms=False, classes=None)

# Camera Class for starting/stopping a camera
class Camera:
    def __init__(self, config: dict) -> None:
        self.camera_id = config['camera_id']
        self.cam = None
        if self.camera_id.isnumeric():
            self.camera_id = int(self.camera_id)
        self.cam = cv2.VideoCapture(self.camera_id)
    def get_frame(self):
        if self.camera_status: return self.cam.read()[1]
        else: return None
    def stop_camera(self) -> None:
        self.cam.release()
    def camera_status(self):
        if not self.cam.isOpened():
            self.cam = cv2.VideoCapture(self.camera_id)
        return self.cam.isOpened()

# Inference Class for setting up the inference model, running inference and generating outputs
class Inference:
    def __init__(self, client: GreengrassMqtt, config: dict) -> None:
        self.camera = Camera(config = config)
        self.is_start, self.is_pause, self.is_stop = False, False, False
        self.client = client
        self.model_loc = config['model_loc']
        if 'MODEL_HEIGHT' in config: self.MODEL_HEIGHT = config['MODEL_HEIGHT']
        else: self.MODEL_HEIGHT = MODEL_HEIGHT
        if 'MODEL_WIDTH' in config: self.MODEL_WIDTH = config['MODEL_WIDTH']
        else: self.MODEL_WIDTH = MODEL_WIDTH

        self.model_type = None
        self.model = None
        self.fps = 0.0
        self.fps_arr = []
        self.model_input_shape, self.model_output_shape = [], []
        if '.pt' in self.model_loc: # if PyTorch Model
            self.model_type = 'pytorch'
            self.model = ultralytics.YOLO(self.model_loc)
            device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
            self.model.to(device)
            self.model_input_shape = (1, 3, self.MODEL_HEIGHT, self.MODEL_WIDTH)
            self.model_output_shape = (1, 84, int(8400*(self.MODEL_HEIGHT*self.MODEL_WIDTH)/(640*640)))
            print('[Inference] Success: Using YOLOv8 PyTorch model for inference...')
        elif '.onnx' in self.model_loc: # if ONNX Model
            self.model_type = 'onnx'
            so = ort.SessionOptions()
            so.graph_optimization_level = ort.GraphOptimizationLevel.ORT_ENABLE_ALL
            self.model = ort.InferenceSession(self.model_loc, sess_options=so, providers=['CUDAExecutionProvider'])
            self.model_input_shape = self.model.get_inputs()[0].shape
            self.model_output_shape = self.model.get_outputs()[0].shape
            print('[Inference] Success: Using YOLOv8 ONNX model for inference...')
        elif '.trt' in self.model_loc: # if TensorRT Model
            self.model_type = 'tensorrt'
            self.model = TrtModel(engine_path=self.model_loc, model_height=self.MODEL_HEIGHT, model_width=self.MODEL_WIDTH)
            self.model_input_shape = self.model.input_shape
            self.model_output_shape = self.model.output_shape
            print('[Inference] Success: Using YOLOv8 TensorRT model for inference...')
        else:
            print('[Inference] Error: No valid model was provided')

        print(f'Model Input Shape  = {self.model_input_shape}')
        print(f'Model Output Shape = {self.model_output_shape}')

        self.inference_thread = threading.Thread(target = self.infer)
        self.inference_thread.start()

    def start(self):
        self.is_start = True
        self.is_pause = False
        self.is_stop = False

    def pause(self):
        self.is_start = False
        self.is_pause = True
        self.is_stop = False

    def stop(self):
        self.is_start = False
        self.is_pause = False
        self.is_stop = True
        self.camera.stop_camera()

    def infer(self):
        while True:
            if self.is_stop: break
            if self.is_pause: continue
            if self.is_start:
                image_in = self.camera.get_frame()
                if image_in is None: continue

                orig_image = cv2.cvtColor(image_in, cv2.COLOR_BGR2RGB)
                image = cv2.resize(orig_image, (self.MODEL_WIDTH, self.MODEL_HEIGHT))
                out_results = None

                pre_post_start_time, infer_start_time = time.time(), time.time()
                pre_post_end_time, infer_end_time = time.time(), time.time()

                if self.model_type == 'pytorch':
                    with torch.no_grad():
                        infer_start_time = time.time()
                        out_results = self.model.predict(source = image)
                        infer_end_time = time.time()
                elif self.model_type == 'onnx':
                    image = io_utuls.preprocess(image, input_range=[0, 1])
                    image = image.transpose([2,0,1])
                    image = image[np.newaxis, ...]
                    infer_start_time = time.time()
                    out_results = self.model.run(None, {'images': image.astype(np.float32)})[0]
                    infer_end_time = time.time()
                    out_results = torch.from_numpy(np.array(out_results)).cpu()
                    out_results = io_utuls.postprocess(out_results, self.model_input_shape, image_in.shape)
                elif self.model_type == 'tensorrt':
                    image = io_utuls.preprocess(image, input_range=[0, 1])
                    image = image.transpose([2,0,1])
                    image = image[np.newaxis, ...]
                    infer_start_time = time.time()
                    out_results = self.model(image.astype(np.float32))[0]
                    infer_end_time = time.time()
                    out_results = torch.from_numpy(np.array(out_results)).cpu()
                    out_results = io_utuls.postprocess(out_results, self.model_input_shape, image_in.shape)

                pre_post_end_time = time.time()

                fps = 1./(infer_end_time - infer_start_time)
                self.fps_arr.append(fps)
                if len(self.fps_arr)>100: self.fps_arr = self.fps_arr[-100:]
                self.fps = round(np.mean(self.fps_arr),2)

                message = {}
                message['UTCTime'] = datetime.now(timezone.utc).strftime('%Y-%m-%dT%H:%M:%S.%f')
                message['InferenceTime'] = (infer_end_time - infer_start_time)*1000.
                message['PrePostProcessingTime'] = (pre_post_end_time - pre_post_start_time - (infer_end_time - infer_start_time))*1000.
                message['TotalTime'] = message['InferenceTime'] + message['PrePostProcessingTime']
                message['FPS'] = self.fps
                message['ModelFormat'] = self.model_type.upper()

                InferenceClasses = []
                message['InferenceOutput'] = "NONE"
                message['ModelType'] = 'NONE'
                result = None
                if out_results is not None and self.model_type == 'pytorch':
                    for result in out_results:
                        if result is None or result==[]: continue
                        if result.boxes:
                            message['ModelType'] = 'Object Detection'
                            if torch.cuda.is_available(): message['InferenceOutput'] = result.boxes.cpu().numpy().data.tolist()
                            else: message['InferenceOutput'] = result.boxes.numpy().data.tolist()
                            InferenceClasses = classescount(classes2names(message['InferenceOutput']))
                        elif result.masks:
                            message['ModelType'] = 'Segmentation'
                            if torch.cuda.is_available(): message['InferenceOutput'] =  result.masks.cpu().numpy().data.tolist()
                            else: message['InferenceOutput'] =  result.masks.numpy().data.tolist()
                        elif result.probs:
                            message['ModelType'] = 'Classification'
                            if torch.cuda.is_available(): message['InferenceOutput'] =  result.preds.cpu().numpy().tolist()
                            else: message['InferenceOutput'] =  result.preds.numpy().tolist()
                        else: continue
                elif out_results is not None and self.model_type == 'onnx':
                    for result in out_results:
                        if len(self.model.get_outputs())>1:
                            message['ModelType'] = 'Segmentation'
                        else:
                            message['ModelType'] = 'Object Detection'
                            InferenceClasses = classescount(classes2names(result))
                            message['InferenceOutput'] = result
                elif out_results is not None and self.model_type == 'tensorrt':
                    for result in out_results:
                        if len(self.model.outputs)>1:
                            message['ModelType'] = 'Segmentation'
                        else:
                            message['ModelType'] = 'Object Detection'
                            InferenceClasses = classescount(classes2names(result))
                            message['InferenceOutput'] = result

                if message['ModelType'] == 'Object Detection':
                    for cls in InferenceClasses:
                        message['CLASS_' + cls] = InferenceClasses[cls]

                if len(message['InferenceOutput'])>1000:
                    message['InferenceOutput'] = "TBD"

                try:
                    self.client.publish_message(message)
                except Exception as e:
                    print(f"[Inference] MQTT Exception: {str(e)}")
                    if 'AWS_ERROR_EVENT_STREAM_MESSAGE_FIELD_SIZE_EXCEEDED' in str(e):
                        message['InferenceOutput'] = 'TOO LARGE'
                        self.client.publish_message(message)