9/14 - NuScenes GT 정보 그리기

개발일지 2024. 9. 14. 00:47

목표 시간	10000
총 시간
공부 시간
시작 시간	xx : xx
종료 시간	xx : xx

목표 :

Nuscene에서 GT정보를 그려보자

아래 코드를 사용하면 GT를 표현할 수 있지만 수정할 수가 없다 그래서 내가 그리는 화면에 추가해서 만들었다.

while current_sample_token:
    sample = nusc.get('sample', current_sample_token)
    
    my_annotation_token = sample['anns'][18]
    
    nusc.render_annotation(my_annotation_token)
    
    # my_annotation_metadata =  nusc.get('sample_annotation', my_annotation_token)

lidar = sample['data']['LIDAR_TOP']
bboxes_gt = []
for  index  in range(len(sample['anns'])):
    my_annotation_token = sample['anns'][index]
    visibility_token = nusc.get('sample_annotation', my_annotation_token)
    data_path, boxes, camera_intrinsic = nusc.get_sample_data(lidar, selected_anntokens=[my_annotation_token])
    bboxes_gt.append(boxes)

bev = plot_bev_orthogonal(
    pred_bboxes_3d,
    bboxes_gt,
    bev_size=900 * 2,
    color=color,
)


# plot_bev_orthogonal 함수 내 구현

if len(bboxes_gt) != 0:
    for boxes in bboxes_gt:
        bev_corners = boxes[0].corners()[:, [1,0,6,7]][[0,1],...].T
        xs = bev_corners[..., 0] / bev_resolution + bev_w / 2
        ys = -bev_corners[..., 1] / bev_resolution + bev_h / 2
        for p1, p2 in ((0, 1), (0, 2), (1, 3), (2, 3)):
            tmp = [255, 255, 255]
            cv2.line(
                bev,
                (int(xs[p1]), int(ys[p1])),
                (int(xs[p2]), int(ys[p2])),
                tmp,
                thickness=thickness,
            )

여기서 1,0,6,7 이 많이 헷갈렸다.

        7 -------- 4
       /|         /|
      6 -------- 5 .
      | |        | |
      . 3 -------- 0
      |/         |/
      2 -------- 1

0,1,2,3 은 밑에 박스이고 4,5,6,7은 위에 박스다

그리고 그림은

0,1

0,2

1,3

2,3

이렇게 선을 그린다. 그러면 위의 구조를 추출을 해야한다.

2 --- 3

0 --- 1

흰박스는 GT 이고 빨간 박스는 계산 결과 값이다.

생각보다 차량 정보만 이용해서 구현했는데 잘된다.

해당 코드는 카메라 6개 이미지 + 차량 정보 + instrinsic calibration data와 마지막으로 장착각도만 내가 알고 있다고 가정했을때

작성한 코드이다.

실행 코드

import os
import sys
import cv2
from mmcv.parallel import MMDataParallel
from mmcv import Config
from mmdet.models import build_detector
from mmcv.runner import (
    get_dist_info,
    init_dist,
    load_checkpoint,
    wrap_fp16_model,
)
from nuscenes.nuscenes import NuScenes
import torch
import mmcv
import numpy as np
from PIL import Image
from pyquaternion import Quaternion
from scipy.spatial.transform import Rotation as R
import copy
import matplotlib.pyplot as plt

# 함수 정의
def _img_transform(img, aug_configs):
    H, W = img.shape[:2]
    resize = aug_configs.get("resize", 1)
    resize_dims = (int(W * resize), int(H * resize))
    crop = aug_configs.get("crop", [0, 0, *resize_dims])
    flip = aug_configs.get("flip", False)
    rotate = aug_configs.get("rotate", 0)

    origin_dtype = img.dtype
    if origin_dtype != np.uint8:
        min_value = img.min()
        max_vaule = img.max()
        scale = 255 / (max_vaule - min_value)
        img = (img - min_value) * scale
        img = np.uint8(img)
    img = Image.fromarray(img)
    img = img.resize(resize_dims).crop(crop)
    if flip:
        img = img.transpose(method=Image.FLIP_LEFT_RIGHT)
    img = img.rotate(rotate)
    img = np.array(img).astype(np.float32)
    if origin_dtype != np.uint8:
        img = img.astype(np.float32)
        img = img / scale + min_value

    transform_matrix = np.eye(3)
    transform_matrix[:2, :2] *= resize
    transform_matrix[:2, 2] -= np.array(crop[:2])
    if flip:
        flip_matrix = np.array(
            [[-1, 0, crop[2] - crop[0]], [0, 1, 0], [0, 0, 1]]
        )
        transform_matrix = flip_matrix @ transform_matrix
    rotate = rotate / 180 * np.pi
    rot_matrix = np.array(
        [
            [np.cos(rotate), np.sin(rotate), 0],
            [-np.sin(rotate), np.cos(rotate), 0],
            [0, 0, 1],
        ]
    )
    rot_center = np.array([crop[2] - crop[0], crop[3] - crop[1]]) / 2
    rot_matrix[:2, 2] = -rot_matrix[:2, :2] @ rot_center + rot_center
    transform_matrix = rot_matrix @ transform_matrix
    extend_matrix = np.eye(4)
    extend_matrix[:3, :3] = transform_matrix
    return img, extend_matrix

def get_global_inv(ego_x_m,ego_y_m,yaw_degree):
    
    # lidar translation 계산
    lidar_translation = np.array([0, 0.0, 1.84019])
    
    # lidar rotation 계산
    euler_angles_1 = np.radians(-89.8835)
    rotation = R.from_euler('xyz', [0, 0, euler_angles_1])
    x, y, z,w = rotation.as_quat()
    lidar_rotation = Quaternion([w, x, y, z]).rotation_matrix
    
    # Ego pose 정보에서 변환 행렬 계산
    ego_translation_lidar = np.array([ego_x_m,ego_y_m,0])
    
    
    # 쿼터니언을 Rotation 객체로 변환
    euler_angles_2 = np.radians(yaw_degree)
    rotation = R.from_euler('xyz', [0, 0, euler_angles_2])
    x, y, z,w = rotation.as_quat()
    ego_rotation_lidar = Quaternion([w, x, y, z]).rotation_matrix
    
    # print(np.degrees(euler_angles_1),np.degrees(euler_angles_2))
    
    T_global_ego_lidar = np.eye(4)
    T_global_ego_lidar[:3, :3] = ego_rotation_lidar
    T_global_ego_lidar[:3, 3] = ego_translation_lidar


    T_ego_lidar = np.eye(4)
    T_ego_lidar[:3, :3] = lidar_rotation
    T_ego_lidar[:3, 3] = lidar_translation

    # 글로벌 좌표계에서 카메라 좌표계로 변환하는 행렬 계산
    T_global_lidar = T_global_ego_lidar @ T_ego_lidar
    T_global_lidar_inv = np.linalg.inv(T_global_lidar)
    return T_global_lidar,T_global_lidar_inv, euler_angles_2, ego_translation_lidar

def get_image_wh():
    image_wh_value = torch.tensor([[[704., 256.],
                                        [704., 256.],
                                        [704., 256.],
                                        [704., 256.],
                                        [704., 256.],
                                        [704., 256.]]], device='cuda:0')
    return image_wh_value

def box3d_to_corners(box3d):
    YAW = 6  # decoded
    X, Y, Z, W, L, H, SIN_YAW, COS_YAW, VX, VY, VZ = list(range(11))  # undecoded
    CNS, YNS = 0, 1  # centerness and yawness indices in qulity
    YAW = 6  # decoded
    
    if isinstance(box3d, torch.Tensor):
        box3d = box3d.detach().cpu().numpy()
    corners_norm = np.stack(np.unravel_index(np.arange(8), [2] * 3), axis=1)
    corners_norm = corners_norm[[0, 1, 3, 2, 4, 5, 7, 6]]
    # use relative origin [0.5, 0.5, 0]
    corners_norm = corners_norm - np.array([0.5, 0.5, 0.5])
    corners = box3d[:, None, [W, L, H]] * corners_norm.reshape([1, 8, 3])

    # rotate around z axis
    rot_cos = np.cos(box3d[:, YAW])
    rot_sin = np.sin(box3d[:, YAW])
    rot_mat = np.tile(np.eye(3)[None], (box3d.shape[0], 1, 1))
    rot_mat[:, 0, 0] = rot_cos
    rot_mat[:, 0, 1] = -rot_sin
    rot_mat[:, 1, 0] = rot_sin
    rot_mat[:, 1, 1] = rot_cos
    corners = (rot_mat[:, None] @ corners[..., None]).squeeze(axis=-1)
    corners += box3d[:, None, :3]
    return corners

def plot_bev_orthogonal(
    bboxes_3d,bboxes_gt, bev_size, bev_range=115, color=(255, 0, 0), thickness=3
):
    if isinstance(bev_size, (list, tuple)):
        bev_h, bev_w = bev_size
    else:
        bev_h, bev_w = bev_size, bev_size
    bev = np.zeros([bev_h, bev_w, 3])

    marking_color = (127, 127, 127)
    bev_resolution = bev_range / bev_h

    # 중앙 좌표
    center_x, center_y = bev_w // 2, bev_h // 2
    
    step_plot = int(5 / bev_resolution)
    start_pixel = int(2 / bev_resolution)
    max_pixel = int(bev_h/step_plot)*step_plot
    # 직교 좌표계 그리드 그리기
    grid_interval=10
    
    for i in range(0, center_y, int(grid_interval / bev_resolution)):
    
        # 수평선 그리기
        cv2.line(
            bev,
            (0, center_y - i),
            (bev_w, center_y - i),
            marking_color,
            thickness=1,
        )
        
        # 수평선 그리기
        cv2.line(
            bev,
            (0, center_y + i),
            (bev_w, center_y + i),
            marking_color,
            thickness=1,
        )
        
        if i != 0:  # 중앙은 생략    
            
            distance_label = f"{np.round(i* bev_resolution)}m"
            cv2.putText(
                bev,
                distance_label,
                (center_y + i, bev_h - 10),
                cv2.FONT_HERSHEY_SIMPLEX,
                1,  # 글자 크기 절반으로 줄임
                (255, 255, 255),
                2,
            )            
        
            distance_label = f"-{np.round(i* bev_resolution)}m"
            cv2.putText(
                bev,
                distance_label,
                (center_y - i, bev_h - 10),
                cv2.FONT_HERSHEY_SIMPLEX,
                1,  # 글자 크기 절반으로 줄임
                (255, 255, 255),
                2,
            )            
        else:
            distance_label = f"{np.round(i* bev_resolution)}m"
            cv2.putText(
                bev,
                distance_label,
                (center_y + i, bev_h - 10),
                cv2.FONT_HERSHEY_SIMPLEX,
                1,  # 글자 크기 절반으로 줄임
                (255, 255, 255),
                2,
            )            
        
    for i in range(0, center_x, int(grid_interval / bev_resolution)):
    
        # 수직선 그리기
        cv2.line(
            bev,
            (center_x+i, 0),
            (center_x+i, bev_h),
            marking_color,
            thickness=1,
        )
        
        # 수직선 그리기
        cv2.line(
            bev,
            (center_x-i, 0),
            (center_x-i, bev_h),
            marking_color,
            thickness=1,
        )        
        if i != 0:  # 중앙은 생략    
            
            distance_label = f"-{np.round(i* bev_resolution)}m"
            cv2.putText(
                bev,
                distance_label,
                (0, center_x+i + 10),
                cv2.FONT_HERSHEY_SIMPLEX,
                1,  # 글자 크기 절반으로 줄임
                (255, 255, 255),
                2,
            )            
        
            distance_label = f"{np.round(i* bev_resolution)}m"
            cv2.putText(
                bev,
                distance_label,
                (0, center_x-i + 10),
                cv2.FONT_HERSHEY_SIMPLEX,
                1,  # 글자 크기 절반으로 줄임
                (255, 255, 255),
                2,
            )                  
        else:
            distance_label = f"{np.round(i* bev_resolution)}m"
            cv2.putText(
                bev,
                distance_label,
                (0, center_x+i + 10),
                cv2.FONT_HERSHEY_SIMPLEX,
                1,  # 글자 크기 절반으로 줄임
                (255, 255, 255),
                2,
            )            

    if len(bboxes_3d) != 0:
        bev_corners = box3d_to_corners(bboxes_3d)[:, [0, 3, 4, 7]][
            ..., [0, 1]
        ]
        xs = bev_corners[..., 0] / bev_resolution + bev_w / 2
        ys = -bev_corners[..., 1] / bev_resolution + bev_h / 2
        for obj_idx, (x, y) in enumerate(zip(xs, ys)):
            for p1, p2 in ((0, 1), (0, 2), (1, 3), (2, 3)):
                if isinstance(color[0], (list, tuple)):
                    tmp = color[obj_idx]
                else:
                    tmp = color
                cv2.line(
                    bev,
                    (int(x[p1]), int(y[p1])),
                    (int(x[p2]), int(y[p2])),
                    tmp,
                    thickness=thickness,
                )
                
    if len(bboxes_gt) != 0:
        for boxes in bboxes_gt:
            bev_corners = boxes[0].corners()[:, [1,0,6,7]][[0,1],...].T
            xs = bev_corners[..., 0] / bev_resolution + bev_w / 2
            ys = -bev_corners[..., 1] / bev_resolution + bev_h / 2
            for p1, p2 in ((0, 1), (0, 2), (1, 3), (2, 3)):
                tmp = [255, 255, 255]
                cv2.line(
                    bev,
                    (int(xs[p1]), int(ys[p1])),
                    (int(xs[p2]), int(ys[p2])),
                    tmp,
                    thickness=thickness,
                )
                
    return bev.astype(np.uint8)

# 현재 스크립트 파일의 디렉터리 경로
current_dir = os.path.dirname(__file__)

project_root = os.path.abspath(os.path.join(current_dir, '..'))
# 최상위 프로젝트 디렉터리를 Python 경로에 추가
sys.path.insert(0, project_root)

# 모델 생성
config = 'projects/configs/sparse4dv3_temporal_r50_1x8_bs6_256x704.py'
cfg = Config.fromfile(config)
checkpoint = 'ckpt/sparse4dv3_r50.pth'
cfg.data.test.test_mode = True
cfg.model.train_cfg = None

from projects.mmdet3d_plugin.datasets.builder import build_dataloader
model = build_detector(cfg.model, test_cfg=cfg.get("test_cfg"))

fp16_cfg = cfg.get("fp16", None)
if fp16_cfg is not None:
    wrap_fp16_model(model)
    checkpoint = load_checkpoint(model, checkpoint, map_location="cpu")

model.CLASSES = checkpoint["meta"]["CLASSES"]

model = MMDataParallel(model, device_ids=[0])

model.eval()


# Nuscene 설정
nusc = NuScenes(version='v1.0-mini', dataroot='/media/joo/6b227b2d-8477-45e1-af10-7dde9f85afe4/data/sets/nuscenes', verbose=True)
scene = nusc.scene[3]  # Adjust the scene index as needed

from nuscenes.can_bus.can_bus_api import NuScenesCanBus
nusc_can = NuScenesCanBus(dataroot='/media/joo/6b227b2d-8477-45e1-af10-7dde9f85afe4/data/sets/nuscenes')
scene_name = scene['name']
# wheel_speed = nusc_can.get_messages(scene_name, 'zoe_veh_info')

veh_speed = nusc_can.get_messages(scene_name, 'vehicle_monitor')

current_sample_token = scene['first_sample_token']
frame_count = 0

from KalmanFilter import LinearKalmanFilter
dt = 0.5  # delta time (100ms)
process_noise_std = 0.1  # 프로세스 노이즈의 표준편차
measurement_noise_std = [1.0, 0.5]  # 측정 노이즈 표준 편차 (v, yaw rate)
initial_state = [0,0,0,0,0,0]
kf = LinearKalmanFilter(dt, initial_state, process_noise_std, measurement_noise_std)

# 이미지 입력 변수 추가 자료
mean = [123.675, 116.28 , 103.53 ] # np.array(cfg.img_norm_cfg["mean"])
std = [58.395, 57.12 , 57.375] # np.array(cfg.img_norm_cfg["std"])
aug_config = {'resize': 0.44, 'resize_dims': (704, 396), 'crop': (0, 140, 704, 396), 'flip': False, 'rotate': 0, 'rotate_3d': 0}

# frame index 초기화
frame_index = 0

camera_sensors = ['CAM_FRONT', 'CAM_FRONT_RIGHT','CAM_FRONT_LEFT', 'CAM_BACK', 'CAM_BACK_LEFT','CAM_BACK_RIGHT']

ori_cam_rotation={}
ori_cam_rotation['CAM_FRONT'] = [-90, 0 , -90]
ori_cam_rotation['CAM_FRONT_RIGHT'] = [-90, 0 , -146]  
ori_cam_rotation['CAM_FRONT_LEFT'] = [-90, 0 , -34]
ori_cam_rotation['CAM_BACK'] = [-90, 0 , 90]  
ori_cam_rotation['CAM_BACK_LEFT'] = [-90, 0 , 18]  
ori_cam_rotation['CAM_BACK_RIGHT'] = [-90, 0 , 159]    
ori_cam_translation={}
ori_cam_translation['CAM_FRONT'] = [1.70079119, 0.01594563, 1.51095764]
ori_cam_translation['CAM_FRONT_RIGHT'] = [1.55084775, -0.4934048, 1.49574801]  
ori_cam_translation['CAM_FRONT_LEFT'] = [1.52387798, 0.49463134, 1.50932822]
ori_cam_translation['CAM_BACK'] = [0.02832603, 0.00345137, 1.57910346]  
ori_cam_translation['CAM_BACK_LEFT'] = [1.035691, 0.48479503, 1.59097015]  
ori_cam_translation['CAM_BACK_RIGHT'] = [1.0148781, -0.48056822, 1.56239545]  

# BGR to RGB conversion
ID_COLOR_MAP = [
    (59, 59, 238), # vibrant blue
    (0, 255, 0),   # green
    (0, 0, 255),   # blue
    (255, 255, 0), # Yellow
    (0, 255, 255), # Cyan
    (255, 0, 255), # Magenta
    (255, 255, 255),# White
    (0, 127, 255),  # medium sky blue
    (71, 130, 255), # medium cornflower blue
    (127, 127, 0),  # Olive or dark yellow-green
]
ID_COLOR_MAP_RGB = [(r, g, b) for (b, g, r) in ID_COLOR_MAP]

while current_sample_token:
    
    sample = nusc.get('sample', current_sample_token)
    
    lidar = sample['data']['LIDAR_TOP']
    bboxes_gt = []
    for  index  in range(len(sample['anns'])):
        my_annotation_token = sample['anns'][index]
        visibility_token = nusc.get('sample_annotation', my_annotation_token)
        data_path, boxes, camera_intrinsic = nusc.get_sample_data(lidar, selected_anntokens=[my_annotation_token])
        bboxes_gt.append(boxes)

    lidar_data = nusc.get("sample_data", sample["data"]["LIDAR_TOP"])
    
    ego_pose_lidar = nusc.get("ego_pose", lidar_data["ego_pose_token"])

    data = {
        'projection_mat': torch.zeros((1, 6, 4, 4)), # 1x6x4x4 크기의 텐서
        'img_metas': list()
    }

    # 1. 이미지 입력 변수 만들기
    radar_tokens = {
        'front': sample['data']['CAM_FRONT'],
        'front_right': sample['data']['CAM_FRONT_RIGHT'],
        'front_left': sample['data']['CAM_FRONT_LEFT'],
        'back': sample['data']['CAM_BACK'],        
        'back_left': sample['data']['CAM_BACK_LEFT'],
        'back_right': sample['data']['CAM_BACK_RIGHT'],
    }    
    to_rgb = True
    color_type = 'unchanged'    
    imgs = []
    for key, img_token in radar_tokens.items():
        img_sensor = nusc.get('sample_data', img_token)
        img = mmcv.imread(os.path.join(os.path.join(nusc.dataroot, img_sensor['filename'])), color_type)
        img = img.astype(np.float32)
        imgs.append(img)

    N = len(imgs)
    new_imgs = []
    for i in range(N):
        img, mat = _img_transform(
            np.uint8(imgs[i]), aug_config,
        )
        new_imgs.append(np.array(img).astype(np.float32))
        
    imgs_nor = []
    for img in new_imgs:
        img_nor = mmcv.imnormalize(img, np.array(mean), np.array(std), to_rgb)
        imgs_nor.append(img_nor)        

    # # 리스트를 (1, 6, 3, 256, 704) 크기의 텐서로 변환
    # # numpy 배열을 PyTorch 텐서로 변환하고 차원 순서를(H, W, C) --> (C, H, W)로 변경
    resized_imgs_tensor = [torch.tensor(img).permute(2, 0, 1).to('cuda:0') for img in imgs_nor]
    imgs_tensor = torch.stack(resized_imgs_tensor).unsqueeze(0)  # (6, 3, 256, 704) -> (1, 6, 3, 256, 704)
    
    data['img'] = imgs_tensor.to(torch.float32)

    # 2. 시간 정보 입력
    data['img_metas'] = list()
    data['img_metas'].append(None)
    float_value = sample['timestamp']/1000000.0    
    data['img_metas'][0] = dict()
    data['img_metas'][0]['timestamp'] = float_value
    data['timestamp'] = torch.tensor(float_value, device='cuda:0',dtype=torch.float64).unsqueeze(0)

    # 3. meta 정보 입력
    # 차량 정보를 이용해서 구함.
    while(1):  
        if sample['timestamp'] < veh_speed[frame_index]['utime']:
            break
        else:
            frame_index = frame_index + 1
    
    if frame_index == 0:
        ego_rot = [ego_pose_lidar['rotation'][1],ego_pose_lidar['rotation'][2],ego_pose_lidar['rotation'][3], ego_pose_lidar['rotation'][0]]    
        rotation = R.from_quat(ego_rot) 
        euler_angles_2 = rotation.as_euler('xyz', degrees=True) 
        ego_transition = np.array(ego_pose_lidar['translation'])
        # 초기위치만 라이다의 정보를 이용해서 setting한다.
        initial_state = [ego_transition[0], ego_transition[1],0,0,euler_angles_2[2],0]  # 초기 위치와 방향 [x, y, theta]
        kf.set_init(initial_state)
        start_logic_timestamp = sample['timestamp']
        start_logic_x, start_logic_y, start_logic_z = ego_transition
    else:
        # 그 다음부터는 차량 정보를 이용한다.
        omega = veh_speed[frame_index]['yaw_rate']#/180*np.pi
        vs = veh_speed[frame_index]['vehicle_speed']/3.6
        u = np.array([vs, omega]) # speed와 yaw rate
        dif_time = sample['timestamp'] - pre_logic_timestamp
        dt = (dif_time*1e-6)
        kf.predict(dt,u)
        kf.update([vs, omega])

    kf_x = kf.get_state()      
    ego_x_m = kf_x[0]
    ego_y_m = kf_x[1]
    ego_yaw_degree = kf_x[4]

    T_global_lidar, T_global_lidar_inv, ego_yaw, ego_transition = get_global_inv(ego_x_m,ego_y_m,ego_yaw_degree)

    data['img_metas'][0]['T_global'] = T_global_lidar
    data['img_metas'][0]['T_global_inv'] = T_global_lidar_inv
    data['img_metas'][0]['timestamp'] = float_value
    
    data['image_wh'] = get_image_wh()
    
    
    # projection_matrices 계산하기
    projection_matrices = []
    # 0 CAM_FRONT
    # 1 CAM_FRONT_RIGHT
    # 2 CAM_FRONT_LEFT
    # 3 CAM_BACK
    # 4 CAM_BACK_LEFT
    # 5 CAM_BACK_RIGHT
    for idx, cam in enumerate(camera_sensors):
        cam_token = sample['data'][cam]
        
        # Get camera data, calibration, and ego pose
        cam_data = nusc.get('sample_data', cam_token)
        # # print(idx,cam,cam_data['channel'])
        cam_calib = nusc.get('calibrated_sensor', cam_data['calibrated_sensor_token'])
        # ego_pose_cam = nusc.get('ego_pose', cam_data['ego_pose_token'])

        cam_translation = np.array(ori_cam_translation[cam])
        euler_angles_2 = np.radians(ori_cam_rotation[cam])
        rotation = R.from_euler('xyz', euler_angles_2)
        x, y, z,w = rotation.as_quat()
        cam_rotation = Quaternion([w, x, y, z]).rotation_matrix

        # Ego pose 정보에서 변환 행렬 계산
        ego_translation_cam = np.array([ego_x_m,ego_y_m,0])
        euler_angles_2 = np.radians(ego_yaw_degree)
        rotation = R.from_euler('xyz', [0, 0, euler_angles_2])
        x, y, z,w = rotation.as_quat()
        ego_rotation_cam = Quaternion([w, x, y, z]).rotation_matrix


        T_global_ego_cam = np.eye(4)
        T_global_ego_cam[:3, :3] = ego_rotation_cam
        T_global_ego_cam[:3, 3] = ego_translation_cam

        T_ego_cam = np.eye(4)
        T_ego_cam[:3, :3] = cam_rotation
        T_ego_cam[:3, 3] = cam_translation    

        # Calculate the transformation matrix from lidar to camera
        T_cam_lidar_rt2 = np.linalg.inv(T_ego_cam) @ np.linalg.inv(T_global_ego_cam) @ T_global_lidar

        # Camera intrinsic matrix
        intrinsic = copy.deepcopy(cam_calib["camera_intrinsic"])
        viewpad = np.eye(4)
        viewpad[:3, :3] = intrinsic

        # Calculate the final projection matrix
        lidar2img_rt2 = viewpad @ T_cam_lidar_rt2

        # Apply image transformation (augmentation)
        img, mat = _img_transform(imgs[idx], aug_config)

        # Convert to torch tensor
        lidar2img_rt2_tensor = torch.tensor(mat @ lidar2img_rt2)

        projection_matrices.append(lidar2img_rt2_tensor)

    # return torch.stack(projection_matrices)
    data['projection_mat'][0] = torch.stack(projection_matrices)    
    
    pre_logic_timestamp = sample['timestamp']

    with torch.no_grad():
        result = model(return_loss=False, rescale=True, **data)

    # 결과값 그리기 이미지 버드뷰
    raw_imgs = data["img"][0].permute(0, 2, 3, 1).cpu().numpy()
    imgs = []
    img_norm_mean = np.array(cfg.img_norm_cfg["mean"])
    img_norm_std = np.array(cfg.img_norm_cfg["std"])

    image = raw_imgs * img_norm_std + img_norm_mean
    for i in range(6):

        img = image[i]
        
        if i > 2:
            img = cv2.flip(img, 1)
            
        resized_img = cv2.resize(img,(1600, 900))
        ubyte_img = resized_img.astype(np.uint8)
        # rgb_img = cv2.cvtColor(ubyte_img, cv2.COLOR_BGR2RGB)
        imgs.append(ubyte_img)        
        
    images = np.concatenate(
        [
            np.concatenate([imgs[2], imgs[0], imgs[1]], axis=1),
            np.concatenate([imgs[4], imgs[3], imgs[5]], axis=1),
        ],
        axis=0,
    )  
    
    result = result[0]["img_bbox"]
    vis_score_threshold = 0.15    
    pred_bboxes_3d = result["boxes_3d"][
        result["scores_3d"] > vis_score_threshold
    ]
    
    color = []
    for id in result["labels_3d"].cpu().numpy().tolist():
        color.append(ID_COLOR_MAP_RGB[id])

    bev = plot_bev_orthogonal(
        pred_bboxes_3d,
        bboxes_gt,
        bev_size=900 * 2,
        color=color,
    )    
    
    images = np.concatenate([images, bev], axis=1)
    
    plt.figure(1)
    plt.clf()  # 현재 화면을 지우고 갱신할 수 있도록 합니다.
    plt.imshow(images)
    plt.draw()  # 그래프를 그립니다.
    plt.title
    
    
    plt.pause(1)  # 1초 대기
    current_sample = nusc.get('sample', current_sample_token)    
    current_sample_token = current_sample['next']  # Move to the next sample

debug = 1

'개발일지' 카테고리의 다른 글

9/22 - Sparse4D, fasterrcnn resnet50 fpn 로직 수정(feat 차량 정보) (0)	2024.09.22
9/17 - mini 데이터를 이용한 시나리오 결과 정리 (0)	2024.09.17
9/8 - 차량 정보 정리 (0)	2024.09.09
9/1 - Calibration의 중요함....... (0)	2024.09.03
8/30 - 미래...노력 ....방향 (0)	2024.08.30

ABOUT ME

Connecting the dots Connecting the dots

'개발일지' 카테고리의 다른 글

티스토리툴바

ABOUT ME

'개발일지' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바