Hugh Q. Lee | AI, 로보틱스, 개발 블로그

  • 홈
  • 태그

DeepLearning 2

YOLOv5 C3 Block 시각화 리뷰

ultralytics의 yolov5의 구조 중 첫번째 C3 Block를 params# 측면에서 코드 및 시각화로 리뷰합니다.  채널 전체에 Bottleneck(Residual 포함) 연산을 하는 대신, CSP (Cross Stage Partial) 구조의 C3 블록은 입력 피처의 채널 절반에 Bottleneck 연산을 하여 params# saving을 달성합니다. 채널을 두 그룹으로 나누고 다시 하나로 합치는(concat) 과정에서 해당하는 분기에서의 레벨을 맞추는 1x1 Conv 레이어를 사용하는 점도 참고해야 합니다.1. params# 비교C3Full Bottleneck65,920180,608$$\text{conv_params}=\text{input_ch}×\text{output_ch}×\text{k..

개발/AI 2025.03.28

Deep Residual Learning for Image Recognition: ResNet 시각화 리뷰

ResNet을 제시한 논문 "Deep Residual Learning for Image Recognition"을 params# 측면에서의 주요 컨셉을 코드 및 시각화로 리뷰합니다.$$\text{conv_params}=\text{input_ch}×\text{output_ch}×\text{kernel_w}×\text{kernel_h}+\text{bias}$$1. 첫 레이어비교VGG'sResNet'sparams#260,1609,472# VGGimport torch.nn as nnmodule = nn.Sequential( nn.Conv2d(in_channels=3, out_channels=64, kernel_size=3, stride=1, padding='same'), nn.Conv2d(in_chan..

개발/AI 2025.03.25
이전
1
다음
더보기
프로필사진

Hugh Q. Lee | AI, 로보틱스, 개발 블로그

AI, 컴퓨터 비전, 로보틱스 프로젝트를 개발하고 기록하는 Hugh Q. Lee의 기술 블로그입니다.

  • 분류 전체보기 (44)
    • 생각 (9)
    • 개발 (22)
      • AI (4)
      • Bio (1)
      • Jetson (4)
      • Raspberry Pi (3)
      • Robotics (1)

Tag

Deep Learning, jetson, DeepLearning, object detection, 노마드코더, python, 세이노의 가르침, 노개북, 경주여행, Computer Vision, raspi, DART, pyqt5, 라즈베리파이4, 해몽해드림, openai, Image Classification, 북클럽, 사이드프로젝트, CV,

최근글과 인기글

  • 최근글
  • 인기글

방문자수Total

  • Today :
  • Yesterday :
250x250
반응형
홈페이지

Copyright © Kakao Corp. All rights reserved.

  • 홈페이지

티스토리툴바