전체 글 65

논문 리뷰 : Gemini 2.5 Technical Report

최근 공개된 Google의 Gemini 2.5 Technical Report를 읽어보고 전반적인 내용을 정리하였다. 이 기술 보고서는 주로 모델의 아키텍처 개선, 훈련 인프라 강화, 사후학습(Post-training) 전략 도입과 같은 큰 틀에서의 개선 방향을 소개하고 있다.1. 모델 아키텍처 개선 – Sparse Mixture-of-Experts(MoE)와 멀티모달 처리Gemini 2.5는 Sparse MoE 구조를 도입해 효율성을 높였다. 기존에는 모든 데이터를 전체 모델에서 처리했으나, Gemini 2.5는 데이터 유형에 따라 선택적으로 전문가(Experts)를 배치하여 처리한다. 예를 들어 회의 내용을 요약하는 AI가 있다면, 음성, 이미지, 텍스트, 비디오와 같은 서로 다른 데이터 유형에 따라 ..

개발/AI 2025.06.18

AI, 정말 생각하는 걸까? – Apple vs Claude(Opus)의 추론 논쟁 정리

AI가 퍼즐을 풀지 못하면 '생각을 못하는 것'일까요?최근 Apple AI 연구팀이 발표한 논문 『The Illusion of Thinking』(2025)은 "AI는 실제로 생각하지 않는다"는 입장을 정면으로 제시하며, Claude, ChatGPT, DeepSeek 등 최신 AI 모델들을 퍼즐 기반 환경에서 시험했습니다.이에 대해 Claude(Opus)가 공동 저자로 포함된 반론 논문 『Comment on "The Illusion of Thinking"』에서는, "퍼즐을 풀지 못한 것만으로 AI가 사고하지 않았다고 단정할 수 없다"며 Apple의 해석에 이의를 제기합니다.Shojaee, P., Mirzadeh, I., Alizadeh, K., Horton, M., Bengio, S., & Farajtab..

개발/AI 2025.06.17

바이브 코딩으로 벽돌깨기 게임 만들기: 커서AI로 미션 맵 구현하고 공유까지!

🎮 벽돌깨기 게임 맵 커스터마이징 및 구현 후기얼마 전 쓰레드에서 흥미로운 벽돌깨기 게임 영상을 발견했습니다.👉 영상 보러가기영상 속 독특한 미션 맵을 보니 저도 직접 플레이해보고 싶다는 생각이 들었습니다.그래서 이번 기회에 커서AI(Cursor AI) 를 이용한 바이브 코딩(Vibe Coding) 으로 직접 맵을 구현하고, SNS 공유 기능까지 포함한 웹앱을 만들어보았습니다.🔧 실제 구현 과정 요약 (프롬프트 서사)나의 프롬프트AI의 응답"벽돌깨기 게임의 맵 구조를 설명한 스크린샷을 참고하여 정확히 구현하라."맵의 초기 구조를 생성하고 통로 및 벽의 상태를 정의함"벽돌의 유형을 명확히 정의하고, 충돌 감지 및 클리어 판정을 처리하라."깰 수 있는 벽돌/없는 벽돌/통로의 상태별 충돌 처리 및 게임 ..

개발 2025.06.13

🎥 Insta360 X5 + Quest 3S + Insta360 Studio on 맥북 조합으로 완성하는 360도 여행 추억 감상법 A to Z

언젠가 사무칠 그리움에 대비하세요.여행은 끝나는 순간부터 ‘기억’으로 남습니다.하지만 기억은 시간이 지날수록 흐릿해지고, 사진과 영상조차도 그때의 온도까지는 담아내지 못하곤 하죠.그 순간, 그 공간 전체를 있는 그대로 다시 ‘경험’할 수 있다면 어떨까요?단순한 영상이 아닌, 미래의 나에게 전하는 감정 기록을 남겨보세요.이 글은 그 과정을 단계별로 정리한 안내서입니다.VR 입문자도 충분히 따라할 수 있도록 촬영부터 감상까지 전체 흐름을 쉽게 풀어보았습니다.📌 목차준비물 체크리스트Insta360 X5 촬영 및 Mac 연결Mac에서 영상 편집 및 내보내기퀘스트3S로 영상 전송하기퀘스트3S에서 감상하기마무리 사용 후기1. 🎒 준비물 체크리스트장비설명Insta360 X58K 360도 촬영 지원MacBookIn..

여행 2025.06.07

DETR 논문 리뷰 End-to-End Object Detection with Transformers

DETR 논문 리뷰: Transformer로 단순해진 객체 탐지 모델객체 탐지는 인공지능(AI) 분야에서 오랜 기간 중요한 주제였습니다. 하지만 기존 모델은 여러 복잡한 절차 때문에 구현이나 튜닝이 쉽지 않았습니다. 이 글에서는 2020년에 발표된 DETR (End-to-End Object Detection with Transformers) 모델을 통해 이 문제를 살펴보겠습니다.📌 기존 객체 탐지 모델의 문제점대표적인 기존 모델들(Faster R-CNN, RetinaNet, YOLO 등)은 아래와 같은 복잡한 과정을 거쳐야 했습니다.Region Proposal: 객체가 있을 법한 영역을 미리 예측하고 평가하는 단계.Anchor Box 설정: 객체를 다양한 크기와 비율로 미리 설정된 박스로 예측.Non-..

개발/AI 2025.06.06

논문 리뷰 Chain-of-Zoom: Extreme Super-Resolution via ScaleAutoregression and Preference Alignment

KAIST 연구진의 초해상도(super resolution) AI 논문 "Chain-of-Zoom: Extreme Super-Resolution via ScaleAutoregression and Preference Alignment" 입니다.논문 링크 : arXiv:2505.18600플젝 링크 : https://bryanswkim.github.io/chain-of-zoom/1 | 사진을 크게 키우면 왜 깨질까?오래된 사진을 스마트폰으로 찍어 확대해 보면 얼굴이 금세 흐릿해집니다. 초해상도(Super-Resolution, SR)는 이 흐릿해진 부분의 사이를 그려넣어서 자연스럽게 만드는 작업입니다.기존 SR 모델은 대부분 “4배 전용” 같이 고정된 배율만 잘 다룹니다. 그래서 4배 모델에 16배 확대를 시키..

개발/AI 2025.06.03

PCIe 완전정리: Gen2~Gen4 세대별 속도, 라즈베리파이 SSD 활용 가이드

컴퓨터 SSD나 고성능 보드를 보다 보면 꼭 등장하는 용어, PCIe (피씨아이 익스프레스).하지만 이게 뭔지, 왜 중요한지 감이 잘 안 잡히셨다면 이 글이 도움이 될 거예요.이 글에서는 초보자도 이해할 수 있는 PCIe의 기본 개념, 세대별 차이부터 라즈베리파이와 젯슨 등 실전 활용까지 쉽고 간단히 정리해봅니다.📘 PCIe란 무엇인가요?PCIe (Peripheral Component Interconnect Express)는 컴퓨터 메인보드와 SSD, 그래픽카드, AI 가속기 같은 장치를 빠르게 연결해주는 통신 규격입니다.속도와 확장성이 뛰어나 현재 대부분의 고성능 장치가 이 방식을 사용하고 있습니다.🚄 PCIe 세대별 속도 비교 – Gen2부터 Gen4까지PCIe는 세대(Generation)가 올라..

개발/Raspberry Pi 2025.05.23

풋살 팀 나누기 고민 끝! 팀 구성 자동화 웹앱, SquardShuffler

풋살을 자주 즐기다 보면 매주 참가 인원이 달라지고, 그때마다 6~7명씩 3팀으로 나누는 게 생각보다 번거로운 일입니다.보통 이런 과정을 거치게 됩니다.출석 인원을 확인한다.각 6~7명씩 3개 팀으로 나눈다.단체 톡방에 팀 명단을 정리해서 공유한다.하지만, 인원은 매번 달라지고, 팀 균형도 신경 써야 해서 수작업으로 반복하기 정말 귀찮죠.그래서 직접 만들어봤습니다 – SquardShufflerSquardShuffler는 풋살 등 소규모 팀 스포츠에서 변동되는 참가 인원에 최소한의 노력으로 대응할 수 있는 웹앱입니다.명단만 입력하면, 랜덤 셔플로 공정하게 팀을 나눠주고 필요하면 직접 조정도 가능합니다.무엇보다 딸깍 한 번에 톡방이나 단체 채팅에 팀 명단을 복사해 공유할 수 있어 실제 운영에서 매우 편리합니..

개발 2025.05.18

Waveshare RoArm-M3-Pro와 NVIDIA Jetson Orin Nano로 로봇암 시뮬레이터 초기화 방법

이번 포스트에서는 Waveshare RoArm-M3-Pro와 NVIDIA Jetson Orin Nano Developer Kit를 활용하여 로봇암 시뮬레이터를 초기화하고 구동하는 방법을 소개합니다. 특히, 공식 가이드와 실제 설치 과정에서 차이점이 있는 부분을 명확히 정리하여 혼란을 줄이도록 작성했습니다.이번 포스트에서는 Waveshare RoArm-M3-Pro와 NVIDIA Jetson Orin Nano Developer Kit를 활용하여, ROS2와 MoveIt을 이용한 로봇암 제어 환경을 구축하는 과정을 안내합니다.💡 제품 소개이 포스팅은 알리 어필리에이트 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받을 수 있습니다.1. Waveshare RoArm-M3-Pro특징:ESP32 기반 고토크 ..

개발/Robotics 2025.05.16

JetPack 6.2에서 Jetson Orin Nano GPIO 제어 문제 해결

JetPack 6.x에서 Jetson Orin Nano GPIO 제어 문제 해결Jetson Orin Nano에 JetPack 6.x를 설치했는데, GPIO 제어가 안 된다? 저도 처음에 당황했었는데요. 이 글에서는 Jetson Orin Nano에서 GPIO 제어 문제를 어떻게 해결했는지 공유하려고 합니다.1. 기존 제어 코드로 제어 시도우선, Jetson Orin Nano에서 GPIO를 제어하려고 가장 기본적인 코드를 사용했습니다:import Jetson.GPIO as GPIOGPIO.setmode(GPIO.BOARD)GPIO.setup(7, GPIO.OUT)GPIO.output(7, GPIO.LOW) 하지만 코드를 실행하자마자 다음과 같은 오류가 발생했습니다:Exception: Could not det..

개발/Jetson 2025.05.08

로그인 없이 바로 쓰는 웹 이미지 편집기 Tool 4 Img – 무료 온라인 사진 편집 도구 배포 완료

웹에서 바로 쓸 수 있는 이미지 편집기, 하나 만들었습니다맥OS에서는 이미지 회전이나 크롭, 하이라이트, 텍스트 넣는 정도의 간단한 작업하기가 꽤 번거롭고, 온라인 도구는 로그인 요구하는 경우가 많더라고요.그래서 간단한 작업에 딱 필요한 기능만 모아서, 설치 없이 웹에서 바로 쓸 수 있는 편집기를 만들어 봤습니다.📌 주소👉 https://hughqlee.com/tool4img로그인 없이 바로 사용 가능합니다.⚙️ 포함된 기능밝기 / 대비 조정이미지 회전 / 반전자유 크롭, 사각형 그리기, 형광펜텍스트 입력 (폰트 크기 및 색상 조절 가능)사이즈 조정PNG / JPEG / WEBP 저장딥러닝이나 필터 같은 건 없고요, 기본적인 도구들만 가볍게 넣었습니다.🌐 다국어도 지원합니다처음부터 다국어 지원을 염..

개발 2025.05.04

[PyTorch/YOLO 오류 해결] GPU 미사용 및 torchvision::nms CUDA 에러 해결 방법

YOLO 모델을 사용할 때 GPU가 동작하지 않거나, 다음과 같은 에러가 발생할 수 있습니다.Could not run 'torchvision::nms' with arguments from the 'CUDA' backend.이 문제를 해결한 과정을 정리합니다.0. 문제 요약YOLO 모델을 사용하는데 GPU가 사용되지 않음.torchvision::nms 연산에서 CUDA 백엔드 오류 발생.특히 torchvision::nms 오류는 torch와 torchvision의 빌드가 다른 경우에 발생합니다:나의 경우에는, torch는 CUDA 빌드(예: +cu118)인데, torchvision은 CPU 전용 빌드(예: +cpu)일 때, 발생함.1. CUDA 버전 확인터미널에 입력:nvcc --version나의 경우 출..

개발 2025.04.29

국채 투자, 암탉과 달걀로 완벽 이해하기 – 초보자도 쉽게 채권 마스터

🐔 암탉과 달걀로 쉽게 이해하는 채권 이야기채권이란 무엇인가요?채권은 쉽게 말하면 '돈을 빌려주고, 그 대가로 이자를 받는 약속서'입니다.정부나 기업이 돈을 빌리기 위해 발행하고, 투자자는 채권을 사서 이자를 받게 됩니다.🐣 국채를 암탉에 비유해 봅시다암탉 한 마리 가격: 10,000원이 암탉은 1년에 달걀 2개를 낳습니다.한 번 낳는 달걀의 가치: 200원1년에 총 수익(달걀 가치): 400원 (연 4%)즉,10,000원을 주고 암탉을 사면매년 400원의 달걀 수익을 받을 수 있습니다.이것이 바로 채권의 '이자 수익'입니다.🥚 이자는 1년에 언제 받나요?한국 국채는 일반적으로 1년에 2번 이자를 줍니다.3월: 200원 (첫 번째 달걀)9월: 200원 (두 번째 달걀)요약봄(3월)에 한 번,가을(9..

생각 2025.04.27

코딩 초보도 가능한 무료 랜딩페이지 만들기 강의 – GitHub 배포까지 완성!

누구나 만드는 랜딩페이지 – 단 1시간만에 완성하는 나만의 웹사이트 🎯hughqlee.com/landing4everyone코딩을 처음 접해도 괜찮아요.무료로, 단 1시간 안에,나만의 웹페이지를 직접 만들어보고 전 세계에 배포할 수 있습니다!🚀 강의 핵심 요약완전 무료단 1시간이면 끝코딩 초보도 OK결과물 실습 포함투표 기능 + 실시간 순위표까지 구현👨‍🏫 강의가 추천되는 대상웹 개발을 처음 시작하는 입문자프로젝트나 서비스를 홍보할 웹페이지가 필요한 분실용적인 코딩을 짧은 시간 안에 익히고 싶은 분GitHub Pages 배포 과정을 익히고 싶은 분📚 커리큘럼 구성단계내용1단계노션 페이스로 프로필 이미지 만들기2단계HTML로 웹페이지 구조 잡기3단계CSS로 디자인 입히기4단계JavaScript로 기..

개발 2025.04.26

Jetson Orin Nano 개발자 키트 GPIO 핀맵 정리 – 40핀 확장 헤더 완전 해설

NVIDIA Jetson Orin Nano Developer Kit은 강력한 AI 엣지 연산 기능과 함께 다양한 외부 장치를 연결할 수 있는 40핀 GPIO 확장 헤더(J12)를 제공합니다. 이 글에서는 Jetson Orin Nano의 40핀 핀맵을 기능별로 구분하여 설명하고, 각 핀의 기본적인 역할과 사용 시 주의할 점도 함께 정리해 봅니다.1. 기본 사양 요약40핀 (2x20 배열), 2.54mm 간격 (라즈베리파이 호환 배열)모든 I/O는 3.3V 전압 레벨 사용핀 기능: GPIO, I2C, UART, SPI, I2S, 오디오 클럭 등 지원대부분의 기능 핀은 GPIO로 재설정 가능2. 전원 및 GND 핀핀 번호기능설명1, 173.3V3.3V 전원 출력2, 45.0V5.0V 전원 출력6, 9, 14,..

개발/Jetson 2025.04.24