미리보기
기본 정보

AI 기술을 통해 일상의 문제를 해결하는 데 관심이 많습니다.
기술 스택
Python, RAG, NLP, vector-database, PostgreSQL, AI Agent
프로젝트
PNU Chat: 부산대학교 챗봇
부산대학교 학술동아리 AID 팀 프로젝트
2024.10. ~ 진행 중
프로젝트 개요
부산대학교의 학과별 공지사항, 학생지원시스템 등의 데이터를 주기적으로 크롤링하고,
이를 바탕으로 사용자의 질문에 답변하는 RAG 기반의 챗봇 서비스입니다.
주요 성과
베타 버전 배포 첫 주 하루 최대 200명의 유저 트래픽을 안정적으로 처리
GGUF 포맷의 임베딩 모델 도입 후 CPU 기반 추론 속도 약 19.3% 향상, 메모리 사용량 약 71.3% 절감
LLM 기반 제목 증강 + Hybrid Score 기반 RRF 전략으로 Q8 환경 Recall@3 15.52%p 향상
역할 및 기여
팀 구성: 4명 (프로젝트 총괄 1명, 개발 보조 2명, 디자이너 1명)
1. 팀 리드 및 협업
전체 프로젝트 일정 수립 및 역할 분담, 기획 ~ 배포까지 전과정 리드
중도 이탈한 팀원에게 새로운 역할을 배정하여 재합류 유도
2. 아키텍쳐 설계 및 개발
데이터 수집 및 Retrieval 구현
학사 데이터 RDB Schema 설계,
pgvector
기반의 Hybrid Retrieval 구현크롤링 파이프라인(수집 -> 전처리 -> 임베딩 -> 저장) 구축, 병렬 처리로 일부 구간 병목 개선
Retrieval 전략 실험을 빠르게 반복할 수 있도록 DI 패턴을 도입하고, 세부 로직 모듈화
Multi-Agent Orchestration
(기존) Fan-in/Fan-out 방식으로 여러 Tool을 병렬 호출하는 구조였으나 한계점 존재:
1. Agent간의 역할 구분이 명확하지 않아, 개별 Agent에 책임이 가중되어 Tool 선택시 정확도 저하
2. 불필요한 Agent까지 호출되며 토큰 사용량 과도하게 증가, 텍스트 임베딩 병렬 처리 구간에서 병목 발생(개선) LangGraph 기반 Multi-Agent Supervisor 구조 도입 작업 진행중
(FE) 챗봇 UI 설계 및 구현
디자이너와 협업하여 반응형 챗봇 UI/UX 공동 기획 (ChatGPT, Grok 벤치마킹)
마크다운 응답의 하이퍼링크(첨부파일 포함)를 위한 커스텀 렌더링 로직 구현
디자인 확장성을 고려하여 Tailwind 기반의 디자인시스템 구축 및 모듈화
3. bge-m3
추론 최적화 및 Recall 개선 실험
저사양 CPU 환경에서도 모델 배포가 가능하도록,
BAAI/bge-m3
기반의 텍스트 임베딩 서버 구축Sparse Embedding을 직접 구현하고, Q8 양자화를 적용하여 추론 속도 19.3% 향상, 메모리 71.3% 절감
양자화로 인한 성능 하락을 보완하기 위해 Hybrid Score + RRF 전략 설계 및 실험
→ Recall@3 성능 Dense-only 대비 15.5%p 향상, FP32 대비 1%p 이내 수준까지 회복
자동 조정 모니터 스탠드
기타(캡스톤 디자인)
2024.10. ~ 2024.12.
사용자의 얼굴을 Tracking하는 모니터 스탠드
기계공학부의 Capstone Design 교과목(제품개발설계)에서 제작한 제품 프로토타입입니다.
모니터를 장시간 같은 자세로 봐야 하는 현대인의 불편함을 개선하고자 제작했습니다.
Rockchip NPU 및 YOLO 모델을 통해 Real-Time Object Detection을 구현했습니다.
얼굴 위치값을 바탕으로 모터 및 리니어 액추에이터를 실시간으로 PID 제어합니다.
추론 및 후처리 과정에서의 유휴 시간을 제거하여 Frame Rate를 약 50% 향상했습니다.
포트폴리오
교육
부산대학교
대학교(학사) | 기계공학부
2018.03. ~ 현재 | 재학 중
대외활동
프론트엔드 멘토
부산대학교 APPTIVE
2024
신입 부원을 위한 React.js
스터디 커리큘럼을 직접 기획 및 운영하고 있습니다.
공식 문서를 바탕으로 여러 멘토들과 협업하여 스터디 자료 및 과제물을 제작했습니다
세미나 발표
부산대학교 AID
2024
발표를 통해 AI 관련 개인 프로젝트에서의 이슈 트래킹 경험을 공유했습니다.
엣지 디바이스에서의 YOLO 추론 성능 최적화 - 2024.12.27
부산대학교 무물보 챗봇: PNU Chat 프로젝트 - 2025.04.04
NLP 기초 스터디
부산대학교 AID
2024
N-gram 모델부터 RNN, Transformer, 그리고 BERT 모델까지 자율적으로 학습했습니다.
각자 주차별 진도 학습 후, 대면 모임에서 발표자의 설명을 듣고 질문하는 방식으로 진행했습니다.