
미리보기
- 직업
- 데이터 사이언티스트
- 이름
- 장지수
- 이메일
- simonjisu@gmail.com
- 간단소개
- 데이터에서 발견한 인사이트를 통해 사람의 의사결정에 도움되는 애플리케이션을 만들고자 합니다. 저는 지능형 데이터 시스템, LLM 에이전트, 그리고 인간 중심의 분석 워크플로우를 연구하며, 복잡한 계산 과정을 더 신뢰할 수 있고, 점검 가능하며, 실질적으로 유용하게 만드는 데 초점을 두고 있습니다.

기술 스택
- 기술 스택
- Python
- PyTorch
- huggingface
- LangChain
- MCP
- GitHub
- Docker
경력
- 회사명
- (재)네이버커넥트
- 직책 • 부서
- 사원 • 부스트코스
- 근무 기간 (근무 형태)
- 2018.02. - 2019.08.
- (1년 7개월 | 계약직)
- 담당 업무
AI 강의 콘텐츠 퍼블리싱 및 운영: edwith/boostcourse 플랫폼에서 조경현 교수의 NLP 강의와 Andrew Ng 딥러닝 시리즈 1~4 등 총 5개 AI 강의 콘텐츠 운영에 참여했으며, 누적 수강생 약 3만명 규모의 학습 콘텐츠를 관리하며 복잡한 AI 개념을 학습자가 따라올 수 있는 구조로 재구성
프로젝트형 딥러닝 학습 콘텐츠 기획: Deep Learning for Everyone Season 2 과정의 기획 및 운영을 지원하고, '파이토치로 시작하는 딥러닝 기초'와 '텐서플로우로 시작하는 딥러닝 기초' 강좌 운영에 참여했으며, 총 2만 5천명 규모의 실습 중심 딥러닝 교육 경험
실습 코드 리뷰 자동화 설계: Introduction to Deep Learning with TensorFlow and PyTorch 과정에서 학습 환경 기획, 코드 리뷰 자동화를 담당했으며, 관련 공개 GitHub 저장소는 PyTorch, TensorFlow 합쳐서 총 1,639 stars를 기록했습니다(2026.03 기준).
역할: AI 교육 콘텐츠 기획 및 운영
업무 내용:
프로젝트
- 프로젝트명
- Strategy Map as Inference-Time Process Guidance for Agentic AI
- 소속/기관명
- 서울대학교
- 프로젝트 기간
- 2025.06. - 2026.06.
- (1년 1개월)
- 프로젝트 설명
Submit in NeurIPS 2026, CIKM 2026
Strategy Map Demo: https://youtu.be/wQ003_-T9ZY
Trace2Map Demo: https://youtu.be/gsXhcqkmb3U
AI Agent가 관련 정보를 찾더라도 선행 조건을 확인하지 않고 상태 변경 도구를 호출하는 문제를 발견
이를 단순한 모델 성능 문제가 아니라, “현재 업무가 어디까지 진행되었는지”를 관리하지 못하는 실행 상태 관리 문제로 정의
장기 업무에서 완료된 단계, 현재 가능한 단계, 아직 차단된 단계를 구분하는 Working Map 구조 설계
업무 절차를 milestone과 prerequisite edge로 표현하는 Strategy Map 설계
각 milestone이 요구된 입력, 출력, 실행 조건을 만족할 때만 갱신되도록 상태 업데이트 구조 설계
전체 Map을 한 번에 제공하지 않고, zoom-out / zoom-in view를 통해 필요한 수준의 절차 정보만 Agent에게 제공
성공적인 reasoning trace에서 절차적 지식을 추출해 Strategy Map으로 변환하는 Trace2Map 연구
Agent 실행 중 현재 상태와 admissible milestone을 context로 제공하여 다음 행동 선택을 보조
Python, LangChain, OpenAI SDK, HuggingFace, MCP Server 기반으로 실험 파이프라인 구현
S&OP 시나리오에서 7개 Task, 59개 tool, 5개 MCP Server 기반 벤치마크 구성
Strategy Map 적용 후 ReAct 정확도 42.6% → 65.5%, TRA 정확도 28.3% → 66.9%로 개선
EnterpriseOps-Gym에서 GPT-5.4-mini 기준 실행 성공률 14.1% → 27.8%, partial score 0.39 → 0.604로 개선
Agent / LLM: Python, LangChain, OpenAI SDK, Hugging Face, Qwen
Tool-use / Runtime: MCP Server, FastAPI, uvicorn
Database: PostgreSQL
Frontend / Demo: React, Vite, TypeScript (AI 이용하여 구현)
Research Engineering: Prompt Engineering, Context Engineering, Agent Workflow Design, Benchmark Evaluation
AI Agent가 장기 업무를 수행할 때 현재 실행 상태와 선행 조건을 관리할 수 있도록, 절차적 지식을 그래프 형태로 제공하는 Agent workflow 및 context engineering 연구
문제 정의
Strategy Map 및 Agent Workflow 설계
Trace2Map 및 Context Engineering
실험 설계 및 결과
기술 스택
- 프로젝트명
- Retrieval-Augmented NL2SQL Generation with Data-Centric Query Capsules for Enterprise Applications
- 소속/기관명
- 서울대학교
- 프로젝트 기간
- 2024.06. - 2025.12.
- (1년 7개월)
- 프로젝트 설명
Published in SIGIR-AP 2025
자연어를 SQL로 변환할 때 LLM이 비즈니스 로직과 스키마 사용 방식을 충분히 이해하지 못하는 문제를 발견
검증된 SQL workload에서 Query Context와 SQL Template을 추출해, LLM이 재사용할 수 있는 Query Capsule 단위로 구조화
Query Context는 SQL이 담고 있는 비즈니스 의미를, SQL Template은 값이 제거된 재사용 가능한 SQL 구조를 표현하도록 설계
단순히 Query Capsule을 많이 넣는 것이 아니라, 실제로 SQL 생성에 도움이 되는 지식을 선별하기 위해 Merit metric 설계
SQL의 구조적 유사도와 의미적 유사도를 함께 평가해 "유용한" Query Capsule을 QC Pool에 적재
실행 정확도뿐 아니라 SQL 구조와 의미가 어떻게 개선되는지 정량적으로 분석
사용자의 자연어 질문과 유사한 Query Capsule을 embedding 기반으로 검색
검색된 Query Capsule을 schema 정보와 함께 LLM context로 제공하여 SQL 생성을 보조
Direct 방식과 Pipeline 방식의 SQL 생성 프로세스를 나누어 실험
Pipeline: 먼저 사용자 질문에서 키워드 추출 후, DB 에서 value 검색
Spider, BIRD benchmark 기반으로 Intra-domain 기준 학습 60%, 개발 20%, 테스트 20% 분할 후 실험 수행
Query Capsule 적용 시 BIRD 및 Spider benchmark에서 실행 정확도 평균 5.68%, 3.34% 개선, Merit 기준으로도 각각 6.54%, 5.24% 상대적 개선
Python, LangChain, OpenAI SDK, FAISS, HuggingFace,
SQLite, DuckDB
NL2SQL, Embedding Retrieval, RAG Pipeline Design, Context Engineering, Query Evaluation
사용자의 SQL 실행 로그에서 재사용 가능한 비즈니스 로직과 SQL 구조를 추출해 NL2SQL 성능을 개선하는 데이터 중심 RAG 연구
Query Capsule 설계
유용성 평가 Metric 설계
SQL 추론 과정
실험 및 성과
기술 스택
- 프로젝트명
- AU-RAG: Agent-based Universal Retrieval Augmented Generation
- 소속/기관명
- 서울대학교
- 프로젝트 기간
- 2024.06. - 2024.12.
- (7개월)
- 프로젝트 설명
Published in SIGIR-AP 2024
기업 데이터가 문서, 테이블, API 등 여러 source에 분산되어 있어, 단순 text chunk 검색만으로는 의사결정에 필요한 근거를 충분히 제공하기 어렵다고 판단
사용자 질문에 대해 어떤 source를 탐색할지, 어떤 방식으로 근거를 추출할지, 추출한 정보를 어떻게 답변 생성에 연결할지 Agent workflow로 설계
검색, 계획, 도구 호출, 답변 생성을 하나의 RAG pipeline으로 연결
LangChain 기반으로 source selection, evidence retrieval, answer generation 흐름을 구성
단순 문서 검색 중심 RAG를 넘어, 다양한 데이터 source를 Agent가 선택하고 활용하는 구조로 확장
LLM이 답변 생성 전에 필요한 근거를 수집하고, 이를 context로 활용하도록 설계
TAT-QA 기반 multi-source QA 실험을 설계하고, 30/90/270개 Source Object 및 Extraction Guide 환경에서 AU-RAG와 RAG+Reranker를 비교 평가
Source Object 수가 30개일 때 AU-RAG는 Retrieval Precision 53.41%로 RAG+Reranker 대비 +9.52%p, 90개 환경에서는 41.54%로 +10.45%p, 270개 환경에서는 30.28%로 +6.04%p 높은 precision을 기록
Source Object가 증가할수록 RAG+Reranker는 recall이 높았지만, AU-RAG는 false positive를 줄이며 더 정밀하게 source를 선택하는 특성을 보임
Extraction Guide 수를 30 → 90 → 270개로 늘리자 AU-RAG Retrieval F1이 31.51% → 31.83% → 33.06%로 개선됨
Python, LangChain, OpenAI SDK
RAG, Agent Workflow Design, Prompt Engineering, Context Engineering
문서, 테이블, API 등 다양한 데이터 source에서 필요한 근거를 찾고 답변을 생성하기 위한 Agentic RAG workflow 연구
데이터 접근 Workflow 설계
Agentic RAG 구조 구현
실험 및 성과
기술 스택
포트폴리오
교육
- 소속/기관
- 서울대학교
- 종류 | 전공명/전공계열
- 대학원(박사) | 데이터사이언스학
- 재학 기간 (재학 상태)
- 2022.03. - 2026.08. (졸업)
- 소속/기관
- 서울대학교
- 종류 | 전공명/전공계열
- 대학원(석사) | 데이터사이언스학
- 재학 기간 (재학 상태)
- 2020.03. - 2022.02. (졸업)
- 소속/기관
- 한양대학교
- 종류 | 전공명/전공계열
- 대학교(학사) | 경제금융학
- 재학 기간 (재학 상태)
- 2010.03. - 2018.08. (졸업)
- 소속/기관
- 중국 청도 2중
- 종류 | 전공명/전공계열
- 고등학교 | 인문계열
- 재학 기간 (재학 상태)
- 2006.09. - 2009.08. (졸업)
대외활동
- 활동명
- A Guide to Building LLM-Based Applications: Prompt Engineering and RAG
- 소속/기관
- 서울대학교
- 활동 연도
- 2024
- 활동 상세 설명
2024. 7. 18. - @ 24년 호남권 KOLAS 시험기관(SW분야) 기술 워크숍, “LLM 기반 어플리케이션 구축을 위한 가이드” 발표
2024. 8. 9. - @ 전주정보문화산업진흥원 “LLM 기반 어플리케이션 구축을 위한 가이드” 강의,
교육내용:자연어 처리 및 거대 언어 모델(LLM)의 발전 역사
프롬프트 엔지니어링
프롬프트 엔지니어링 실습
Retrieval-Augmented Generation
RAG 구축하기 실습
- 활동명
- Introduction to DeepLearning with PyTorch
- 소속/기관
- 서울대학교
- 활동 연도
- 2022
- 활동 상세 설명
2022.07. - @ 서울시립대, "파이토치로 시작하는 딥러닝" 강의
2021.07. - @ 한경대학교, "파이썬과 파이토치로 시작하는 딥러닝" 강의
- 활동명
- 제11회 산업통상자원부 공공데이터 활용 BI 공모전
- 소속/기관
- 서울대학교
- 활동 연도
- 2023
- 활동 상세 설명
인원: 2명
역살: LLM을 이용하여 NL2SQL 파이프라인 개발
성과: 제품 및 서비스개발 우수상
개요: Large language model(LLM)의 코드 생성 기능을 활용하여, 자연어만으로도 데이터 베이스에 접근, 코드를 다룰 수 있도록 하는 것이 핵심적인 서비스
활용데이터: 산업통상자원부 세계 섬유 수출 현황(WTO 기준), 산업통상자원부 외국인직접투자동향 국가별 산업별 대한 외국인직접투자 통계 등