이런 것을 배울 수 있어요
GPT-4o Vision으로 이미지 분석 AI를 구현할 수 있습니다
Whisper로 실시간 음성 인식 시스템을 구축할 수 있습니다
멀티모달 AI 파이프라인을 설계하고 통합할 수 있습니다
강의 소개
텍스트를 넘어 이미지, 음성, 영상을 동시에 처리하는 멀티모달 AI 시스템을 개발합니다.
GPT-4o Vision, Whisper(음성→텍스트), DALL-E 3, Sora API 등 OpenAI의 멀티모달 API를 모두 실습하고, 실제 서비스에 통합하는 방법을 배웁니다.
음성 기반 AI 비서, 이미지 분석 챗봇, 자동 영상 요약 시스템을 완성합니다.
수강 전 알아두세요
- •Python 기초 이상, OpenAI API 사용 경험
- •OpenAI API 키 (유료)
태그
#GPT-4o#Whisper#DALL-E#멀티모달#Vision API
관련 강의
생성형 AI
베스트셀러
생성형 AI·중급
ChatGPT API & LangChain으로 AI 앱 개발
김도현
4.9(2,184)
2.2만명9시간 14분
₩129,000₩210,000
생성형 AI
베스트셀러NEW
생성형 AI·고급
RAG 시스템 구축: LlamaIndex & 벡터 DB
김도현
4.9(876)
8,760명8시간 36분
₩139,000₩220,000
생성형 AI
NEW
생성형 AI·고급
Claude API로 AI 에이전트 개발하기
김도현
4.8(543)
5,430명6시간 48분
₩119,000₩190,000
생성형 AI
NEW
생성형 AI·입문
Stable Diffusion & ComfyUI 이미지 생성 AI
최미래
4.7(763)
7,630명6시간 40분
₩99,000₩160,000