AI 데이터 파이프라인: 수집·정제·라벨링

웹 크롤링부터 Label Studio 라벨링, Airflow 파이프라인 자동화까지

4.6
(287개 후기)
수강생 2,870
강사:박신영
중급
5시간 48분
14개 강의
한국어
마지막 업데이트: 2025년 1월 15일

이런 것을 배울 수 있어요

대규모 AI 학습 데이터를 자동으로 수집하고 정제할 수 있습니다
Label Studio로 효율적인 라벨링 워크플로우를 구축할 수 있습니다
Airflow로 데이터 파이프라인을 자동화하고 모니터링할 수 있습니다

강의 소개

좋은 AI 모델은 좋은 데이터에서 나옵니다. 웹 크롤링, API 수집, 공공데이터 활용으로 대규모 데이터를 수집하고, 자동화된 품질 검사와 전처리 파이프라인을 구축합니다. Label Studio로 이미지·텍스트·음성 데이터를 효율적으로 라벨링하고, 라벨 품질을 자동으로 검증하는 시스템을 만듭니다. Airflow로 전체 파이프라인을 자동화하고 스케줄링하는 방법까지 배웁니다.

수강 전 알아두세요

  • Python 기초 이상
  • SQL 기초 지식

태그

#데이터 수집#크롤링#Label Studio#Airflow#데이터 파이프라인
₩89,000
₩140,000
Maroa - 국내 No.1 AI 전문 강의 플랫폼