티스토리 뷰

목차



    직장인이라면 누구나 사표하나 품고 다닌다고 하죠? 그만큼 하루 8시간 그 이상을 회사에 충성하면서 상사의 고충, 동료들과의 경쟁등 스트레스를 앉고 살아갑니다. 예전처럼 직장이 나의 노후를 걱정해주지 않고 정년퇴직은 옛말인 된 세상에 살고 있습니다. 디지털노마드를 꿈꾸는 사람들이 여러 부업들을 알아보는데요. 저도 그렇게  유튜브나 SNS를 통해서 알게 된 데이터라벨링에 대해 알려드리려고 합니다. 단어부터 생소한 데이터라벨링!  지금부터 알아볼게요.

    데이터라벨링

     

    데이터라벨링이란

    인공지능 알고리즘의 고도화를 위해서 AI가 스스로 학습할 수 있는 형태로 데이터를 가공하는 작업입니다.

    학습을 하지 않은 인공지능(AI)은 유아나 다름이 없는데요. 아이처럼 부모의 가르침을 받으면서 세상을 알아가듯이 인공지능도 학습을 통해서 세상을 인식하면서 똑똑한 인공지능으로 발전할 수 있습니다. 이때 인공지능이 학습할 수 있도록 하기위해서는 '라벨'을 부착해주어야 하는데요. 이렇게 인공지능이 학습할 수 있도록 데이터에 라벨을 달아주는 작업을 '데이터라벨링(Data Labeling)'이라고 합니다. 인공지능의 데이터는 그 명칭뿐만 아니라 데이터 인식에 필요한 설명이나 정답같은 의미를 가집니다. 인공지능의 필수인 학습과 한층 더 똑똑한  AI로 발전할 수 있는 시작이라고 할 수 있는 데이터 라벨링입니다. 이 데이터라벨링의 과정은 수집, 정제, 라벨링, 검수의 4단계를 거치면서 인공지능이 학습할 수 있는 데이터로 만들어집니다.

     

    ◆ 데이터 수집 : 다양한 종류의 데이터를 모으는 과정

    ◆ 데이터 정제 : 인공지능 학습에 적합한 형태로 바꿔주는 과정

         (데이터의 오류제거, 필요한 형식이나 크기에 맞게 변형, 불필요한 데이터의 제거, 개인정보 비식별화)

    ◆ 데이터 라벨링 : 인공지능이 인지하고 학습할 수 있는 형태로 가공한다고 해서 데이터 라벨링 = 데이터 가공

    ◆ 데이터 검수 : 데이터의 잘못된 라벨을 부착했을 시 잘못된 학습경과가 나타나니 학습 전 필수 작업입니다.

     

    이렇게 수집, 정제, 라벨링, 검수를 거친 데이터를 '인공지능 학습용 데이터'라고 합니다. 이렇게 데이터의 형식에 따라서 데이터를 만드는 사람을 '데이터 라벨러'라고 합니다.

    데이터 라벨러의 역할

    우리는 궁금한 게 있으면 인터넷 검색사이트를 이용하고, 자신의 일상을 공유하면서 다양한 주제들과 다양한 형식들로 수많은 영상이 업로드되고 있습니다. 지금 이 순간에도 많은 데이터들이 넘쳐나고 있는데 데이터만 있다고 해서 인공지능 학습에 활용하는 것은 불가능합니다. 그래서 데이터의 유형과 개발목적에 맞는 데이터 정제와, 라벨링을 거쳐야만 인공지능학습에 적합한 자격을 갖추게 됩니다. 

    데이터의 유형은 아주 다양합니다. 크게 이미지, 영상, 텍스트, 음성으로 나뉘게 되며 데이터라벨러가 담당하는 업무는 데이터를 모으는 수집과, 인공지능이 학습할 수 있는 형태로 가공되는 작업으로 나뉩니다.

     

    데이터의 유형

    ◆ 이미지 데이터

      - 활용 : 랜드마크, 손글씨, 얼굴인식, 질환진단등에 활용

      - 수집 : 작업 대상과 기준에 맞춰 사진을 업로드하는 방식

      - 가공(라벨링) : 바운딩, 감정분석, 키포인트, 얼굴랜드마크, OCR, 폴리곤, 폴리라인

     

    (예) 기본적으로 사진을 찍고 이미지에서 추출하고자 하는 대상을 네모박스로 표시하는 라벨링 기법인 바운딩이 있습니다.

    바운딩 예시

    영상 데이터

      - 활용 : 이상행동탐지나 동작분석, 감성인식등에 활용

      - 수집 : 작업 대상과 기준에 맞춰 영상을 업로드하는 방식

      - 가공(라벨링) : 바운딩, 특정구간추출, 스켈레톤, 시멘틱세그멘테이션

     

    텍스트

      - 활용 : 인터넷 자동완성기능, 연관검색어, 챗봇 서비스 등

      - 수집 : 제시된 내용에 적절한 질문을 작성하거나 Q&A 대화를 만드는 방식

      - 가공(라벨링) : 문장의미비교, 키워드 찾기, 감정태깅, 문장요약

     

    음성

      - 활용 : 상황별 맞춤 대화록 작성, 자동번역, 영상자막등에 활용

      - 수집 : 휴대폰으로 음성등의 소리를 녹음해서 바로 업로드하는 방식

      - 가공(라벨링) : 화자구분, 음성받아쓰기

     

    바운딩 예시

    데이터라벨링 자격증

    2022년 고용노동부 직업사전 정식으로 등재된 4차 산업혁명 시대에 떠오르는 직업 데이터 라벨러!

    국민내일 배움 카드 훈련과정 데이터 라벨링 기초-작업자 과정 및 심화-검수자 과정으로 진도율 80% 이상 + 최종평가 60점 이상 이수하면 교육기간 종료 후 수료증을 받게 됩니다.  이렇게 자격증을 취득하면 데이터 라벨링 작업을 할 수 있습니다. 초보자도 사이트별로 참여가능한 작업이 있으니 체험을 해보시고 자격증을 취득해서 더 전문적으로 라벨링을 하시면 됩니다. 디지털 노마드를 꿈꾸는 분들이라면 내일배움카드로 지원받아서 교육을 수료하면 더 많은 작업을 할 수 있게 되니 도전해 보세요.

    국민내일배움카드 훈련과정안내

     

    국민내일배움카드 훈련과정

    데이터라벨링 관련 사이트

    1. Crowdworks

     

    AI를 학습시키는 데이터라벨링, 지금 바로 시작하세요! | 크라우드웍스 데이터 라벨링

    데이터 라벨링 그 이상의 경험을 제공합니다. 크라우드웍스에서는 누구나 쉽게 AI를 학습시키고 수익을 얻을 수 있는 경험을 모두에게 전달하고자 합니다.

    works.crowdworks.kr

    2. Labelon

     

    LabelOn

    라벨온,재택근무,LabelOn,AI,유클리드소프트,Euclidsoft,어노테이터,리뷰어,Annotator,Reviewer

    www.labelon.kr

    3. aiworks

     

    aiworks

    에이아이웍스의 워키가 되어, 당신의 인생을 바꿀 기회를 만나보세요 aiworks와 함께 하면 혜택은 무엇이 있을까요?

    aiworks.co.kr

    4. Labelr

     

    레이블러, Human + AI = Labelr

    사람과 AI가 함께하는 고품질 데이터 구축. AI 학습 데이터부터 일반 데이터의 수집, 가공까지 레이블러에 맡기고 비즈니스 본연의 가치에 집중하세요.

    labelr.io

     

     

    반응형