교육

chatGPT 세미나 내용 정리 (Open AI ChatGPT 활용 분야와 생성형 AI)

ByeongJun 2023. 5. 31. 15:00
반응형

 

1950년부터 인공지능의 시작

'메멕스'

 

개인적으로 ChatGPT 보다는 뤼튼을 자주 활용하는 편인 것 같습니다.


Open AI 회사 ChatGPT

Elon Musk, Sam Altman 2015년 샌프란시스코에서 비영리로 시작 (2019년 Open AI LP 제한된 영리 추구)

 

문맥에 맞는 다음 단어 생성  >  문맥 상통한 다음 문장 (추론)

(그러나 이것은 워드임배딩의 길을 찾은 것일 뿐)

 

언어 속에 담긴 문명 지능을 학습 > 창작 능력, 요약 ,분석, 연설문

 

ChatGPT 기술 이해

  1. 언어에서의 핵심 해결력은 임베딩 벡터 연산 : 벡터외적과 내적
  2. GPT 트랜스포머의 딥러닝 학습은 두번째 보완 알고리즘

프롬프트 주요 목적

  • 채팅을 통한 Ideation
  • Web Surfing
  • 지식 검색

 

- 일종의 마인드맵 논래 전개 가능한 AI
- 프롬프트를 통해 문맥에 어울리는 적절한 답변을 참고해 Idea Thinking
- 많은 정보가 학습되어 원하는 문맥의 요점을 파악하는 것이 중요

 

  • 열린 질문 형식으로 문맥을 통해 의사 소통 (답변의 내용을 구체화)
  • 핵심 키워드 배열이 중요
  • 우회적으로 여러번 원하는 질문 의도로 유인
  • 복잡한 질문은 간단한 하위 작업으로 분할
  • 보충 질의나 추가 보완 지시를 통해 원하는 형태로 도출
  • 유사 프롬프트 예시 참고
  • 모델이 작업을 계속 할 수 있도록 지침 구조화 
  • 가능한 많은 답변에 대한 근거를 묻고 종합
  • 사용자 정의 모델을 미세 조정하여 성능 극대화 

 

활용
분야
내용 한계
교육 학생이 학습 또는 과제 작성에 활용 - 비판적 사고, 창의력, 문제해결 능력 등 학업 능력 저하
연구 자료 정리·분석 및 시사점 도출 등 연구 논문 작성에 활용 - 연구논문, 품질·신뢰성 저하 및 연구 윤리 위반
법률 - 일반인의 법률 서비스 접근 기회 확대 및 이용 편의성 제고
- 법률 전문가의 자료 분석·정리에 활용
- 법률 전문가로서의 독립된 전문적 판단 능력 저하
- 저작권 침해
- 정보를 입력하여 검색시 비밀 유지의무 위반 가능
의료 - 건강·시술 관련 상황별 맞춤 전문 건강 관련 정보 이용 용이
- 신약 개발 연구에 활용
- 인간의 생명·건강 문제를 의존하는 것은 위험
- 의료진의 숙련도 저하

생성형 AI

  • 입력된 명령어에 맞추어 텍스트, 오디오, 이미지 등 학습된 기존 콘텐츠 데이터를 바탕
  • 통계적 추론에 의해 새롭게 해석한 후 결과물을 생성
  • ex) Dall-E, Stable Diffusion, Midjourney, NovelAI 등

>  인공지능에 법인격을 인정할 것인지 여부에 관해 논의가 있으나 아직 부여되고 있지 않음

 

 

개인정보와 프라이버시 문제

  • 개인정보 보호법 등 관련 법령 준수
  • 가능하면 비식별화 조치, 가명정보, 익명정보로 처리
  • 딥러닝 등 AI 알고리즘은 블랙박스 현상으로 인해 결과 도출 과정을 알기 어려운 경우가 많음
  • 개정 개인정보 보호법은 제 37조의 2(자동화된 결정에 대한 정보주체의 권리 등) 신설
    인공지능에 의한 데이터에 처리에 대한 거부·설명 요구권

 

< Hallucination ChatGPT >
오류가 있는 데이터로 학습하거나 라벨링(분류)이 안된 데이터로 학습하는 등의 문제로
잘못된 정보나 허위 정보를 생성하는 것

이용자가 질문하면 다음에 할말 토큰을 생성
한글의 경우 한글자가 2 토큰 정도로라고 할 때 10글자 = 200토큰

아무 내용이나 뽑아내는 것이 아니라 말이 되도록 문장을 만들어 내는 것
그렇기 때문에 진실성이 있는지 여부는 충분히 무리일 수 있음
(기업에서 해결해낼 문제)

작고 간단한 일을 더 정확하게 한다.
대화로 끝나지 않는 일들은 코드로 시킬 수 있다.
복잡한 일이라도 '생각''이유'를 말하라고 하면 더욱 정확하게 수행한다.

완전히는 아니지만 아래와 같은 방법으로 어느 정도 극복 가능
- 근거를 명확히 넣어주면 비교적 거짓말을 덜 한다.
- 출처를 명시하여 사람이 직접 확인 가능하도록 한다.

 

AI가 만든 작품에 대한 관리

AI개발사

AI가 작품을 만들 수 있는 알고리즘을 설계한 자, AI 학습데이터를 세팅한자 등

 

AI 서비스 제공자

AI를 상품화하여 이용자들에게 제공한 자 등

 

  • 생성AI의 결과물이 부정경쟁방지법 상 성과에 해당하는지에 관한 명확한 판사는 아직 없음
  • 창작적인 요소를 가미한 사람이 저작권을 주장할 가능성은 있음
  • Open AI는 출력물에 대한 모든 권리, 소유권 및 이권을 귀하에게 양도한다는 약관을 제공
  • 국내 저작권법 제2조 제18호 편집 저작물 : 편집물로서 소재의 선택, 배열 또는 구성에 창작성이 있는 것
    저작권 보호 대상 : 사람에 의한 AI 콘텐츠의 선택, 조정, 배열 등

AI학습데이터

저작권자의 사용 허가 없이 저작물을 학습할 수 있는지의 문제

 

생성AI와 저작권 이슈

- 생성 AI로 만들어진 결과물에 대한 권리 인정여부에 대한 논의

- 생성AI 서비스 제공자의 안내 및 사용자의 주의

- 학습데이터 공개 의무

- 학습데이터 세트에 대한 공정이용 논의(TDM 도입 여부)

 


1. 문제정의

  • AI풀기 적합한 문제인가?
  • 어떤 수준의 AI를 도입해야 적합한가?
  • 굳이 AI를 도입하지 않아도 되거나 적합하지 않아서 실패하는 경우도 있음

2. 적합한 도입방법

  • 내재화
    • 자체 Biz에 Critical한가?
    • 회사 종속성이 큰 Use-case인가?
  • 범용 솔루션 도입 > 대부분 성능 한계
    • 높은 정확도가 요구되는가?
    • 변경이 불필요한가?
  • SI 구축 > 지속성 확보 대부분 불가능
    • One-time성으로 지속성 확보 할 수 있는가?

3. 지속성 유지

  • Biz value 이상의 성능으로 지속적으로 유지 가능한가?

 

 

 

  • 언어모델(LM, 다음 단어 맞추기)과 엄청난 데이터가 만나니 다양한 언어 Task에 일정 수준 이상으로 대응하기 시작
  • GPT3와 ChatGPT로 오면서 NLP Big model이 임계치 이상의 성능을 보여주면서 실제 비즈니스 적용 가능성 발생
  • GPT를 통한 Use-case ideation과 한계를 이해하기 위해서는 Example이 아닌 어떤 원칙인지 이해가 필요함

 

 

 

GPT가 잘하는 영역 (기존 NLP류의 Task) GPT가 못하는 영역
"언어 지식 기반의 작문"

학습데이터와 Prompt로 들어간 언어를 해석하여,
이를 기반으로 작문하는 것

- 요약, 번역, 글을 다시 쓰기, 스토리텔링 정리 등의 Task
- 일반적으로 합의가 된 지식에 대한 대답 (검색과 다름)
- 정해진 논리인 기호논리학, 대표적으로 코딩을 잘하는 것
- 창의력 영역에서의 효과도 많은 양의 언어 지식을 편견없이 작문
"주어진 언어 지식 내에서 단어의 다음을 예측하는
끝말잇기 방식이기 때문에 문제 발생"


- 할루시네이션 (Hallucination)
- 실시간성 부족
- 강화 학습에 의한 답변 방식의 편향성
- 부족한 정보, 논리 내에서 답변 오류
  (ex) 수학문제 계산)

 

  • GPT를 위시한 Big model들로 노동 퀄리티 및 생산성의 Minimum bar가 많이 올라갈 것은 확실
  • 시장에서의 고객 경험이 바뀔 가능성
  • 이로 인해 잘 사용하는 기업과 그렇지 못한 기업의 경쟁력 차이는 벌어질 수 밖에 없음
  • 과거에 사용하던 솔루션들과 다른 점은 누군가 성공한 솔루션을 도입한다고 그 격차가 바로 좁혀지지 않을 것
  • 나에게 맞는 특화 GPT는 원리상 실 사용환경에서의 추가 데이터 및 피드백을 통한 강화 학습이 필요
  • 다양한 Use-case에서 테스트해보고 개선하는 기업이 경쟁력을 가져갈 것으로 예상

초거대 AI

단어와 단어 사이의 관계로 문장의 맥락과 의미를 학습하고 다음에 위치할 단어를 추론·생성하는

생성형 AI 중 모델의 크기 및 학습데이터의 양이 큰 AI

 

방대한 데이터, 고도화된 알고리즘(트랜스포머 등), 컴퓨팅 파워의 극적인 발전을 바탕으로 이뤄낸 성과

산업에 미치는 영향

초거대 AI는 언어, 이미지 "생성"이 필요한 분야를 중심으로 AI의 성능을 획기적으로 개선

> 초거대 AI가 경쟁력의 핵심으로 자리잡을 전망 (정확도 오류, 빅테크 중심의 승자 독식, 일자리 감소 문제 등)

 

 

초거대 AI는 사람 수준의 언어·시각 능력을 바탕으로 기존의 디지털 영역을 더욱 확장하여,
전 산업에 걸친 생산성 및 업무 효율 증대 효과 기대

검색 여러 번의 검색 대신 질문에 대한 정확도 높은 답변 제공 (온라인 광고 비즈니스 모델 변화 예상)
워드 등 업무용 SW AI가 디지털 작업의 압도적 효율성 향상의 도구로 진화
코딩 노코드, 로우코드로 AI개발·활용이 비전문가까지 확대
이미지 생성 텍스트 입력을 통해 전문가 수준의 이미지 생성

 

반응형