1950년부터 인공지능의 시작
Open AI 회사 ChatGPT
Elon Musk, Sam Altman 2015년 샌프란시스코에서 비영리로 시작 (2019년 Open AI LP 제한된 영리 추구)
문맥에 맞는 다음 단어 생성 > 문맥 상통한 다음 문장 (추론)
(그러나 이것은 워드임배딩의 길을 찾은 것일 뿐)
언어 속에 담긴 문명 지능을 학습 > 창작 능력, 요약 ,분석, 연설문
ChatGPT 기술 이해
- 언어에서의 핵심 해결력은 임베딩 벡터 연산 : 벡터외적과 내적
- GPT 트랜스포머의 딥러닝 학습은 두번째 보완 알고리즘
프롬프트 주요 목적
- 채팅을 통한 Ideation
- Web Surfing
- 지식 검색
- 일종의 마인드맵 논래 전개 가능한 AI
- 프롬프트를 통해 문맥에 어울리는 적절한 답변을 참고해 Idea Thinking
- 많은 정보가 학습되어 원하는 문맥의 요점을 파악하는 것이 중요
- 열린 질문 형식으로 문맥을 통해 의사 소통 (답변의 내용을 구체화)
- 핵심 키워드 배열이 중요
- 우회적으로 여러번 원하는 질문 의도로 유인
- 복잡한 질문은 간단한 하위 작업으로 분할
- 보충 질의나 추가 보완 지시를 통해 원하는 형태로 도출
- 유사 프롬프트 예시 참고
- 모델이 작업을 계속 할 수 있도록 지침 구조화
- 가능한 많은 답변에 대한 근거를 묻고 종합
- 사용자 정의 모델을 미세 조정하여 성능 극대화
활용 분야 |
내용 | 한계 |
교육 | 학생이 학습 또는 과제 작성에 활용 | - 비판적 사고, 창의력, 문제해결 능력 등 학업 능력 저하 |
연구 | 자료 정리·분석 및 시사점 도출 등 연구 논문 작성에 활용 | - 연구논문, 품질·신뢰성 저하 및 연구 윤리 위반 |
법률 | - 일반인의 법률 서비스 접근 기회 확대 및 이용 편의성 제고 - 법률 전문가의 자료 분석·정리에 활용 |
- 법률 전문가로서의 독립된 전문적 판단 능력 저하 - 저작권 침해 - 정보를 입력하여 검색시 비밀 유지의무 위반 가능 |
의료 | - 건강·시술 관련 상황별 맞춤 전문 건강 관련 정보 이용 용이 - 신약 개발 연구에 활용 |
- 인간의 생명·건강 문제를 의존하는 것은 위험 - 의료진의 숙련도 저하 |
생성형 AI
- 입력된 명령어에 맞추어 텍스트, 오디오, 이미지 등 학습된 기존 콘텐츠 데이터를 바탕
- 통계적 추론에 의해 새롭게 해석한 후 결과물을 생성
- ex) Dall-E, Stable Diffusion, Midjourney, NovelAI 등
> 인공지능에 법인격을 인정할 것인지 여부에 관해 논의가 있으나 아직 부여되고 있지 않음
개인정보와 프라이버시 문제
- 개인정보 보호법 등 관련 법령 준수
- 가능하면 비식별화 조치, 가명정보, 익명정보로 처리
- 딥러닝 등 AI 알고리즘은 블랙박스 현상으로 인해 결과 도출 과정을 알기 어려운 경우가 많음
- 개정 개인정보 보호법은 제 37조의 2(자동화된 결정에 대한 정보주체의 권리 등) 신설
인공지능에 의한 데이터에 처리에 대한 거부·설명 요구권
< Hallucination ChatGPT >
오류가 있는 데이터로 학습하거나 라벨링(분류)이 안된 데이터로 학습하는 등의 문제로
잘못된 정보나 허위 정보를 생성하는 것
이용자가 질문하면 다음에 할말 토큰을 생성
한글의 경우 한글자가 2 토큰 정도로라고 할 때 10글자 = 200토큰
아무 내용이나 뽑아내는 것이 아니라 말이 되도록 문장을 만들어 내는 것
그렇기 때문에 진실성이 있는지 여부는 충분히 무리일 수 있음
(기업에서 해결해낼 문제)
작고 간단한 일을 더 정확하게 한다.
대화로 끝나지 않는 일들은 코드로 시킬 수 있다.
복잡한 일이라도 '생각'과 '이유'를 말하라고 하면 더욱 정확하게 수행한다.
완전히는 아니지만 아래와 같은 방법으로 어느 정도 극복 가능
- 근거를 명확히 넣어주면 비교적 거짓말을 덜 한다.
- 출처를 명시하여 사람이 직접 확인 가능하도록 한다.
AI가 만든 작품에 대한 관리
AI개발사
AI가 작품을 만들 수 있는 알고리즘을 설계한 자, AI 학습데이터를 세팅한자 등
AI 서비스 제공자
AI를 상품화하여 이용자들에게 제공한 자 등
- 생성AI의 결과물이 부정경쟁방지법 상 성과에 해당하는지에 관한 명확한 판사는 아직 없음
- 창작적인 요소를 가미한 사람이 저작권을 주장할 가능성은 있음
- Open AI는 출력물에 대한 모든 권리, 소유권 및 이권을 귀하에게 양도한다는 약관을 제공
- 국내 저작권법 제2조 제18호 편집 저작물 : 편집물로서 소재의 선택, 배열 또는 구성에 창작성이 있는 것
저작권 보호 대상 : 사람에 의한 AI 콘텐츠의 선택, 조정, 배열 등
AI학습데이터
저작권자의 사용 허가 없이 저작물을 학습할 수 있는지의 문제
생성AI와 저작권 이슈
- 생성 AI로 만들어진 결과물에 대한 권리 인정여부에 대한 논의
- 생성AI 서비스 제공자의 안내 및 사용자의 주의
- 학습데이터 공개 의무
- 학습데이터 세트에 대한 공정이용 논의(TDM 도입 여부)
1. 문제정의
- AI풀기 적합한 문제인가?
- 어떤 수준의 AI를 도입해야 적합한가?
- 굳이 AI를 도입하지 않아도 되거나 적합하지 않아서 실패하는 경우도 있음
2. 적합한 도입방법
- 내재화
- 자체 Biz에 Critical한가?
- 회사 종속성이 큰 Use-case인가?
- 범용 솔루션 도입 > 대부분 성능 한계
- 높은 정확도가 요구되는가?
- 변경이 불필요한가?
- SI 구축 > 지속성 확보 대부분 불가능
- One-time성으로 지속성 확보 할 수 있는가?
3. 지속성 유지
- Biz value 이상의 성능으로 지속적으로 유지 가능한가?
- 언어모델(LM, 다음 단어 맞추기)과 엄청난 데이터가 만나니 다양한 언어 Task에 일정 수준 이상으로 대응하기 시작
- GPT3와 ChatGPT로 오면서 NLP Big model이 임계치 이상의 성능을 보여주면서 실제 비즈니스 적용 가능성 발생
- GPT를 통한 Use-case ideation과 한계를 이해하기 위해서는 Example이 아닌 어떤 원칙인지 이해가 필요함
GPT가 잘하는 영역 (기존 NLP류의 Task) | GPT가 못하는 영역 |
"언어 지식 기반의 작문" 학습데이터와 Prompt로 들어간 언어를 해석하여, 이를 기반으로 작문하는 것 - 요약, 번역, 글을 다시 쓰기, 스토리텔링 정리 등의 Task - 일반적으로 합의가 된 지식에 대한 대답 (검색과 다름) - 정해진 논리인 기호논리학, 대표적으로 코딩을 잘하는 것 - 창의력 영역에서의 효과도 많은 양의 언어 지식을 편견없이 작문 |
"주어진 언어 지식 내에서 단어의 다음을 예측하는 끝말잇기 방식이기 때문에 문제 발생" - 할루시네이션 (Hallucination) - 실시간성 부족 - 강화 학습에 의한 답변 방식의 편향성 - 부족한 정보, 논리 내에서 답변 오류 (ex) 수학문제 계산) |
- GPT를 위시한 Big model들로 노동 퀄리티 및 생산성의 Minimum bar가 많이 올라갈 것은 확실
- 시장에서의 고객 경험이 바뀔 가능성
- 이로 인해 잘 사용하는 기업과 그렇지 못한 기업의 경쟁력 차이는 벌어질 수 밖에 없음
- 과거에 사용하던 솔루션들과 다른 점은 누군가 성공한 솔루션을 도입한다고 그 격차가 바로 좁혀지지 않을 것
- 나에게 맞는 특화 GPT는 원리상 실 사용환경에서의 추가 데이터 및 피드백을 통한 강화 학습이 필요
- 다양한 Use-case에서 테스트해보고 개선하는 기업이 경쟁력을 가져갈 것으로 예상
초거대 AI
단어와 단어 사이의 관계로 문장의 맥락과 의미를 학습하고 다음에 위치할 단어를 추론·생성하는
생성형 AI 중 모델의 크기 및 학습데이터의 양이 큰 AI
방대한 데이터, 고도화된 알고리즘(트랜스포머 등), 컴퓨팅 파워의 극적인 발전을 바탕으로 이뤄낸 성과
산업에 미치는 영향
초거대 AI는 언어, 이미지 "생성"이 필요한 분야를 중심으로 AI의 성능을 획기적으로 개선
> 초거대 AI가 경쟁력의 핵심으로 자리잡을 전망 (정확도 오류, 빅테크 중심의 승자 독식, 일자리 감소 문제 등)
초거대 AI는 사람 수준의 언어·시각 능력을 바탕으로 기존의 디지털 영역을 더욱 확장하여,
전 산업에 걸친 생산성 및 업무 효율 증대 효과 기대
검색 | 여러 번의 검색 대신 질문에 대한 정확도 높은 답변 제공 (온라인 광고 비즈니스 모델 변화 예상) |
워드 등 업무용 SW | AI가 디지털 작업의 압도적 효율성 향상의 도구로 진화 |
코딩 | 노코드, 로우코드로 AI개발·활용이 비전문가까지 확대 |
이미지 생성 | 텍스트 입력을 통해 전문가 수준의 이미지 생성 |
'교육' 카테고리의 다른 글
AWSome Day 온라인 컨퍼런스 (AWS클라우드 및 용어 정리) (1) | 2023.06.07 |
---|---|
인공지능 GPT-4 웨비나 (AI 산업화 역사) (0) | 2023.06.02 |
Git & GitHub 실무 활용 (GitHub 용어 정리) (0) | 2023.05.27 |
Git & GitHub 실무 활용 (Git 설치 및 용어 정리) (0) | 2023.05.26 |
Git & GitHub 실무 활용 정리 (기본용어 / Branch 종류) (0) | 2023.05.26 |