[김영기 칼럼] 생활 속 블록체인_2 블록체인과 ChatGPT의 결합

[김영기 칼럼] 위고의 생활 속 블록체인_2 블록체인과 ChatGPT의 결합

▲사진=김영기 (주)위고컴퍼니 대표이사 ⓒ강남구 소비자저널

[강남구 소비자저널=김영기 칼럼니스트]

자기소개서를 ChatGPT에 넣으면 작성해준다고?”

취업을 준비하는 친구한테 들은 내용은 상당히 신기하면서도 의구심이 가는 내용이었다. 하지만 인터넷에 검색하자마자 관련된 많은 글이 쏟아져 나왔다. 실제로 ChatGPT를 통해 자기소개서를 작성해달라고 한 사용자 대다수의 평가는 작성된 내용을 그대로 사용할 수는 없지만, 어느 정도의 기반을 만들어 주기 때문에 처음 자기소개서를 작성하는 입장에서 상당한 도움을 받는 것은 분명하다는 입장이었다.

▲사진=국내 대기업에서 내놓고 있는 LLM 모델. 왼쪽부터 하이퍼클로바 X, KOGPT, EXAONE( 출처 : 클로바 X 공식 홈페이지 / 카카오 디벨롭스 홈페이지 / LG AI 연구원 홈페이지) ⓒ강남구 소비자저널

요즘 모르는 것이 있으면 일단 ChatGPT에 물어보라는 대답을 증명하듯 AI 기반 언어처리 모델에 대한 관심이 뜨겁다. 이러한 흐름은 국내에서도 이어져 네이버의 하이퍼클로바X, 카카오의 Ko GPT 2.0, LG의 엑사원 2.0 등 대기업들이 자사 LLM(Large Language Model) 모델을 내놓고 있거나 예정되어 있다.

▲사진=상위 1,000개의 사이트 중 GPT봇 차단 비율(출처 : originality.ai 홈페이지) ⓒ강남구 소비자저널

하지만 최근 들어 ChatGPT 모델에 대한 제동이 걸리고 있다. 광범위한 데이터 수집 방식을 둘러싼 저작권 논란이 증가하고 있으며, 웹사이트들은 특정 콘텐츠를 사전 동의 없이 자동으로 수집하여 무단 사용하는 ChatGPT의 크롤링을 차단하고 있다. AI 콘텐츠 관련 제공업체 orgianlity.ai에 따르면, 지난 8월 22일 기준 상위 1,000개의 사이트 중 9.2%가 GPT봇이 데이터를 수집하는 행위를 차단하고 있다.

▲사진=엉뚱한 질문에 대한 가짜 데이터를 답변하는 내용(출처 : ChatGPT) ⓒ강남구 소비자저널

 

학습한 데이터베이스를 통해 내용을 생성하여 답변하는 방식이다 보니 사용자가 질문한 내용을 엉터리로 조합하여 사용자에게 가짜 데이터를 전달하는 경우도 있다. 예시로 필자가 커피를 마시던 도중 뜬금없이 커피찌개 레시피를 알려달라는 엉뚱한 질문을 던졌는데 한국의 전통 음식 중 하나라는 답변과 함께 끝없이 나오는 재료 및 레시피를 나열하는 진풍경이 펼쳐졌다.

ChatGPT가 내놓은 결과물을 보면서 어이가 없기도 했지만, 문득 ‘데이터를 블록체인과 결합해서 사용하면 어느 정도 문제점을 해결할 수 있지 않을까?’ 라는 생각이 들었다. 이러한 시작에 있어 가장 우선시되는 점은, 두 분야의 결합에 있어 사실과 다르게 내용을 창조해 사용자에게 답변하는 ‘AI 환각’ 현상과 같은 논리적 오류를 줄여 나가는 것이 중요하며, 개선 방안으로 OpenAI에서 제공하는 ‘Fine-tuning’과 같은 기술을 활용하는 것이다. 이때 특정 작업과 관련된 추가 데이터를 학습시켜 답변 내용이 관련성 있고 정확한 응답을 생성할 수 있도록 개선 해주는 것이 중요하다.

 

 

▲사진=OpenAI의 Fine-tuned model 구성 시 가이드(참고 : OpenAI Documentation) ⓒ강남구 소비자저널

 

이러한 데이터를 기반으로 위∙변조를 방지하고 암호화된 형태로 정보를 저장하는 블록체인의 특성을 활용 가능하다면 AI 기반 언어처리 모델이 데이터를 임의로 생성하여 사용자에게 답변하는 문제점도 해결할 수 있으며, 블록체인에 저장된 데이터를 참조함으로써 저작권 문제와 관련하여 어느 정도 자유로워질 수 있을 것이라는 생각이 들었다.

 

▲사진=ChatGPT 와 블록체인을 활용한 금융 서비스 ⓒ강남구 소비자저널

활용 가능한 분야에 대한 예로 금융업에서는 고객의 금융 거래와 관련된 민감한 내용을 블록체인에 데이터로 저장하여 외부로부터 안전하게 보호 가능하며, 해당 정보를 기반하여 사용자가 ChatGPT를 활용한 금융 서비스를 제공받을 수 있을 것이다. 자동차 업계에서는 차량의 전체 컨디션이나 고장이 났을 때 정비소에 입고된 차량의 증상 및 수리 이력에 관한 내용을 블록체인 기술을 통해 데이터로 저장한다. 이러한 데이터는 차량의 소유자 또는 해당 차량의 중고 판매 시 구매자가 확인이 가능하며, 데이터를 기반으로 ChatGPT를 통해 차량 상태 분석 등의 관련 서비스를 제공 받을 수 있다. 정비소 또한 차량의 기존 수리 이력과 같은 내용을 블록체인에 저장된 데이터를 통해서 확인할 수 있다.

▲사진=ChatGPT와 블록체인을 활용한 차량 관련 서비스 ⓒ강남구 소비자저널

 

다만 현재 상용화가 이루어지기 위해서는 조율해야 하는 부분이 많은 ChatGPT와 블록체인의 결합이다. 관련해서 떠오르는 문제점이 있다면, 사용자가 서비스를 이용 시 ChatGPT와의 대화 내용을 우리가 흔히 접하는 EVM[1] 기반 블록체인에 저장하기 위해서는 트랜잭션 비용이 발생하며, 데이터가 블록체인에 저장되기까지 네트워크 처리 시간이 필요하다는 점은 현재 사용되고 있는 ChatGPT와 같은 LLM의 경우 실시간 처리를 요구하는 점에 있어 적합하지 않다. 제한된 데이터로 학습 시 도출되는 답변에 대한 다양성이 제한되어 성능 저하로 이어질 수 있다는 문제점 또한 결합에 있어 풀어나가야 할 숙제이다. 이러한 부분과 관련해서 추후 대안과 개선 사항이 생긴다면, 두 분야를 합친 결과물이 나름 괜찮은 방향을 제시해 줄 수 있지 않을까 예상한다.

 

[1] EVM : Ethereum Virtual Machine약자로 이더리움에서 스마트 계약을 처리하기 위한 가상 머신(출처 : 위키피디아 이더리움)

 

 

 

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다