본문 바로가기
문학

스스로 소설을 쓰는 AI 딥러닝 기술

by ^^^^*** 2021. 10. 18.

스스로 소설을 쓰는 AI 딥러닝 기술


요즘에는 AI기술이 발전하여 사람만이 할 수 있다고 믿었던 예술 분야에 까지 진출하였습니다. 딥러닝 방식으로 AI에게 기존 소설에 나오는 문장 수백만개를 입력하여 스스로 학습을 시키면 되는데요. AI는 이야기를 풀어가는 맥락을 파악한 뒤 인간의 창작 방식을 알고리즘화 하여 이를 기반으로 소설의 내용을 채웁니다. 이러한 방식으로 AI는 무협지나 로매스처럼 서사적 전개 방식이 공정되어 있는 공통적인 플롯이 있는 글 쓰기에 유용한데요. 스포츠 소설의 경우 승리에 이르는 과정에 약간의 차이는 있지만 대부분은 비슷하게 전개됩니다. 

 

이러한 유형의 플롯은 작가의 독특한 개성을 보여줄 여지가 비교적 적기 때문에 AI가 글을 쓰는 것이 가능하다고 하는데요. 또한 밀실에서 탈출하거나 알리바이를 무너뜨리는 등 뚜렷한 목표를 설정할 수 있는 장르에서도 큰 역량을 발휘할 것으로 보고 있습니다. AI 소설의 구성이나 문장의 표현은 일반 소설에는 아직 미치지 못하였는데요. 작가의 정신이나 문제의식을 담아내거나 차원이 다른 철학이나 문학의 창의성을 보여주는 것도 아직은 어렵다고 합니다. 아직은 AI혼자서 이러한 소설을 창작할 수는 없습니다. 

 

사람이 AI에 학습 데이터를 입력해야 하며 사람이 기존에 사용했던 문장을 학습하였기 때문에 오타가 생기기도 합니다. 전문가들은 AI가 사람과 협력하여 창작의 질을 높일 수 있다고 기대하는데요. 전체적인 플롯은 AI가 구성하고 작가는 세부적인 문장을 다음어 소설을 완성할 수 있습니다. 또한 작가가 AI를 활용하여 생각하지 못했던 소재를 힌트로 얻는 식으로 작품의 완성도를 높일 수 있을 것으로 전망합니다. 

 

앞으로 인간과 AI의 협업을 할 수 있는 가능성은 충분합니다. 미래에 AI가 소설 한편을 온전하게 쓸 수 있게 될때 인간의 위치를 위협하는 것이 아니라 하나의 작가가 탄생하는 것 이상의 의미는 없을 것이라고 생각합니다. 이러한 기술로 도약하려면 딥러닝 기술이 더 발전되어야 합니다. 인공신경망 자체는 꽤 오랫동안 존재하였으며 80년대에 활발하게 연구되었던 주제입니다. 하지만 당시의 컴퓨터의 연산성능으로는 사실상 쓸만한 모델구현에 불가능했고 십수년 동안 이론적인 방법으로만 여겨졌습니다.

 

하지만 2000년대에 들어서 그 이론들이 현실로 다가왔으며 2009년 부터 엄청난 신드롬을 일으킨 이후 인공지능 분야의 구세주로 추앙받게 됩니다. 딥러닝의 가장 큰 특징은 모델의 부피를 키우고 데이터를 쏟아부으면 무조건적으로 그만큼의 성능향상을 보인다는 점인데요. 하지만 어떤 사람들은 딥러닝을 다른 기계학습과 동떨어진 마법의 기술처럼 착각하는 경향을 보이기도 합니다. 사실 딥러닝은 기계학습 알고리즘의 한 종류라고 볼 수 있습니다. 즉 딥러닝 기계학습인데요. 인공신경망류 기법들은 통계학적으로 보면 아주 크고 복잡한 혼합 회귀 모델의 일종이라고 볼 수 있습니다.

 

딥러닝이 일반적인 MLP에 비해 가장 문제가 되는 것은 하나는 다수의 히든 레이어를 사용한다는 것인데요. 매층을 지날때마다 정답을 낼 수 있는 공식의 교과과정이 일어난다고 볼 수 있습니다. 단, 그교정과정이 1부터 0까지의 숫자를 계속 곱하여 수정하는 방식이기 때문에 히든 레이어인 경우 차츰 공식의 기울기가 0에 가까워지는 문제가 존재하게 됩니다. 이러한 이유 때문에 기울기 소멸문제는 인공신경망 학계를 고가시킨 전례가 있습니다. 만약 노이즈가 제거된 정제한 데이터를 머신러닝에 사용하면 레이어 수에 상관없이 일정한 값에 쉽게 수렴을 하게 됩니다.

 

또한 그 예측력도 일반적으로 사용되고 있는 회귀모델에 비해서 결코 우수하지 않습니다. 그러나 고전적인 회귀모델을 쓰지 않고 행렬방식의 인공지능을 쓰는 가장 큰 이유는 데이터 노이즈를 귀납적인 행렬연산으로 필터링화 할 수있고 고정된 수학적인 모델값이 아니라 데이터 변화에 대한 학습을 통해 예측모델을 진화시킬 수 있다는 점입니다. 일반적인 경우 딥러닝과 일반 머신 러닝과의 차이를 히든레이어 수로 설명하는 사례가 많은데 틀린말은 아닙니다.

 

하지만 히든레이어의 개수가 머신러닝으로 최적화 되는 것을 돕는 것이 아니라 정제되지 않는 방대한 데이터의 노이즈를 해소하고 빠르게 예측된 답을 찾게 해주는 것입니다. 오늘날에는 인공지능이 글을 쓰는 것 뿐만 아니라 자율주행 자동차의 딥러닝 학습은 이미지 학습에 의한 사물인지와 , 사물속도, 주행차량 속도 3가지 영역으로 구분되며 사물회피를 통해 안정적 주행을 위한 핸들링, 속도제어를 하는 것입니다.

 

세계에서 가장 영향력이 있는 바둑기사 이세돌은 알파고와 바둑경기에서 1승을 따낸 천재중의 천재입니다. 알파고는 바둑승률에 대한 역대 기보 데이터를 찾아 학습하고 바둑의 행렬위치 별 다양한 기보속에서 학습한 결과에 대한 승률을 계산하여 승률이 가장 높은 위치 값에 바둑알을 높는 방식을 구현하였다고 합니다. 그 구현 방식을 매우 어렵다고 알려지는데요. 실제 알고리즘도 알고리즘이지만 딥러닝의 핵심작업인 기보 데이터의 전처리 과정만 생각해봐도 굉장한 난이도의 준비작업이 이었다는 것을 알 수 있습니다.

 

이러한 기술이 더 발전하게 되면 사람들이 쓰는 우수한 문학작품들을 데이터화하여 더 뛰어난 작품을 만들 수 있다고 생각합니다. 그러한 시대가 오게 되면 예술가들도 딥러닝 기술을 필수적으로 배워야 할지도 모릅니다. 저 역시 늦지 않게 딥러닝 기술을 배워보고 싶은 소망이 있습니다.

반응형

댓글