공상 과학 영화들을 보다보면 언젠가는 정말 로봇과 인공 지능에 지구가 정복될지도 모른다는 공포심이 들기도 한다.  하지만 스카이넷이 터미네이터를 보내 인간을 죽이려 한다거나, 인류 전체를 배터리로 이용하거나 하는 시나리오는 영화적인 상상력이다. 다가올 디스토피아적인 미래는 영화처럼 대규모의 전쟁같은 것이 아니다.  로봇은 인간의 목숨을 노리지 않는다.  대신 우리의 일자리를 뺏어간다.

특히 요즘 추세를 보면 작가나 기자와 같이 글쓰기를 업으로 삼는 사람들이 조금 위험해 보인다. 글쟁이 전문 암살 로봇이 생겼다는 말이 아니다. 고도로 진화된 기술을 탑재한 ‘로봇 기자’들이 작가들의 밥그릇을 노리고 있다.

산업혁명 이후 잇따른 기술의 발전으로 많은 직업들이 과거의 추억으로 스러졌지만 창작 분야는 감히 기계가 넘보지 못하는 철옹성이었다. 하지만 현대 기술의 발전은 그 철옹성마저 무너뜨리는 듯 하다.  자연어 생성 기술 (natural language generation, NLG) 로 무장한 기업들이 마치 사람이 쓴 듯한 글을 작성하는 소프트웨어를 개발해낸 것.

지난 3월 뉴욕타임즈에는 ‘만약 컴퓨터 알고리즘이 이 글을 썼다고 해도, 당신이 이를 알아볼 수나 있나요?’ 라는 다소 건방진 제목의 사설이 실렸다. 실제로 Automated Insights 라는 회사의 소프트웨어 워드스미스 (Wordsmith)는 AP통신과 야후 등의 대형 클라이언트들을 위해 작년에만 10억 편 이상의 글을 작성했다. 비록 글의 내용은 분기별 기업보고서나 판타지 풋볼 (미국의 풋볼팀을 골라 가상의 리그를 즐기는 게임) 분석과 같은 딱딱하면서도 데이터 분석을 요하는 종류가 대부분이었지만, 그래도 놀랄 만한 숫자인 건 사실이다. 타임스지는 8개의 문단 중 사람이 쓴 것과 컴퓨터가 쓴 것을 구분하는 퀴즈를 내놓았는데 결과는 그 둘을 구분하는 것이 쉽지 않다는 것을 보여주었다.

그렇다면 이제 기자들은 전부 새로운 일거리를 찾아야 될까? 해답은 그리 간단하지 않다.

글을 작성하는 대부분의 알고리즘은 우선 방대한 양의 자료를 수집한 후 의미 있는 통계나 수치를 분석해 이를 바탕으로 이야기를 작성하는 과정을 거친다. 스포츠 경기 승부나 기업의 재무 보고서, 기후 관련 정보가 현재로선 주 대상이다.   간단하게 말하면  이렇게 이야기할 수 있지만 실제로 컴퓨터는 엄청나게 복잡한 과정을 거쳐 한 편의 글을 내놓는다. 수백 개의 데이터를 분석하고 과거 자료에 기초해 미래를 예견하거나 상관 관계를 밝혀내는데, 아직은 추가적인 조사 혹은 의견을 제시하거나 누군가의 인터뷰를 인용하는 둥 데이터가 데이터 분석의 틀을 벗어난 행동은 하지 못한다.

다시 말해 NLG 기술은 대단한 위력을 지녔지만 아직은 사람의 도움이 필요한 상태다.

 

로봇기자

좌측부터 Narrative Science의 크리스티안 하몬드, 래리 번바움, 스튜어트 프랑켈
출처: And the Pulitzer Goes to... a Computer

 

Contently 와의 인터뷰에서 Narrative Science의 공동 창립자인 크리스티안 하몬드는  “우리의 정보의 바다에 살고 있고, 그 자료들은 모두 분석할 가치가 있습니다.”  라고 말한다. “자료를 분석해 얻는 결론은 글을 창작하는 바탕이 되죠.”

2010년에 창업한 Narrative Science는 포브스지, 크레딧 스위스, 딜로이트 등의 거물급 고객에게 글을 써주고 총 3천만 달러에 육박하는 투자금을 안겨준 슈퍼스타 ‘퀼’ 덕분에 단박에 NLG 기술의 선두주자 대열에 합류했다. 데이터에 절대적으로 의존하면서 길이가 짤막하고 간결한 투자 보고서를 발행하는 금융계에서 ‘퀼’을 비롯한 경쟁 로봇들은 큰 관심거리다.  활용되는 범위도 다양하다. 포브스지는 로봇이 작성한 투자 보고서를 뉴스 사이트에 게재하지만 크레딧 스위스는 내부적 자료를 만들기 위해 NLG 기술을 이용한다.

퀼이 NLG 계의 T-1000 으로 발돋움하기 이전, 당시 노스웨스턴 대학에서 함께 근무한 동료 교수이자 향후 Narrative Science를 공동 창립한 하몬드와 래리 번바움 (현 Narrative Science의 수석 과학 고문)은 지나간 야구 게임의 결과를 알려주는 스탯츠몽키 (StatsMonkey)라는 프로그램을 제작했다. 스포츠 분야에서 NLG 기술이 요긴하게 쓰이는 것을 확인한 그들은 곧장 다른 분야로의 확장을 꿈꾸기 시작했다. 스포츠처럼 데이터 의존도가 높은 재무 분야에 응용하기 시작한 것.

 

로봇기자

T-1000

 

Narrative Science의 성공은 데이터 저널리즘 (공개된 데이터베이스를 수집하고 분석해 보도하는 저널리즘) 의 태동과 같은 시대에 이루어졌다. Vox, FiveThirtyEight, The Upshot (뉴욕 타임즈가 운영하는 블로그) 등의 매체는 자체적으로 높은 수준의 통계 분석 글을 게재함으로써 전통적인 기사 형태를 탈피했다. 특종을 내는 경우 다른 언론사가 그 뉴스를 베끼기 전까지 몇 분간의 유명세를 누리긴 하지만, 기사 베끼기가 너무나 빨리 일어나는 요즘 특종은 큰 의미가 없어졌다.  대신 깊이 있는 분석이 담긴 콘텐츠가 장기적으로 더 주목을 받는다는 것을 깨달았다.  기업들도 이런 현상에 주목한다.   Contently 의 데이터로 멋진 콘텐츠를 만들어내는 5개의 기업 ( 5 Companies Creating Dynamic Content With Their Own Data ) 에 소개된 회사들은  더 이상 언론사에 의지하지 않고 자체적으로 전담 부서를 구성해 보유하고 있는 데이터를 분석하여 흥미로운 콘텐츠를 제작하고 있다. 이 기사에 소개된 Zillow 는 부동산 중개 회사인데 부동산 가격, 인구 통계 데이터를 분석하여 ” 사랑하기 좋은 10 개의 도시 ” 같은 재미있는 콘텐츠를 만든다.

Contently 의 기사를 인용하면, “ 퀼의 작업은 반복적입니다. 글을 쓰고 고객의 피드백을 받고 피드백에 기초하여 시스템을 수정하는 과정을 계속 반복하죠.  고객의 입장에서는  작가를 고용한 것이나 별반 차이를 느끼지 못합니다.” 하몬드가 퀼의 서비스 과정에 대해 설명하며 말했다. “마치 새로운 직원을 한 명 고용한 듯한 느낌이 들 거예요. 그리고 사실입니다. 단지 그 ‘직원’이 사람이 아니라 기계일 뿐이죠.”

기업의 입장에서는 인건비를 줄여주는 로봇 기술이 환영할 만하지만, 작가들의 심경은 조금 더 복잡하다. 스포츠 경기의 결과나 기초적인 재정보고서 따위의 글은 너무 간단해 사람이 쓸 필요가 없다는 것이  로봇기자를 찬성하는 주장이지만, 이런 간단한 일부터 시작해 위로 올라가는 입문 작가들에겐 이미 어려운 취직의 관문을 더 좁히기만 한다고도 볼 수 있다.

독자들은 어떻게 받아들일까 ?  알고리즘이 정말 고도로 발달해서 사람보다 더 훌륭한 글을 작성할 수 있게 되었다고 치자.  그 글의 상단에  ‘ 저자 :  로봇 ’ 이라고 이름이 붙어 있을 경우,  독자들이 그 글을 진지하게 읽을까 아니면 읽는다 하더라도 그 글의 책임성을 컴퓨터에게 돌릴 것인가, 아니면 출판사에 돌릴 것인가?

이 철학적인 질문에 대한 답변은 아직 모호하다. 하몬드는 이에 대해 이렇게 대답한다. “ 이 기술은 절대적인 객관성을 보장합니다. 일단 프로그래밍 되고 나면 절대로 사견이나 선입견이 들어가지 못하고 거짓말을 하지 못합니다. 그리고 저널리즘에서 이는 정말 중요한 요소입니다. 처음 로봇 기자의 글을 읽을 때에는 놀라움이 앞설 수 있지만, 차차 읽다보면 ‘와, 글 정말 괜찮은데?’ 하는 감탄을 터뜨리게 될 겁니다.”

2014년 스웨덴의 칼스타드 대학에서는 알고리즘과 사람이 작성한 콘텐츠 사이의 차이를 측정하는 연구를 진행했다. 46명의 학부 학생을 상대로 웹에 실린 기사를 보여주고 기사의 수준을 평가하는 실험이었다.  결과적으로는 로봇이 작성한 콘텐츠가 신뢰성과 정확도 측면에서 앞섰다.  기자에 의해 작성된 기사는 글 솜씨에서 더 높은 평가를 받았지만 정보 전달, 객관성, 신뢰성 등의 항목에서 로봇에 의해 작성된 기사가 더 높은 점수를 받았다. 앞서 언급했던 뉴욕 타임즈의 퀴즈 (8개의 콘텐츠를 보고 저자가 사람인지 기계인지 알아맞히는)에서는 3분의 1가량이 알고리즘이 작성한 콘텐츠를 사람이 썼다고 생각했다.

“우리의 기계는 제2의 해리포터를 쓰는 것이 아닙니다. 그저 당신의 주식이 어떻게 돌아가고 있나를 알기 쉽게 보고할 뿐이죠.” 하몬드는 퀼에 대해 이렇게 말한다. “아니면 당신 집 앞의 해변 물 상태가 어떤지에 대해서요. 관심 있는 스포츠 경기에 대해서도 알려줍니다. 물론 가장 좋은 점은 이 모든 보고서에 절대로 잘못된 정보나 편견이 들어가지 않는다는 겁니다.”

하지만 이에 대한 반론도 있다.  미디어 오늘에 게재된 기사에서 서울대의 이준환 교수는 알고리즘 저널리즘이 여론을 조작할 수 있다고 말한다.  이준환 교수 팀은 로봇 저널리즘 기술로 온라인 상에서 스포츠, 주식 관련 뉴스를 제공하고 있다.  이준환 교수는 “우리는 모든 정보에 노출되지 않는다. 필터링된 정보를 소비하며 살고 있다. 정보제공자는 페이스북‧구글‧네이버 같은 곳이다. 과연 그들에게 의도가 없을까”라고 의문을 제기한 뒤 “내가 소비하는 정보가 완결한 것인지 의문을 가져야 한다”고 강조했다.

오늘날 언론의 당파성은 반드시 지양해야 될 부분만은 아니라고 평가된다. 이미 상당수의 언론사들은 딱딱한 뉴스 보도 대신 개성 있는 말투로 사설을 게재하는 블로그 페르소나를 가지고 있다.  무당파성, 객관성, 중립성보다 이 편이 충성 독자들과의 관계를 강화하고 구독자수를 확보하는 데 더 효과적이라는  판단 하에 내린 결정이다.

사실 선입견 없는 객관적이고 정확한 콘텐츠 작성은 오히려 뉴스보다 콘텐츠 마케팅에 더 필요할지도 모른다.  브랜드가 제공하는 정보가 투명하고 객관적일수록 그 브랜드의 콘텐츠와 브랜드 자체에 대한 소비자의 신뢰가 올라갈 것이기 때문이다.  특히 적은 인력으로 방대한 양의 자료를 분석해내는 금융이나 보험 업계에서  NLG 기술은 사람이 하는 일을 대신하는 것이 아니라 기초 자료를 정확히 분석하여 사람이 하는 일을 보충함으로써 콘텐츠의 수준을 크게 높일 수 있을 것이다.

미래에 NLG 기술이 얼마나 발전할지는 아무도 모른다. 하지만 단 하나 반드시 기억해야 될 것은, 어느 분야에 이 기술이 적용되든지 항상 그 핵심에는 질문을 던지는 사람이 필요하다는 점이다.

알고리즘은 우리가 던지는 질문에 대해 정확하고 객관적인 답을 내어 놓을 수 있을 것이다.  수십 명의 사람이 노력한 것보다 더 깊이 있는 분석을 더 짧은 시간에 내어 놓게 될 것이다.  하지만 그 중심에는 어떤 질문을 던질 것인가를 고민하는 사람이 있다. 가치 있는 질문, 지금 필요한 질문을 던지는 사람, 그 사람과 알고리즘의 협업이 아마도 미래의 저널리즘, 콘텐츠 마케팅의 모습이 아닐까 ?

 

참조 문헌 :

Contently : Are Robot Writers Really About to Take Over the World?

WIRED : Robots have mastered news writing. Goodbye journalism

New York Times : If an Algorithm Wrote This, How Would You Even Know?

 

2주에 한번 최신 콘텐츠 마케팅 뉴스를 이메일로 받아 보세요

 

 

Leave a reply