부제 : 블록체인 기술을 활용한 데이터 원본 내역 추적 방법

Overview

안녕하세요. 디지털 비즈니스에 대한 글을 쓰는 허씨라고 합니다 🙂 본 문서에서는 세계적인 전기전자공학회 IEEE에서 발간된 논문을 간단히 살펴보면서, 블록체인 기술의 핵심적 가치인 “데이터 무결성”을 극대화시키는 솔루션의 제안 사례를 알아보고자 합니다.


블록체인에 대한 오해 : 코인을 위한 기술?

본문 내용에 앞서서, 블록체인에 대해 가장 먼저 짚고 넘어가야 할 부분은 “블록체인은 데이터를 기록 및 저장하는 단순 자료구조에 불과하며, 암호화폐 트레이딩을 위해 생겨난 기술이 아니다”라는 점입니다.

블록체인의 시초로 볼 수 있는 비트코인의 창시자는 “암호화폐 거래”가 필요해서 블록체인 기술을 제안했을까요? 전혀 아닙니다 ! 그렇다면 핵심적인 문제의식은 무엇일까요?

블록체인 기술의 핵심 문제의식 : 제 3자의 제거와 DB 조작 방지

비트코인의 창시자가 가졌던 문제 의식은 금융기관이 특정 화폐 거래의 신뢰성을 담보하지 말고, 거래 인프라 자체가 특정 거래의 신뢰성을 보장할 수 있게하자는 것이 핵심입니다. 그런데, 이러한 속성이 단순히 금융 데이터 등 정형화된 데이터 뿐만이 아니라 이미지, 영상 등의 비정형 데이터(물론 전처리 과정을 거쳐야겠지만)의 신뢰성까지도 담보해낼 수 있는 잠재력이 있던 것이죠. 잠시 비트코인 논문의 일부분을 살펴보실까요?

…”믿을 수 있는 제 3자가 이중지불을 방지해야 한다면 그 주요한 장점은 사라지게 된다. 우리는 이 논문에서 P2P 네트워크를 이용한 이중지불 문제의 해결 방법을 제안하고자 한다”

즉, 특정 거래의 유효성을 검증하는 제 3자가 필요없도록 P2P 전자장부 구조를 만들고, 해당 장부에서 데이터 조작(또는 이중 지불)이 발생하지 않게끔 만들기 위해 블록체인이라는 독특한 자료구조가 만들어진 것입니다.

본 문서의 영역은 아니지만, 블록체인의 기술적 원리로 인해 이미 완결된 블록 내의 데이터에 한해서는 시간이 지날수록 위변조 가능성이 기하급수적으로 증가합니다. 결과적으로 “데이터 무결성”이라는 가치를 도출해내면서 데이터 보안 기술로서 각광을 받게 된 것이죠.

Web 3.0과 데이터 프라이버시, 그리고 블록체인

현재 시대는 Web 2.0을 지나, Web 3.0 시대로 접어들고 있습니다. 글로벌 지식백과 Wiki는 Web 3.0 기술에 대해서 “컴퓨터 스스로가 웹페이지에 담긴 내용을 이해하고, 개인 맞춤형 정보를 제공할 수 있도록 하는 기술”이라고 정의하고 있습니다. 머신러닝 기술은 이러한 정의를 실제로 구현시킬 수 있는 대표적인 IT 기술인데요. 머신러닝 알고리즘을 학습시키려면 천문학적인 양의 데이터를 필요로 합니다.

이렇게, Web 3.0 시대에는 수많은 데이터들이 자유롭게 이동하고 학습되는 환경이라고 볼 수 있습니다. 그런데 만약, 이 데이터들이 개인에게 민감한 정보라면 어떻게 될까요? 제한없이 이러한 데이터들을 알고리즘이 학습하고 활용할 수 있게 해야할까요? 당연하지만 프라이버시 문제가 너무나도 많이 발생하게 됩니다. 이러한 맥락에서, 애플은 iOS 14부터 개별 유저의 디바이스마다 부여되는 광고 식별자(ADID) 데이터 추적을 아예 막는다고 선언하기도 했죠.


데이터 프라이버시 문제를 예방하는 블록체인 (IEEE)

이제 본론으로 들어가보도록 하겠습니다 ! SF 영화를 보면 누군가의 얼굴을 가짜로 흉내내는 기술을 가지고 가면을 만드는 모습을 본 적이 있으시죠? 요즘 각종 커뮤니티에서 유사한 내용으로 화두가 된 사진들이 있습니다.

뭔가 부자연스럽기도 하고, 자연스럽기도 하고 그렇지 않나요? 위 사진은 “브록레스너와 강호동이 바뀐 세계”라는 제목으로 한 커뮤니티에 올라온 게시물입니다. 어떻게 세계 최고의 레슬러와 강호동의 얼굴이 바뀔 수 있는 것일까요? 바로 Deepfake라는 얼굴 합성 서비스 덕분입니다. 오늘 살펴볼 논문의 내용과 관련이 있기도 합니다.

논문의 문제의식

Deepfake는 특정 인물의 얼굴 이미지 데이터를 딥러닝 알고리즘에 학습시킨 후, 동영상에 나오는 인물의 얼굴에 합성하는 기술인데요. 오늘 살펴볼 논문에서는 이 Deepfake와 유사한 기술들이 많아지면 이미지, 음성, 영상, 심지어 발자국까지도 인위적으로 조작될 수 있으며 어떤게 원본인지 모를 데이터가 현실에 많아질 수 있다고 경고합니다. 그 결과, 현실 세계에는 많은 혼란이 가중되고 원본 데이터의 수정 내역을 추적할 수 있는 기술이 필요할 것이라고 주장합니다. 그리고 이를 추적할 수 있는 핵심 기술로서 블록체인이 사용됩니다. 이제 논문의 내용을 살펴보도록 하겠습니다 !

블록체인의 기술적 도입 지점

논문의 필자인 Haya R. Hasan, Khaled Salah는 블록체인을 활용해 안전하고 신뢰가능한 방식으로, 그리고 제 3자의 개입이 없는 방식으로 특정 디지털 콘텐츠의 진실성을 보장하는 증명 방법을 서술합니다.

이들이 기존 솔루션들에 대해 가졌던 문제의식은 “특정 디지털 콘텐츠가 반복적으로 복제됐다고 하더라도, 그 기록을 신뢰성있게 추적할 수 있는 수단이 없다”는 점이었습니다. 따라서, 이들은 한 번 데이터가 기록되면 (이론적으로) 수정이 불가능한 이더리움 블록체인과 스마트 컨트랙트 기술을 사용해서 이러한 문제점을 해결하고자 합니다. 본 문서에서는 알고리즘의 로직을 세부적으로 다루기보다, 블록체인이 어디서 어떻게 사용되는지 전반적인 맥락을 살펴보도록 하겠습니다.

예시 서비스 아키텍처

본 논문에서 제안하는 서비스를 이루고 있는 구성 요소와 레이어는 아래와 같습니다.

  • 콘텐츠 레이어 : 특정 콘텐츠, 그리고 해당 콘텐츠와 관련된 메타 데이터
  • P2P 파일 스토리지 서버 레이어 (IPFS) : 해시값 기반의 데이터들을 머클 트리 구조로 저장하는 P2P 파일 저장 표준 시스템
    • 콘텐츠 레이어에서 받아오는 데이터들을 암호화하여 IPFS Hash로 저장

  • 블록체인 및 스마트 컨트랙트 레이어 : 특정 EOA에 식별자를 붙여주는 ENS(Ethereum Name Service), 스마트 컨트랙트 기능, 그리고 특정 콘텐츠의 사용 내역 데이터.
    • 스마트 컨트랙트의 경우, IPFS에서 해시화한 콘텐츠 데이터, 메타 데이터를 저장 및 제어할 때 사용됨

  • 그밖의 레이어 : 아티스트 평판 관련 DB 등

서비스 동작 원리

특정 애플리케이션에서 떠돌던 콘텐츠의 기록을 원본 콘텐츠까지 거슬러 올라가 추적할 수 있는 이유는 스마트 컨트랙트를 통해 블록체인에 트리 구조로 저장되는 콘텐츠 데이터 덕분입니다.

위 그림처럼, 모든 데이터는 부모 콘텐츠를 참조(포인트)하며 저장되고, 또 이 데이터는 자식 콘텐츠에 의해 참조되어 저장됩니다. 이 모든 로직은 스마트 컨트랙트 알고리즘에 의해 동작되며 해당 기록은 모두가 데이터를 확인할 수 있는 퍼블릭 블록체인에 그대로 저장됩니다.

위와 같은 구조를 통해, 1번 스마트 컨트랙트는 자신의 부모 콘텐츠인 2번 콘텐츠를 추적할 수 있게 되고, 2번 콘텐츠는 자신의 부모 콘텐츠인 3번 콘텐츠로 거슬러 올라가 추적할 수 있게 됩니다. 이것이 쭉 이어져 원본 콘텐츠인 5번 콘텐츠까지 확인할 수 있게 되고, 만약 확인할 수 없다면 해당 데이터는 신뢰할 수 없는 데이터로 확인됩니다. 이를 통해, 데이터의 신뢰성을 보증하는 제 3자 없이도 블록체인 레이어만으로 특정 디지털 콘텐츠의 원본 유무를 파악할 수 있게 됩니다.

이 연구의 핵심은 파생된 콘텐츠로부터 원본 콘텐츠까지 특정 유저로 하여금 자유롭게 추적할 수 있는 구조를 만들어보는 것입니다. 물론, 원본 데이터가 블록체인에 사전 저장되어 있어야하고, 각 추적 경로에 있는 콘텐츠가 삭제되지 않았다는 전제 하에 진행되어야 할 것 같습니다.

이외 Use Case : 금융 산업

서론에서 말씀드렸듯이, 블록체인은 본래 태생부터가 금융 인프라입니다. 그렇다면 금융 산업에서 어떻게 사용될 수 있는지 한 번 간략히 알아보도록 하겠습니다. 이더리움 블록체인을 활용해서 다양한 금융 솔루션을 연구개발하는 Consensys에 의하면, 블록체인으로 총 6가지 종류의 금융 솔루션을 만들 수 있습니다.

1. 자산 관리 (Asset Management)

유무형 자산, 복잡한 파생상품을 효율적으로 관리함에 있어 블록체인을 사용할 수 있습니다. 예를 들어, 부동산을 토큰화하여 특정 부동산을 최소 거래 단위로 쪼개어 유동화합니다. 이를 통해 효율적인 자산 유동화와 신속한 거래를 가능하게 합니다.

2. 자본 시장 (Capital Markets)

자본 시장에서 증권을 거래할때 사용되는 인프라 시스템은 다양한 원칙과 형식주의, 그리고 책임 하에 관리되면서 많은 비효율을 낳았습니다. 블록체인 기술을 활용하여 자본시장의 백엔드 비용을 최소화하고 자본시장 내 이해관계자들 간 신뢰를 효율적으로 담보할 수 있는 시스템을 만들 수 있습니다.

3. 탈중앙화 금융 (Decentralized Finance)

탈중앙화 금융 상품은 대출, 예금, 현물, 선물, 파생상품 등 수많은 종류가 있으며 사용 범위에 있어 국경이 없습니다. 이더리움 블록체인의 스마트 컨트랙트를 사용하면 전통적인 금융 상품들보다 더 많은 수익이 날 수 있는 금융상품을 만들 수 있습니다. 이를 통해 금융 보안 및 투명성은 더 강화되고 새로운 금융 거래의 표준을 만들 수 있습니다.

4. 국제 무역 및 거래 (Global Trade and Commerce)

블록체인은 무역 당사자간 무역 금융 시스템으로서 동작할 수 있고, 레거시 기술들을 빠르게 대체할 수 있습니다. 글로벌 유통망의 운영과 무역 금융을 관리하는 측면에서 다양한 이해관계자 간에 공통적으로 필요한 결재 서류와 LoC 등을 토큰화하여 관리한다면 효율성이 증대됩니다.

5. 결제 및 통화 (Payments and Money)

은행계좌가 존재하지 않는 사람들에 대한 결제/송금부터 소액 대출까지, 다양한 목적의 금융 거래를 지원할 수 있습니다.

콘텐츠 마케팅 대행 콘텐타

 

댓글 남기기