지난 1편에서는 센싱을 통한 정보 접근에 대해 논의했다. 이는 기계와 사람간의 소통에 대한 이야기이다.
이번에는 사람과 사람간의 소통에 기계가 어떻게 작용하는지에 대한 얘기를 해볼까 한다.
0
1. “통하였느냐? “
사람과 사람간의 소통은 음성전화 시대에서 문자 시대로 넘어오게 되었고, 카카오톡을 위시한 메신저 서비스가 활성화되면서 ‘대면’을 통한 ‘대화’가 점점 단절되고 있다. 바로 옆에 앉아있는 애인에게도 카톡 문자를 넣는 커플들, 아들과의 대화가 뜸해져서 문자 넣는 법을 배운 부모들, 청소년의 외계어를 이해하기 위해서 ‘그들만의 언어’를 따로(?) 공부해야하는 이 시대에 우리가 원하는 것은 ‘소통’이다.
때는 바야흐로 PC통신 시절이었다. 2400bps 모뎀은 실시간을 허용하지 않았으며 케텔은 항상 나에게 기다림의 미학을 깨우쳐주곤 했다. 56kbps 모뎀은 나에게 머그게임이라는 새로운 세상을 알려줬으며 ADSL은 나에게 새로운 친구를 소개해주기도 했다. 요즘은 어떤가 ‘카톡’이든 ‘라인’이든 즉답을 기본으로 한다. 물론 친하다면야 어느정도의 기다림은 예의로 봐줄 수 있다만 모바일이기 때문에 못봤다는 핑계는 그저 매를 버는 지름길일 뿐, 게다가 “빠름, 빠름, 빠름” LTE는 ‘랙’이라는 단어를 없애버렸다.
예전에 필자가 전화보다는 채팅을 즐겨했던 이유 중에 하나는 멀티태스킹이 가능했기 때문이다. 물론 지금도 마찬가지이다. 상대에게 말을 걸어놓고 답을 기다리면 되고 상대가 문자를 쳐도 다른 일을 보다가 답해도 되었다. 상대방이 나와 소통을 하는데에만 붙잡혀 있지 않도록 하는 배려이기도 하고 나 자신에게도 동일한 혜택을 돌려주는 것이다. 즉시 답을 안줘도 뭐라고 할 상황이 아니기 때문에…
카톡의 시대(?)에 와서 또 다른 부담감이 다가오고 있다. 애니팡을 하는가 아닌가로 친구의 갈림길에 놓일 수 있는 이 어처구니 없는 상황에 대해서 어떻게 설명해야 할까? 친분을 과시하기 위해서는 그들에게 하트를 보충해야하는 의무감이 생겼다.
이렇게 친근해진 문자는 하나의 데이터이다. 무의미한 일상적인 대화이지만 이러한 무한한 데이터가 모이면 어떤 의미있는 데이터가 생성이 된다. 어문학적으로는 시대의 언어가 반영되는 역사적인 기록물이 될 수 있고, 시대적인 언어, 즉 은어를 기계가 알 수 있도록 하기 위해 인공지능 알고리즘에 들어갈 back data로 사용될 수 있다. 즉 비정형 데이터 산물들이 분석을 통하여 정형의, 패턴의 데이터로 바뀌게 되는 것이다.
몇 달 전에 애플의 Siri와 삼성의 S-Voice의 성능(?) 비교에 대한 재미있는 글이 올라왔다.
기계의 소통이 얼마나 감성적이 될 수 있냐를 보여주는 단적인 예였으나, 사람들의 인식이 애플에 쏠리는 파급효과는 큰 것 같다.
필자도 S-Voice를 사용하면서 Siri에 대한 환상을 가질 수 밖에 없었다. 안드로이드 사용자의 태생적인 한계랄까.
제주도 여행을 가려는데, “제주도 날씨”를 했더니.. 몇 번을 인식 못하다가 날씨는 무조건 “매사추세츠 케임브리지 날씨”를 알려주는 미치고 팔짝 뛸 상황을 재연하곤 했다. 아직도 날씨는 무조건 케임브리지를 가리킨다. 게다가 음성인식을 하려면 계속 “하이 갤럭시”를 외쳐대야 하는 마케팅 기능(?)까지 있어서 지하철에서 사람들의 눈길을 받아야 하는 짜릿한 경험도 안겨주었다. 이 정도면 음성인식 기능에 있어서는 iPhone을 부러워할 수 밖에 없는 상황을 만들고 있고 삼성은 굳이 안 따라해도 되는 데 괜히 만들어서는 무덤을 파고 있다.
아무튼, Siri의 기술은 컴퓨터 저편 너머 아름다운 목소리의 콜센터 여직원(?)이 아닌 인공지능 서버가 놓여있다. 사용자의 위치와 행동패턴에 대한 데이터가 확보되어야 하고 이를 분석해야 한다. 대화를 하기 위해서 엄청나게 많은 case들을 수집하고 상황에 맞는 최적의 답을 해내기 위해서 데이터는 계속 쌓이고 분석해야 하는 것이다.
인공지능을 구성하는 기술은 패턴인식(pattern recognition), 자연어처리(natural language processing), 데이터 마이닝(data mining) 등 관련 기술 분야들이 제대로 융합이 되어야 한다. 인간과 같은 학습 능력을 기계를 통해 구현하기 위해서는 주어진 데이터를 분석하여 분석된 결과에서 학습 가능한 패턴이나 새로운 지식을 추출해서 기계가 학습하는 효과를 얻도록 하는 것이 필요하다. 수많은 데이터(빅데이터)의 출현으로 인해 점점 실현 가능성이 높아졌고, 병렬처리 기법을 이용한 접근 방법을 많이 사용하고 있다.
결국 우리와 대화하는 아리따운 목소리의 Siri는 2003년생 미국 DARPA가 개발한 Big Data 기반의 콜센터 여직원인 것이다.
0
2. “저장하였느냐? “
데이터에 대한 또다른 측면은 센싱에 의한 데이터이다.
항공기를 예로 들자면 항공기가 한 시간 비행하는 동안 수십만 개의 센서를 통하여 기체의 모든 부분의 공기의 속도부터 기내의 이산화 탄소의 양까지 다양한 데이터를 수집하게 된다. 각각의 센서들은 물리적 특성을 가진 독립적인 장치들이지만 실질적인 관심은 기내의 온도와 이산화탄소의 조합, 공기 압력과 속도와의 조합과 같은 센서 판독의 조합들에 있다. 많은 센서들의 조합은 개별 기기의 오류 내성과 특성에 따라 매우 복잡하고 다양하다. 이렇게 기체의 수십만 개의 센서로부터 얻어진 데이터 스트리밍을 빅 데이터라고 할 수 있다.
2개의 엔진을 가진 보잉737의 엔진에서 생성하는 정보는 30분에 10TB(테라바이트=1000기가바이트)의 데이터를 쏟아내고 있다. 뉴욕에서 LA로 가는 6시간동안 발생하는 데이터는 240TB이고 미국의 28537편의 비행기들이 하루에 발생하는 데이터는 1,141,480 TB, 즉 1.1 EB(엑사바이트=1,000,000 TB) 이다.
정말 엄청난 규모의 데이터들이 아닐 수 없다. 또 하나의 빅데이터의 산물인 우리 몸을 살펴보자. 몸은 어떤 형태로든 우리 몸이 아프다는 것을 표시하고 있다고 한다. 다만 우리들이 알든 모르든 무심코 지나치고 있을 뿐이다.
‘느낌’이라는 것이 그것이다. 왠지 오늘 일진이 안 좋을 것 같다는 느낌이 들때 거의 100% 몸이 아파오기 시작한다. 그러한 몸이 알려주고 있는 신호를 좀 더 명확하게 알아낼 방법은 없을까? 다양한 센서들이 개발되고 있고 실시간으로 데이터들을 계속 받아오기 시작하면 우리 몸에서만 하루에 나올 수 있는 데이터는 비행기의 Big data보다 더 많은 양을 쏟아낼 것이다. 뇌파, 심박, 체온, 안구 운동, 근육 운동 등등 오장육부의 데이터들까지 나선다면 과연 클라우드 저장공간이 충분할 수 있을런지.
일단 데이터들은 기계에 의해 쌓였다. 그럼 의사와 나의 대화를 살펴보자.
의사: “3개월 전보다 심박이 평균 0.87초 정도 빨라진 것 같습니다. 큰 차이는 아니지만 심혈관 계통에 이상이 있는지 정밀 진단이 필요한 것 같아서 웨어러블 센싱 셔츠를 보내드렸습니다. 빨아도 되니 자유롭게 입고 다니시고 매일 데이터 업데이트 잊지 마시기 바랍니다.”
나: “네.” (난 Cool 하다. 시키는대로 잘한다.)
화상전화를 통하니 병원에 가서 몇 시간 기다리면서 시간낭비할 필요는 없다. 상담비는 통화요금으로 퉁쳤다. 내가 데이터 업데이트 안해주면 의사는 법적으로 패널티를 먹게되니 열심히 나의 주치의로써 챙겨주고 있다. 의료보험이 좋긴 하다. (가상 시나리오이니 오해 마시길)
평소의 나의 신체리듬을 계속 저장하고 있다가 아플 때와 비교해보자. 의사는 미세한 변화를 알아차리지 못해도 빅데이터 분석은 새로운 차이점을 발견해낼 것이다. 의사는 그러한 빅데이터를 활용하여 좀 더 정확한 진단을 할 수 있다. 혹시나 Big data 기반의 진단 의학 박사가 나올지도 모르겠다.
미국 정부는 건강, 의료 빅데이터 분석 및 활용을 통해 350조원의 직간접 비용 개선 효과를 예상하고 있다. 국내는 아직 걸음마 단계이지만 병원들 간에 심전도 Big data를 공유하는 움직임도 일어나고 있다.
쌓아놓기만 하는 데이터는 아무짝에 쓸모가 없다. 모아서 좀 더 의미있는 데이터를 만드는 것이 우선시 되어야 한다. 물론 그 이전에 개인 정보에 대한 보호 정책도 마련되어야 할 것이다. 병원들이 소극적인 이유 중의 하나는 개인들의 데이터가 자신만의 고객이라는 생각과 그 데이터를 남주기 싫고 남 좋은 일 하기 싫어하는 그들만의 리그 때문일 것이다.
내 개인의 의료데이터의 주인은 나인데도 불구하고 우리는 병원에 돈을 줘서 그 데이터를 얻어써야 하는 형편이다. 그리고 그 데이터는 그들이 활용하고 그걸로 다시 그들은 돈을 벌고 있다. 내가 돈을 내고 측정을 했는데 내 마음대로 쓰지 못하는 것은 어떤 상황인가. 우리는 이런 상황을 깨뜨리고자 한다. 그래서 필자는 의료 데이터를 직접 소셜을 통해 생성시키려는 시도를 하고 있다.
그것이 소셜의 힘이 아닐까? 소셜에서 친한 의사 몇 명은 만들어야 할 것 같다. 하다못해 의학논문지에 논문이라도 같이 쓰려면.
의료 영역 외에도 이러한 움직임, 기존의 패러다임을 깨트리는 움직임은 계속 될 것이다. 이미 정치권은 진행되는 듯 보인다.
정보를 쥐고 있는 것이 권력이 아니라 정보는 흘러야 한다는 것을 깨우쳐주어야 한다.
그것이 스마트폰이 우리에게 새롭게 제시해 준 ‘미래의 길’의 모습이다.