Home 킹덤라이프 킹덤라이프 SNS 인공지능은 무엇을 먹고 사는가?
인공지능은 무엇을 먹고 사는가?

인공지능은 무엇을 먹고 사는가?

207
0

KINGDOM LIFE & SNS
IT/Mobile

 

서울도시가스(주) 사업개발 팀장 박준환


 

지금은 참으로 많은 정보들을 시공간을 초월해서 접할 수 있는 시대입니다. 손 안에 있는 스마트폰으로 전 세계의 과거부터 현재까지의 모든 정보를 검색할 수 있기에 그렇습니다. 철기문명이 가져온 농업혁명, 증기기관이 가져온 산업혁명을 거쳐서 지금은 컴퓨터 기술을 통해 정보의 혁명을 누리는 시대입니다.

땅은 농업시대의 원재료다. 철은 산업시대의 원재료다. 이제 정보(인포메이션)시대의 원재료는 ‘데이터’다. Alec Ross(미 국무부 혁신담당 수석보좌관)

정보와 데이터

그럼 정보는 무엇이고 데이터는 어떤 것일까요? ‘정보’의 사전적 의미는 관찰이나 측정을 통하여 수집한 자료를 실제 문제에 도움이 될 수 있도록 정리한 지식 또는 그 자료이고, ‘데이터’의 사전적 의미는 관찰이나 실험, 조사로 얻은 사실이나 정보 또는 컴퓨터가 처리할 수 있는 문자, 숫자, 소리, 그림 따위의 형태로 된 정보입니다. 쉽게 이야기해서 정보는 가치 있는 무엇이고, 데이터는 그 가치를 형성하는 기초자료입니다. 날씨를 예로 들어보면 시간대별 온도와 습도를 측정해서 나온 자료는 데이터이고, 이를 통해 스트레스 및 빨래 지수 등을 도출했으면 정보(information)가 됩니다. 정보의 수준이 되었을 때 비로소 의사결정에 도움을 줄 수 있는 것입니다.

IT(Information Technology)는 정보기술입니다. IT/모바일 분야가 이 세상에 가치를 주기 위해서는 데이터만 보여주는 것에 그쳐서는 안 됩니다. 데이터만으로는 아무 의미가 없습니다. 그 데이터를 가지고 의미 있는 분석과 함께 현실 문제에 대한 해결방법을 제시하는 것이 올바른 방향입니다. 그럼에도 불구하고 데이터는 정보 도출의 기초자료가 되기에 중요합니다. 수십 년에 걸쳐 발전해온 인공지능 기술이 지금에 와서 빛을 발하는 이유도 기존에는 수집하기 어려웠던 다양한 데이터들을 빠르고 대량으로 확보할 수 있게 되었기 때문입니다.

2016_09_sns_%eb%82%b4%ec%9a%a9_1

[그림 1] 비즈니스 SNS 서비스 링크드인(Linkedin)]

지난 6월에 IT 거대기업 마이크로소프트(MS)는 비즈니스 SNS 서비스 업체인 링크드인(Linkedin)을 262억 달러(한화로 31조원) 규모로 인수한다고 발표했습니다. 이 규모는 주식시장가치(시가총액 기준)만 놓고 봤을 때 현대자동차보다 조금 낮고, 롯데그룹보다 높은 수준입니다. 종업원 약 만 명에 매출이 3조가 조금 넘는 회사를 왜 이토록 높은 가치로 인수하려 할까요? 그 이면에는 1억3천만 명의 인사정보 관련(개인의 커리어 정보) 데이터가 있습니다. [그림1]

 

빅데이터(Big Data)

사실 우리가 영화에서 보았던 스스로 생각해서 판단하는, 다시 말해 자아(自我)가 있는 인공지능을 ‘강인공지능(Strong AI)’이라 하는데 아직 초기 연구단계에 있습니다. 지구상의 모든 정보들은 컴퓨터로 수치화할 수 없는 것들이 여전히 많고, 사람간의 대화를 100% 이해하는데 한계점이 많기 때문에 인공적인 자아는 만들 수 없다는 학자도 있습니다. 하지만 50년 이내에 강인공지능이 등장할 것을 예측하는 전문가들은 점차 늘어나는 추세입니다.

지구상에 있는 가장 발전된 인공지능 역시 이미 짜여진 명령체계 안에서 정보의 규칙성을 찾아서 문제를 해결하는 수준입니다. 이를 ‘약인공지능(Weak AI)’이라 합니다. 쉽게 얘기해서 스스로 생각하거나 감각이나 정서를 느끼진 못하지만 빠른 두뇌회전력으로 쉼 없이 방대한 자료들을 공부하여 어떤 문제든지 풀어내는 척척박사를 생각하면 됩니다.[그림 2]

 

빅데이터(Big Data)

다시 인공지능 이야기를 좀 하려 합니다. 지난 3월 인공지능 알파고와 이세돌의 바둑 대국과 관련하여, 알파고는 프로기사들의 바둑 기보 약 3천만건을 스터디한 것으로 알려져 있습니다. 이 세상에 존재하는 다양한 바둑 기보 데이터를 입력해두면, 어떠한 상황에서도 가장 높은 승률의 수를 둘 수 있다는 것이 핵심입니다. 데이터가 늘어날수록 정답을 맞힐 수 있는 확률이 늘어나고 그만큼 다양한 경우의 수에 대처할 수 있습니다. 우리는 그 개념을 정확히 이해하지 못하더라도 ‘빅데이터(big data)’란 개념이 그 뜻처럼 큰 데이터 집합을 다룰 것이란 예측을 할 수 있습니다.

빅데이터의 특징을 세 가지로 본다면 첫째, 저장된 데이터의 크기는 고성능 컴퓨터 몇 대에서 처리할 수 있는 수준을 넘어갈 만큼 큰 용량을 말합니다. 대략 수십 테라바이트(terabyte, 흔히 말하는 기가바이트 용량의 천배)나 페타바이트(petabyte, 기가바이트의 백만 배) 크기를 말하며, 이를 처리하기 위해서는 여러 대의 대용량 처리 컴퓨터의 저장소와 연산장치, 네트웍을 하나처럼 연결하는 분산처리 구성이 필요합니다.

둘째, 데이터를 모으고 분석하고 보여주는 과정이 실시간으로 이루어지도록 빠르게 처리되어야 합니다. 예를 들면 SNS에서 호주 여행을 간 사진을 올리게 된다면 이에 대한 내용(글, 사진, 동영상)을 바로 파악하여 여행과 관련된 정보들(해당 지역정보, 여행상품, 이웃의 비슷한 사진들)을 보여주는 것이 빅데이터 기술입니다.

셋째, 다양한 종류의 데이터들이 빅데이터를 구성합니다. 문서, 그림, 영상, 음성 등 기록 가능한 모든 것은 데이터로 저장이 가능합니다. 종래에는 정해진 틀(데이터셋) 안에 입력된 정보들(문자 혹은 숫자)로 데이터를 관리하였으나(정형 데이터, structured data), 빅데이터 시대에는 활동의 모든 것들이 데이터가 될 수 있습니다(비정형 데이터, unstructured data).
지금도 끊임없이 데이터들은 인터넷 세상에 유입되고 있습니다. 하루에 생성되는 데이터의 양이 지난 5천 년간의 데이터 양과 비슷하다고 하니 상상을 할 수 없는 규모의 증가세입니다.[그림2. 데이터의 증가 규모]

2016_09_sns_%eb%82%b4%ec%9a%a9_2

 

좋은 데이터, 나쁜 데이터(Big Data)

인공지능에서 데이터의 좋고 나쁨의 기준을 둘 수는 없습니다. 결국 데이터를 설계하고 사용하려는 사람이 의도한 바대로 데이터가 수집되었는가가 데이터의 좋고 나쁨을 가르는 것입니다. 왜냐하면 인공지능은 데이터라는 기반에서 판단하고 결과를 도출하기에 데이터들이 일방적인 성향의 것들로만 구성된다면 결과 또한 그렇게 나올 가능성이 높기 때문입니다. 콩 심은데 콩 나고 팥 심은데 팥 난다는 말입니다. 실제로 자동으로 대화하는 인공지능 채팅 서비스를 오픈했다가 사용자들이 비속어나 욕으로 많이 대화하자 인공지능 역시 욕설로 채팅을 하게 되는 바람에 서비스를 닫은 사례가 있습니다. 인터넷 세상에서 데이터를 조작하거나 특정 부분만 강조하여 정보를 왜곡하거나 여론을 부정적으로 형성하는 사례도 보게 됩니다. 농경시대에는 땅을 가진 자가 패권을 가졌다면, 인공지능이 도래한 정보시대에는 데이터를 가진 자가 이 세상에 영향력을 발휘할 수 있습니다.

좋은 데이터는 데이터를 제대로 다룰 줄 아는(전체적인 흐름을 보는 안목) 머리, 그리고 이를 제대로 활용할 수 있는 사고체계, 제대로 된 분석 결과를 도출하는 계산식(알고리즘)이 중요한데 이것은 사람의 영역에 속합니다. 하나님께서 우리를 그분의 뜻에 따라 창조하셨듯이, 사람이 그 필요성에 의해 인공지능을 만들어낸 것입니다. 인공지능이 기계학습(머신러닝)을 통해 사람이 원하는 데이터를 제대로 분석하기 위해서는 사람의 손길(휴먼 터치)이 필요합니다. 그것은 우리가 육신과 혼의 기반을 갖추고 있어도 그리스도 안에서 온전해지기 위해서는 성령님의 만지심(헤븐리 터치)이 필요한 것과 같은 원리입니다.

 

말씀과 데이터

성경 속에서도 데이터 분석과 관련된 일화는 다양하게 볼 수 있습니다. 그 중 대표적인 사례로 가나안 정탐을 들 수 있습니다(민수기 13장). 모세가 이스라엘의 열두지파의 지휘관 한명씩을 가나안 땅을 정탐하러 보냈을 때, 그들은 모두 그 땅이 젖과 꿀이 흐르는 땅이라 보고했습니다. 여기까지는 데이터를 제대로 보고 일치된 정보들을 가져왔던 것이지요. 그러나 그곳의 거주민에 대한 정보를 분석했을 때는 여호수아와 갈렙 만이 전쟁의 승리를 예상했습니다.

 

갈렙이 모세 앞에서 백성을 조용하게 하고 이르되 우리가 곧 올라가서 그 땅을 취하자 능히 이기리라 하나 그와 함께 올라갔던
사람들은 이르되 우리는 능히 올라가서 그 백성을 치지 못하리라 그들은 우리보다 강하니라 하고 민13:30-31

 

이스라엘의 열두지파 정탐꾼들은 가나안 족속의 신장(체구) 데이터와 이스라엘의 것을 비교하여본 후 그들의 힘이 더 셀 것으로 판단하였습니다. 이것은 세상적인 이치로 봤을 때는 합리적인 분석결과일 수 있습니다. 하지만 여호수아와 갈렙은 눈에 보이는 데이터를 넘어서 진리의 말씀에서 우선적으로 답을 찾았습니다. 하나님께서 광야의 시절을 거쳐서 예비하신 가나안 땅으로 인도하시리라는 언약의 말씀을 우선적으로 취하였던 것입니다.
아침에 하늘이 붉고 흐리면 오늘은 날이 궂겠다 하나니 너희가 날씨는 분별할 줄 알면서 시대의 표적은 분별할 수 없느냐 마16:3

 

데이터를 보면 당장에 일어날 것들에 대한 예측은 비교적 쉽게 할 수 있습니다. 그러나 시대의 흐름을 따라 세대를 넘어서 미래를 예측하는 일은 데이터를 넘어선 영적인 영역입니다. 삶의 상당부분은 칼로 무 자르듯이 Yes나 No, 혹은 0 또는 1처럼 나누기 어려움을 잘 압니다. 인공지능도, 데이터라는 것도 이를 통해 행동의 방향을 결정하는것은 인간의 몫입니다.

비즈니스 영역에서는 ‘운칠기삼(運七技三)’이란 말을 많이 합니다. 성공을 10으로 봤을 때 개인의 능력은 3 밖에 되지 않으며 나머지는 운(기회)으로보는 것입니다. 데이터에 기반한 비즈니스는 상황에 따라 성공 가능성이 높은 방법을 추천해줄 수는 있으나, 그 결과는 삶에 대한 태도와 주위 환경 그리고 사람 등 데이터를 넘어선 영역의 변수에의해 결정되고 있는 것입니다. 하나님의 자녀들에게는 하나님나라의 정체성 확립을 통해 성령님의 인도하심으로 나아가는 것이 진리의 방법입니다.

한쪽으로 치우치지 않는 데이터를 종합적으로 분석하는 것이 중요하듯 말씀도 그러합니다. 구약(율법)과 신약(복음)의 데이터가 종합될 때에 비로소 성령님을 통해 그 말씀이 우리에게 풀어지는
것입니다. 하나님은 나와 관련된 모든 데이터를 세밀하게 아시고 만지시는 분입니다. 세상의 흐름에 당신의 데이터가 변화하더라도 그 키를 주님께 맡겨나가는 자녀의 삶을 사시길 축복합니다.