2024-08-02
THINKFORBL COLUMN SERIES
데이터센터 건립 의미 더 잘 살리려면
정보통신신문
최근 공공기관에서 발주하는 데이터 품질 관리 사업이 부쩍 많이 진행되고 있다. 현재의 인공지능(AI) 산업에서는, 더욱 다양한 데이터를 기술적으로 정제해 고품질로 유지하는 일이 가장 중요하기 때문이다. 더구나 정부와 민간이 엄청난 돈을 들여 더 많은 데이터센터 건립에 사활을 걸고 있는 상황인데, 여기서 품질 관리가 제대로 되지 않는다면 자원 낭비가 심각해진다. 일반건축물 대비 40에서 100배까지 에너지를 잡아먹는 데이터센터 시설이, 무의미한 데이터로 가득한 '데이터 난지도'가 될 수기 때문이다.
지금이라도 데이터센터 건립과 '오타 찾기' 품질 관리에 들이는 비용 일부라도 들여서, 데이터의 의미적 다양성을 확보하는 기술 개발에 투자해야 할 것이다. 그렇지 않으면 인공지능의 신뢰성 문제는 본질적으로 해결되지 않을 것이고, 우리가 범세계적 경쟁에서 한발 앞서나갈 길도 요원해진다. 열정의 민족인 우리는, '인공지능 강국'을 향한 구호를 외치며 솟아날 수 있는 간절함은 이미 충분히 가슴 속에 품고 있다. 중요한 것은 그 열의가 실제 성과를 낼 수 있게 만드는 구체적 방법이고, 이 업계에서는 그것이 기술적, 공학적으로 정리되어야 한다. 인공지능의 신뢰성 검증을 포함하는 데이터 품질의 공학적 표준 제정에 그야말로 나라의 미래가 걸려 있음을 인식하고, 관련된 이들의 인식 개선과 선제적 대응을 기대해 본다.
[출처]
따라서 지금 데이터 품질 관리에 집중하는 것은 옳은 혜안이다. 그러나 목적지를 올바르게 잡았더라도, 그곳에 닿기 위한 경로가 올바른지는 또 다른 문제이다. 현재의 데이터 품질 기준은 '무결성(적합한가)', '정확성(오타가 없는가)', '일관성(타 데이터 대비 너무 이질적이지 않은가)'을 측정하는 정도에 머물러 있다. 그런데 정작 유럽 정치권이 거의 경기를 일으키듯 강력한 규제법을 내놓게 만드는 인공지능의 '윤리적 오작동' 문제들은 따로 있다. EU의 규제와 그것이 의미하는 국제적 흐름에 부합하려면 확보된 데이터의 균형, 충분성, 다양성 등까지 진단되어야 한다. 그렇지 않고 단순히 '오타 찾기'에 몰입하는 것은, 인공지능 신뢰성 달성에는 도움도 되지 않을뿐더러, 사용자와 판매자, 개발자를 궁지에 빠뜨릴 윤리적 문제가 발생할 수 있다. 아니, 그럴 가능성이 큰 제품의 시판 자체를 막겠다는 것이 최근 규제의 골자이다.
관련 담당자들의 고충도 이해가 간다. 데이터의 균형, 다양성 등은 아직 정확한 측정 기술이 완성되어 있지 않은 상황이다. 반면에 무결성, 정확성 등은 상대적으로 측정이 용이하기에, 결과적으로 큰 도움이 되지 않더라도 그 부분의 품질 관리에 집중하겠다는 것이다. 마치 미적분을 공부하는 방법을 찾지 못한 학생이 일단 할 줄 아는 덧셈, 곱셈에 집중하는 격이다. 비정형 데이터의 품질을 다루는 국제 표준 ISO/IEC 5259-2에서도 균형, 유사성, 다양성을 정의하고 있지만 정작 어떻게 측정해야 하는지의 방법까지는 제시하지 않는다. 같은 반에 미적분 공부법을 아는 친구가 있으면 따라 해 보기라도 할 텐데 다들 머리만 쥐어뜯고 있으니 일단 할 줄 아는 공부만, 다 아는 것인데도 불구하고 노느니 차라리 계속 반복하겠다는 셈이다.
하지만 그렇다고 해서 마냥 덧셈, 곱셈 연습만으로는 대학에 갈 수 없다. 지금 어쩔 줄 몰라 하는 친구들도 언젠가는 어떻게든 방법을 찾을 것이고, 일단 그렇게 되면 뒤따라가는 것은 이미 늦게 된다. 데이터의 균형성과 다양성을 검증하는 기술은 해외에서 완성하기 전에 우리가 선제적으로 만들어야 하는 이유이다. 그래야 산업의 미래 영역을 선점할 수 있다.
구체적으로는 수치 기반의 데이터 분석에 머무르는 현재의 진단 수준을 넘어서, 데이터 의미 분석까지를 가능케 할 수 있는 설계 기술이 필요하다. 이 부분은 해외에서도 필요성은 인식하지만, 아직 방법을 찾지 못하고 있어서 그만큼 어려운 영역이다. 바꿔말하면 우리가 먼저 고민하고 투자하면 확실하게 상대 우위를 가져올 수 있다는 의미이기도 하다. 정부가 목표로 하는 'AI G3 강국'도, 그렇게 해서 남들보다 앞서갈 때만 달성할 수 있다.
[출처]
- 관련 기사 :
https://www.koit.co.kr/news/articleView.html?idxno=124253
- 사진 :
씽크포비엘
2024-08-02
THINKFORBL COLUMN SERIES
데이터센터 건립 의미 더 잘 살리려면
정보통신신문