MS연구팀, DNA에 디지털 데이터 저장·복원 성공… 반도체 능가하는 저장 장치로 진화
모래알만한 DNA 조각에 DVD 200억개 보관할 수 있어
와인병 용량의 DNA 있으면 세계 모든 디지털 정보 저장
반도체 저장 연한 5~10년인데
DNA는 수백년까지 보관 가능… 엄청난 개발 비용이 걸림돌
DNA 컴퓨터도 개발 본격화 인공지능으로 발전 가능
페이스북과 인스타그램 등 소셜네트워킹서비스(SNS)에는 매일 20억장 넘는 사진이 새로 올라온다. 동영상 사이트 유튜브에는 1분마다 300시간 이상 분량의 영상이 올라온다. 데이터 폭증(暴增)의 시대이다. 문제는 실리콘 반도체 기술의 발전 속도가 데이터 용량 증가를 따라가기 버거워지고 있다는 것이다. 데이터를 저장할 공간과 비용 부담이 갈수록 늘고 있다. 몇 년 전부터 과학자들의 눈길을 끌고 있는 실리콘 반도체의 후계자가 있다. 바로 생명 정보를 담고 있는 DNA이다.
◇모래알 크기에 DVD 200억개 저장
마이크로소프트(MS)와 미국 워싱턴대 공동 연구팀은 지난 13일 "DNA에 사진 4장을 저장했다가 복원하는 데 성공했다"고 밝혔다. 살아있는 생물을 구성하는 DNA가 어떻게 실리콘 반도체처럼 디지털 데이터를 저장할 수 있을까.
DNA는 인산(燐酸)과 당(糖)에 A(아데닌)·C(시토신)·G(구아닌)·T(티민) 등 네 염기(鹽基)가 연결된 형태다. DNA 두 가닥이 연결돼 이중나선을 이룰 때는 마치 지퍼의 이가 맞는 것처럼 A는 C와, G는 T와만 각각 결합한다. 2012년 미국 하버드대 연구진은 A와 C를 0으로, G와 T는 1로 설정하는 방식으로 책 한 권 분량의 정보를 DNA에 심는 데 성공했다. 하지만 원상태로 복구하는 과정에서 오류가 발생했다. 디지털 정보가 저장된 DNA를 온전히 보존하기 어려웠기 때문이다.
이 문제는 DNA에서 수분을 뽑아내는 방식이 개발되면서 해결됐다. 수분이 없는 상태에서 DNA는 최대 수만년까지 보존되기도 한다. 멸종된 지 수만년이 지난 네안데르탈인의 뼈 화석에서도 DNA 정보를 뽑아낼 수 있을 정도이다. MS와 워싱턴대 연구팀은 이를 이용해 사진을 저장하는 단계까지 발전시킨 것이다. 공동 연구팀은 디지털 데이터를 담은 DNA 조각들을 합성한 뒤 이를 일정한 크기의 조각으로 나눴다. 여기서 수분을 없애 저장했다가 나중에 어떤 염기들이 연결됐는지 해독해 사진을 다시 읽어냈다.
워싱턴대 측은 "DNA는 생물을 구성하는 가장 복잡한 설계도를 담고 있는 자연의 저장장치인 만큼, 이 성질을 이해하면 충분히 디지털 정보 저장에도 사용할 수 있다"고 밝혔다. DNA 저장장치는 용량과 보존기한에서 실리콘 반도체와는 차원이 다르다. 현재의 실리콘 반도체는 짧으면 5년에서 길어야 10년이면 물리적 성질이 변한다. 하지만 DNA 저장장치는 적절한 온도만 보장되면 수백년 보관할 수 있다. DNA의 크기가 분자 단위이기 때문에 모래알 크기에 200억개의 DVD를 저장할 수 있다. DNA 저장장치를 연구하고 있는 미국 일리노이대 연구팀은 "와인병 정도의 DNA 분자가 있으면, 현재 전 세계에 있는 모든 디지털 정보를 저장할 수 있을 것"이라고 밝혔다. MS는 본격적인 DNA 저장 장치 연구를 위해 최근 미국 바이오 기업들에서 1000만 가닥이 넘는 DNA를 사들였다.
시장조사 기관 IDC 전망에 따르면 2020년이면 전 세계에서 한 해 동안 40조 기가바이트(1기가바이트는 10억바이트)의 정보가 만들어진다. 현재 사용되는 저장공간의 10배 이상이 필요하다는 뜻이다. DNA 저장장치가 상용화되면 이런 고민을 하지 않아도 된다. 상용화의 관건은 가격이다. DNA에 정교하게 디지털 데이터를 저장하고 복원하기 위해서는 메가바이트(100만바이트)당 수백만원이 필요하다. 대량으로 DNA 저장과 복원을 해낼 수 있는 소형 장치도 개발돼야 한다.
◇인공지능으로 자라나는 DNA 컴퓨터
DNA를 이용해 컴퓨터를 대체하려는 연구도 진행 중이다. DNA 분자는 두께와 폭이 각각 0.34나노미터(1㎚=10억분의 1m), 2㎚에 불과하다. 지금까지 개발된 어떤 실리콘 반도체보다 얇고 가늘지만 훨씬 많은 정보를 담고 동시에 처리할 수 있다. 특히 기존의 실리콘 반도체는 전류를 흘리거나 끊으면서 1과 0을 인식하는 식으로 순차적인 연산을 하기 때문에 속도가 빨라지는 데 한계가 있다. DNA 분자는 염기의 숫자가 늘어나는 만큼 동시에 반응하므로 정보 처리량이 획기적으로 늘어난다. 이를 초병렬성이라고 한다.
장병탁 서울대 컴퓨터공학부 교수는 DNA로 분자컴퓨터를 만들어 인공지능 학습에 활용하고 있다. 우선 DNA 분자의 염기서열을 재구성해 특정한 문자나 수식을 나타내는 구조를 만든다. 이어 학습을 시키면서 새로 들어온 정보를 기존 DNA 옆에 이어 붙이거나, 중간에 끼어 들어가도록 한다. 서로 연관된 정보일수록 더 가깝게 저장한다. 학습을 많이 하면 할수록 DNA의 구조는 복잡해진다. 나중에는 일일이 사람이 입력하거나 정보를 주지 않아도, DNA 컴퓨터 내부에서 비슷한 구조끼리 자체적으로 재구성이 일어나면서 자연스럽게 최적화된다. 마치 컴퓨터가 살아서 자라나는 것처럼 연관성이 높은 정보끼리 모으는 식으로 작동한다는 것이다.예를 들어 뽀로로라는 글자 옆에 뽀로 동영상이 자리 잡도록 하면, 뽀로로와 관련된 정보는 입력되는 즉시 이 부분에 와서 붙게 된다"면서 "이론상 DNA 컴퓨터를 구성하는 분자들은 구성 단위당 최대 6.02X10²³이라는 어마어마한 숫자의 작업을 동시에 진행할 수 있다"고 말했다. DNA 컴퓨터를 이용하면 학습한 만큼 똑똑해지는 인공지능의 성능을 최대한 끌어올릴 수 있다는 뜻이다
◇모래알 크기에 DVD 200억개 저장
마이크로소프트(MS)와 미국 워싱턴대 공동 연구팀은 지난 13일 "DNA에 사진 4장을 저장했다가 복원하는 데 성공했다"고 밝혔다. 살아있는 생물을 구성하는 DNA가 어떻게 실리콘 반도체처럼 디지털 데이터를 저장할 수 있을까.
DNA는 인산(燐酸)과 당(糖)에 A(아데닌)·C(시토신)·G(구아닌)·T(티민) 등 네 염기(鹽基)가 연결된 형태다. DNA 두 가닥이 연결돼 이중나선을 이룰 때는 마치 지퍼의 이가 맞는 것처럼 A는 C와, G는 T와만 각각 결합한다. 2012년 미국 하버드대 연구진은 A와 C를 0으로, G와 T는 1로 설정하는 방식으로 책 한 권 분량의 정보를 DNA에 심는 데 성공했다. 하지만 원상태로 복구하는 과정에서 오류가 발생했다. 디지털 정보가 저장된 DNA를 온전히 보존하기 어려웠기 때문이다.
이 문제는 DNA에서 수분을 뽑아내는 방식이 개발되면서 해결됐다. 수분이 없는 상태에서 DNA는 최대 수만년까지 보존되기도 한다. 멸종된 지 수만년이 지난 네안데르탈인의 뼈 화석에서도 DNA 정보를 뽑아낼 수 있을 정도이다. MS와 워싱턴대 연구팀은 이를 이용해 사진을 저장하는 단계까지 발전시킨 것이다. 공동 연구팀은 디지털 데이터를 담은 DNA 조각들을 합성한 뒤 이를 일정한 크기의 조각으로 나눴다. 여기서 수분을 없애 저장했다가 나중에 어떤 염기들이 연결됐는지 해독해 사진을 다시 읽어냈다.
워싱턴대 측은 "DNA는 생물을 구성하는 가장 복잡한 설계도를 담고 있는 자연의 저장장치인 만큼, 이 성질을 이해하면 충분히 디지털 정보 저장에도 사용할 수 있다"고 밝혔다. DNA 저장장치는 용량과 보존기한에서 실리콘 반도체와는 차원이 다르다. 현재의 실리콘 반도체는 짧으면 5년에서 길어야 10년이면 물리적 성질이 변한다. 하지만 DNA 저장장치는 적절한 온도만 보장되면 수백년 보관할 수 있다. DNA의 크기가 분자 단위이기 때문에 모래알 크기에 200억개의 DVD를 저장할 수 있다. DNA 저장장치를 연구하고 있는 미국 일리노이대 연구팀은 "와인병 정도의 DNA 분자가 있으면, 현재 전 세계에 있는 모든 디지털 정보를 저장할 수 있을 것"이라고 밝혔다. MS는 본격적인 DNA 저장 장치 연구를 위해 최근 미국 바이오 기업들에서 1000만 가닥이 넘는 DNA를 사들였다.
시장조사 기관 IDC 전망에 따르면 2020년이면 전 세계에서 한 해 동안 40조 기가바이트(1기가바이트는 10억바이트)의 정보가 만들어진다. 현재 사용되는 저장공간의 10배 이상이 필요하다는 뜻이다. DNA 저장장치가 상용화되면 이런 고민을 하지 않아도 된다. 상용화의 관건은 가격이다. DNA에 정교하게 디지털 데이터를 저장하고 복원하기 위해서는 메가바이트(100만바이트)당 수백만원이 필요하다. 대량으로 DNA 저장과 복원을 해낼 수 있는 소형 장치도 개발돼야 한다.
◇인공지능으로 자라나는 DNA 컴퓨터
DNA를 이용해 컴퓨터를 대체하려는 연구도 진행 중이다. DNA 분자는 두께와 폭이 각각 0.34나노미터(1㎚=10억분의 1m), 2㎚에 불과하다. 지금까지 개발된 어떤 실리콘 반도체보다 얇고 가늘지만 훨씬 많은 정보를 담고 동시에 처리할 수 있다. 특히 기존의 실리콘 반도체는 전류를 흘리거나 끊으면서 1과 0을 인식하는 식으로 순차적인 연산을 하기 때문에 속도가 빨라지는 데 한계가 있다. DNA 분자는 염기의 숫자가 늘어나는 만큼 동시에 반응하므로 정보 처리량이 획기적으로 늘어난다. 이를 초병렬성이라고 한다.
장병탁 서울대 컴퓨터공학부 교수는 DNA로 분자컴퓨터를 만들어 인공지능 학습에 활용하고 있다. 우선 DNA 분자의 염기서열을 재구성해 특정한 문자나 수식을 나타내는 구조를 만든다. 이어 학습을 시키면서 새로 들어온 정보를 기존 DNA 옆에 이어 붙이거나, 중간에 끼어 들어가도록 한다. 서로 연관된 정보일수록 더 가깝게 저장한다. 학습을 많이 하면 할수록 DNA의 구조는 복잡해진다. 나중에는 일일이 사람이 입력하거나 정보를 주지 않아도, DNA 컴퓨터 내부에서 비슷한 구조끼리 자체적으로 재구성이 일어나면서 자연스럽게 최적화된다. 마치 컴퓨터가 살아서 자라나는 것처럼 연관성이 높은 정보끼리 모으는 식으로 작동한다는 것이다.예를 들어 뽀로로라는 글자 옆에 뽀로 동영상이 자리 잡도록 하면, 뽀로로와 관련된 정보는 입력되는 즉시 이 부분에 와서 붙게 된다"면서 "이론상 DNA 컴퓨터를 구성하는 분자들은 구성 단위당 최대 6.02X10²³이라는 어마어마한 숫자의 작업을 동시에 진행할 수 있다"고 말했다. DNA 컴퓨터를 이용하면 학습한 만큼 똑똑해지는 인공지능의 성능을 최대한 끌어올릴 수 있다는 뜻이다
조선일보
댓글 없음:
댓글 쓰기