개방형 오피스 문서
세상에는 데이터를 저장하기 위한 여러가지 형식의 파일들이 존재한다. 기본적으로 파일은 바이너리 파일과 텍스트 파일로 나뉜다. 예를 들어 텍스트 파일은 사람이 이해할 수 있는 문자를 저장하기 위해 이를 기반으로 하는 코드(ASCII, Unicode...) 값을 저장한다. 반면, 바이너리 파일은 데이터의 컴퓨터 저장과 처리에 목적이 있기 때문에 컴퓨터가 사용하기 좋은 바이너리 형식으로 데이터를 저장한다. 예를 들어 .bin, .exe, .png 와 같은 형식 이있다.
어떤 파일은 여러 파일들을 모아 압축한 형식을 갖기도 한다. 개방형 문서는 여러 XML 형식의 텍스트 파일과 media 요소를 표현하기 위한 바이너리 파일을 압축한 형식이다. MS Word로 .docx 파일을 생성한 후 확장자를 .zip으로 바꾸고, 압축을 해제해보자. 놀랍게도 하나의 파일이 여러 개의 파일로 분해된 것을 볼 수 있다. MS Word에서 사용하는 .docx 파일은 문서 내용과 스타일을 저장한 여러 개의 xml 파일과 문서에 사용한 이미지와 같은 부속 파일들로 이루어져있다. 물론 .pptx, .xlsx도 마찬가지이다.
ODF 또한 OOXML과 같이 오피스 문서를 XML과 바이너리 파일을 압축한 형식을 의미한다. ODF는 오픈 소스 프로그램인 OpenOffice가 그 기원으로, 사용하는 응용 프로그램 종류에 따라 ODT, ODS, ODP, ODB, ODG, ODF 의 확장자를 갖는다. ODF와 OOXML 모두 국제표준화기구(ISO)의 승인을 받은 표준 기준이다.
왜 OOXML과 ODF는 바이너리가 아니라 XML 형식을 사용하고 있는 것일까? 과거에는 CPU와 메모리 성능에 영향을 많이 받았기 때문에 컴퓨터 입장에서 처리 속도가 빠르고 크기도 작은 바이너리 파일을 사용했다. 그러나 최근에는 이러한 제약의 영향이 많이 줄었고, 오히려 사람이 XML 파일을 보고 어떤 데이터가 어떤 형식으로 존재하는지 이해하기에 더 유리한 XML을 채택하게 되었다. 또한 확장성 측면에서도 바이너리보다 유리하다.