나의 활동

guest [손님]
연구회 가입하기

연구회 태그 펼치기/숨기기 버튼

카운터

today 0ltotal 3538
since 2007.04.30
RSS Feed RSS Feed

자료실

게시판상세

[연재 13회]본론-III.지식재산권 데이터 보유 현황

글쓴이 관리자 작성일 2007.10.22 00:00 조회수 1477 추천 0 스크랩 0
제4절 전자 데이터 표준 및 교환 본 절에서는 주요 국가의 지식재산권 데이터의 형식에 관한 표준 및 데이터 교환 현황에 대해서 살펴보고, 주요 국가들의 특허청은 지식재산권 데이터를 어떤 형식으로 보유하고 있으며, 데이터 교환시에는 어떤 표준을 준수하고 있는지에 대해 검토해보고자 한다. 또한, 미국특허상표청, 일본특허청, 유럽특허청간의 3극 특허청의 데이터 교환의 개념과 더불어 이들간의 데이터 교환 및 표준화에 관한 논의 사항을 시기별로 살펴보기로 한다. 1. 미국특허상표청 미국특허상표청은 데이터 표준으로 aps, xml, sgml 3종류를 사용하고 있으며, 이미지 데이터의 경우는 tiff를 기준으로 하되 pdf파일 형식을 병행하여 사용하고 있다. 3극(三極) 특허 네트워크 형성을 위해 활동 중이며 문서 포맷에 관하여 cipr (common industrial property record)이란 방법을 제안하였다. 한편 데이터교환에 관한 포괄적인 표준이나 관리규정을 별도로 정리하여 규정하고 있지 않으며 ansi나 iso도 명시적으로 전자기록관리에 대한 표준을 제공하고 있지 않다. 따라서, 특허 및 상표에 대한 표준, 권고사항, 가이드라인에 관해 광범위하게 설정되어진 wipo의 표준을 준용 wipo st.8 기계판독형 레코드에 ipc symbol 기록을 위한 표준 wipo st.16 특허문서의 종류를 식별하기 위한 코드 표준 wipo st.30 특허문서 및 데이터의 교환을 위한 magnetic tape 표준 wipo st.31 특허문서 교환을 위한 표준 코드 문자 세트 wipo st.32 특허문서를 sgml을 사용해서 markup하기 위한 표준 wipo st.33 특허문서의 팩시밀리 정보의 데이터 교환 표준 포맷 wipo st.34 전자출원서식상의 출원번호 레코딩에 관한 표준 wipo st.40 cd-rom 수록을 위한 특허문서의 팩시밀리 이미지 제작 표준 하고 있다. 미국특허상표청은 세계 모든 문자에 대한 문자 인코딩 시스템 미국은 예전부터 데이터 표현에 대해 ascii 문자 세트를 채택해 왔으나 일반기회 및 문장부호가 부족한 유럽 외 다른 국가들은 ascii가 데이터 표현에 부적합하다는 인식을 하였음. iso는 ascii에서 누락된 모든 유럽 문자에 대한 코드를 정의하기 위한 iso latin-1(iso 8859-1)이라 불리는 표준 코드 세트를 확립하였음. iso latin-1 문자세트는 "extended ascii" (also called ansi) 문자세트에 대한 기준임. ascii 문자 세트는 문자 코드로 7-bits를 사용하며 ascii를 사용해서 표현되는 문자의 최대 수는 128(27)임. 반면, iso latin-1과 ansi는 문자 코드로 8-bits (or one byte)를 사용하고 256 (28)개의 문자를 표현할 수 있음. 이러한 single-byte coding schemes는 서양 언어(western languages) 문자를 표현하기에 충분한 문자를 인코드 할 수 있음. 그러나 이 정보는 컴퓨터들 사이에 전송되자마자 문제점이 발생함. 일본어, 한국어, 중국어(jkc)와 같은 동양 언어(eastern languages)는 표의문자 형식을 사용하며 이들은 매우 많은 수의 문자를 갖고 있는데 single-byte coding scheme을 사용하여 인코드 되는 것은 불가능함. 이러한 문자들은 일반적으로 각각의 문자에 대해 16 bits를 사용하는 double-byte coding scheme을 사용하여 저장되거나, 몇 개의 문자들은 8-bit sequence로 다른 문자들은 16-bit, 24-bit, 또는 32-bit sequence로 표현되는 a multi-byte coding scheme를 사용함. 이들은 ascii 또는 ansi 문자 세트에서 정의된 128- 또는 256- 문자 코드에 명백하게 적합하지 않음. 8-bit byte로 제공되는 해당 코드 스페이스는 더 이상 충분하지 않음. multiple coding schemes 문제를 처리하기 위해 unicode consortium은 유니코드를 개발함. 유니코드는 세계 문자 시스템(writing systems)의 최고 성능을 가진 single-character set임. 그것은 동 아시아의 표의문자의 통일화된 han set 및 한글 뿐 아니라 서양, 아프리카, 중동, 인디아 및 아시아 각 부분에서 사용되는 알파벳을 포함하며 유니코드는 각각의 문자에 대해 8 bits 대신 16 bits를 사용함. 그것은 iso/iec 10464 표준의 bmp (basic multilingual plane)와 동일함. 65,536 (216)개의 가능한 값을 가지고, 유니코드는 많은 다른 부호를 가진 모든 현대, character-based languages 문자를 나타내기에 충분한 수를 가지고 있음. 유니코드 표준의 version 2.1은 두 개의 추가사항을 해당 목록에 추가하며, 이는 해당 문자 조건 데이터베이스(character properties database)에 많은 도구 및 업데이트에 있어서 폭넓게 사용될 것으로 기대됨. 이 새로이 추가된 두 문자들은 "x-object replacement character"(u+ffc)와 "euro sign"(u+20ac)임. x-object replacement character는 이미 multiple implementations에 채용되어 있으며, euro sign은 the european monetary union(emu)이 the emu unit of currency로 사용되는 단계로 진행되면 바로 널리 사용될 것으로 기대됨 의 구성을 위해 유니코드 표준(unicode standard) unicode character set (ucs) - iso/iec 10646-1:1993. 을 수립하여 정확하게 텍스트 정보 교환을 위해 노력하고 있으며, 국제 표준 iso/iec 10646-1:1993과 완전히 호환되며, 모든 동일 문자와 인코딩 포인트를 iso/iec 10646로 포함하고 있다. 유니코드 표준은 iso 10646 변환 포맷인 utf-8 과 utf-16 utf-8 과 utf-16은 본질적으로 해당 인코딩 실행에 사용되는 실제 비트로 바꿔주는 방식을 말하며, 16-bit utf-16 형식에서 표현되는 유니코드 문자는 utf-8 형식으로 변환되고 정보손실 없이 되돌아오는 것이 가능함 에 맞는 두 가지 형식을 인정하고 있다. ① chemical exchange format (cxf) 미국특허상표청은 일관된 하나의 교환 포맷으로 화학 물질 데이터를 다루는 소프트웨어를 필요로 하여 화학 교환 형식을 화학데이터가 이종 시스템 사이에서 다양한 조직들과 상호 교환할 수 있는 교환 포맷을 고려하고 있다. cxf가 표준화되어 상용 소프트웨어 이용이 가능함에 따라 미국특허상표청은 cxf를 채택하였으며, cxf 형식 채택으로 호환 정보 교환이 촉진될 것을 기대하고 있다. 또한, cxf는 텍스트 검색, 디스플레이 및 프린팅 기능에 대해 특허 자동화 시스템 메신저 서브시스템을 지원하는 포맷으로 활용된다. ② electronic data interchange (edi) fips 161-2, electronic data interchange (edi) (also edifact family of standards (edi for administration, commerce, and transport)) 미국특허상표청은 세계 시장 및 국내/국제 조직과 특허문서 및 해당 지원 정보의 양방향 전자 파일화 및 교환을 촉진하기 위한 표준화된 전자 방식을 요청하고 있다. 이에 edi(electronic data interchange)기술은 미국특허상표청과 특허 출원인/대리인 커뮤니티 사이에서 특허 및 상표관련 데이터를 교환하거나 처리하는데 효과적이다. 또한 출원인과 미국특허상표청 사이에서 수수료 납부에 대해 전자적으로 청구서를 효과적으로 전송할 수 있으며, 출원인과 미국특허상표청 사이에서 양방향 전자교환(electronic bi-directional dialog)을 처리하기 위한 실질적인 방법을 제공하고 있다. 2. 일본특허청 일본 특허청의 타국과의 데이터 교환 현황을 살펴보면 1972년에 inpadoc과 협력 협정을 체결하고 이 협정에 근거해 1973년부터 10개 항목 발행국, 문헌의 종류, 문헌번호, 출원번호, 출원일, 문헌의 발행일, ipc, 우선권 주장일, 우선권 주장의 기초가 되는 출원번호, 우선권주장일 을 바탕으로 서지적 정보의 전자화 데이터를 inpadoc에 송부하고 있으며, inpadoc에서는 세계 각국으로부터 송부된 서지 데이터를 종합해서 전자 파일화하고 세계 각국의 특허청 및 민간기관에서 이용할 수 있도록 지원하는 일을 하고 있다. 일본특허청, 미국특허상표청, 유럽특허청은 1983년부터 3극 모임을 개최하여 자동화 등에 관한 협력을 추진하고 있으며 이 중 공보데이터를 중심으로 하는 각종 전자 데이터의 교환도 논의되어 추진되고 있다. 이들 데이터는 3극 특허청 및 유럽 회원국 특허청의 이용을 위해 제공되는 것 이외에도 각 국의 지식재산권 정보관 등을 통해 열람서비스를 제공하는데 이용되고 있다. 한편 일본 특허공개공보의 영문 초록 데이터(paj)는 전세계 특허청 중 약 60개국의 해외 특허청에 송부되고 있다. 이 영문 초록의 보급은 일본어 문헌을 제외한다면 해외의 이용자가 일본의 특허정보를 살펴볼 수 있는 거의 유일한 데이터라는 점을 감안한다면 상당히 데이터 교환의 의미가 있다. 1995년 이후는 3극 협력의 성과인 mimosa소프트웨어를 이용하여 cd-rom화된 영문 초록 데이터베이스를 제작하여 해외에 제공되고 있다. 이로 인해 외국인들이 보다 손쉽게 내용을 영문으로 검색하고 간략하지만 기술의 내용을 파악할 수 있게 되었으며 일본 특허정보가 해외로 넓게 보급되는 효과를 도출하였다. 한편 일본특허청이 보유하고 있는 외국 특허공보는 해외 각국 특허청간 데이터 교환에 의해서 입수하며 한국을 포함한 94개국정도에서 데이터를 보급받고 있다. 보급하고 있는 데이터로는 paj cd-rom이 있으며 94개국 중 단지 몇 국가만을 제외하고는 모두 송부하고 있다. 한국특허청의 경우 일본특허청과의 데이터 교환 현황을 보면 특허, 실용신안, 디자인, 상표의 모든 공보를 일본으로 발송하고 있으며, 색인데이터로는 상표 색인을 송부하고 있다. 또한 기타 심판에 대한 심결 및 판례에 관한 데이터도 송부하고 있다. 한국특허청이 일본 특허청으로부터 보급받는 것으로는 paj와 특허, 디자인, 상표의 일문(日文) 공보, 심결 공보, 국제상표 cd를 송부 받고 있다. <그림 ⅲ-4-1> 일본의 교환 데이터의 확산 개요 経済産業調査会, 電子政府と知的財産ペーパーレスシステムの技術と開発, 2003. 410page 인용 위의 그림에서 데이터의 입수 후 흐름을 미리 살펴보면 일본특허청은 3극간에 전자데이터를 교환하고 입수하게 되면 ipdl에 탑재를 하고, ipdl은 공업소유권종합정보관을 통해 지방열람실과 지적소유권센터를 통해 일반인이 열람 가능하도록 하는 흐름으로 진행된다. 또한, 공익부분으로 데이터를 제공하며, 그 일부는 일본특허정보기구에서 민간정보업체로 데이터를 제공하여 온라인 서비스를 할 수 있도록 구성되어 있다. 일본특허청은 데이터교환의 원활한 교류가 진행될 수 있도록 정리 표준화 데이터를 정비하고 있다. 정리 표준화 데이터에는 정리 표준화 데이터 및 특허청이 보유한 형식의 데이터 2종류가 있는데 정리 표준화 데이터란 지금까지 종류마다 형식이 달랐던 특허청 보유 데이터를 1개로 집약하고,sgml(standard generalized markup language) 형식 혹은 xml(extensible markup language) 형식에 의해 포맷을 표준화한 데이터를 의미하며, 특허청이 보유한 형식의 데이터란 데이터의 종류마다 고유의 데이터 형식을 갖는 데이터에 관한 것을 의미한다. 정리 표준화 데이터는 특허청내의 각 마스터에 있어 발생 또는 갱신된 특허에 관한마스터에는 출원 마스터, 등록 마스터, f-term 검색 마스터, 국내 인용 문헌 마스터, 디자인 공지 자료 마스터, 외국 디자인공보 자료마스터, 마드리드프로토콜 출원 및 원부 마스터, 상표 기본 마스터, 중복 원부 마스터정보 및 상표 이미지 파일이 있고, 사법 종류별에 의해 수록된 마스터가 다르다. 데이터 형식은 2003년 7월 이후의 데이터 포맷은 최신의 포맷인 xml 형식과 그 이전의 sgml 형식 2종류로 운영되고 있다.
등록된 태그가 없습니다.