나의 활동

guest [손님]
연구회 가입하기

연구회 태그 펼치기/숨기기 버튼

카운터

today 0ltotal 3537
since 2007.04.30
RSS Feed RSS Feed

자료실

게시판상세

[연재 37회]특허데이터 표준 가이드

글쓴이 복진요 작성일 2008.04.17 00:00 조회수 2109 추천 0 스크랩 0
4. docdb st.36 사용자 매뉴얼 (exchange format epo - patent information resource) ○ epo의 docdb xml은 3극망 파트너, wipo 및 상업용 정보 제공자들을 위한 docdb 교환에 대한 표준 포맷으로 wipo st.36에 기초한다. 1단계는 서지 데이터(인용문 포함)와 초록의 외부 제공에 집중하고, 다음단계에는 전문과 이미지 교환으로 확대할 것이다. 내용 ○ 특허 서지 데이터(patent bibliographic data) ○ 인용된 참조(cited reference) ○ 초록(abstracts) ○ ipc/1 to 7(ipc/1 to 7) ○ ipc/8(ipc/8) ○ epo에 의해 할당된 분류(classifications allocated by the epo) ○ 자국청들에 의해 할당된 분류(classifications allocated by the national office) 일반적 고려사항 ○ 일자, 국가와 언어에 관하여 일자는 8바이트로 저장한다. 포맷은 항상 ccyymmdd. 일자는 태그에 의해 만들어진다. 국가와 주(나라)의 코드는 wipo st.3에 따른다. 언어-코드의 사용된 값은 표준 iso/r 639-1967(f)를 따른다. ○ 개체 참조(entity reference)는 다음과 같다. - & = &ampersand - > = > greater than - < = < less then example: j.a. kemp & co = j.a. kemp & co 개체 참조는 "docdb-entities.dtd"로 식별된다. 형태변환시 개체가 "docdb-entities.dtd" 에서 식별되지 않을때[cdata] 섹션에 포함된다. ○ 요소 는 다음과 같다. - publication-reference - 필수 항목 - application-reference - 필수 항목, 다른 것은 선택적 항목 - priority-claims - 필수 항목, 다른 것은 선택적 항목 - dates-of-availability - 필수 항목, 다른 것은 선택적 항목 docdb 공개번호, 출원번호, 우선권번호는 최대 15자리로 가질 수 없고, b는 wipo st.50의 확정된 재공개-코드를 지원하지 않는다. ○ 데이터 형식(data format) docdb는 docdb와 같은 데이터 아이템의 다중표현을 지원한다. - in data-format = “docdb" 주요 docdb 표준화 규칙에 반하는 표준 - in data-format="docdba" 기본적으로, docdb 이차 표준화 규칙에 반하여 형식은 다음과 같이 기재한다. - in data-format = "origianal" (공급자에 의해 공급된 포맷대로) docdb가 한가지 이상 지원하는 데이터-아이템은 다음과 같다. - 출원 및 우선권(applications and priorities) - 출원자 및 발명자(applicants and inventors) - 제목 및 초록(title and abstracts) ‘annex 2’를 참조하라. 데이터 포맷 및 개별 요소안에서 연속되는 숫자는 다음과 같이 기재한다. - all data-format = "docdb" - all data-format = "docdba" - all data-format = "original" - “sequence"는 1부터 시작 개별요소위의 섹션안에서 사용예를 참조하고, 적정한 규칙으로 연속 번호가 상응하는 데이터-포멧 = “docdb"과 데이터-포멧 = ”docdba", 데이터-포멧 = “original"에 상응하는 것 안에서 일관적이다. 그러나 이것이 보장 될 수는 없다. epo는 공급자에 의해 공급된 포맷안에서의 데이터의 품질에 관하여 책임질 수 없고 데이터-포멧 = “docdba" 또는 데이터-포멧 = ”original"에 데이터를 교정 또는 조작하는 위치에 있지도 않다. epo는 docdb 표준화된 포맷에 대하여 책임이 있고 품질의 높은 표준을 유지하기 위한 데이터-포멧=“docdb"에 있는 데이터를 수정하고 처리한다. ※ 출원과 우선권에 대한 추가 노트 docdb는 출원과 우선권에 있어 데이터-포멧 = “original"의 국가와 문헌종류코드를 지원하지 않는다. 그것들은 오직 번호에 의해서만 교환된다. 데이터-포멧 = “docdb" 로부터의 데이터-포멧 = ”original"에 대한 국가와 문헌종류코드를 찾는 것은 선택이 아니다(이는 상기의 기술된 이유 때문). 상응하는 세트의 연속번호 교차의 일관성이 보장 될 수 없다. 이것은 data-format = "original"에서의 국가 및 문헌종류의 도출은 신뢰할만한 정확도를 갖지 못한다.
등록된 태그가 없습니다.