4. docdb st.36 사용자 매뉴얼
(exchange format epo - patent information resource)
○ epo의 docdb xml은 3극망 파트너, wipo 및 상업용 정보 제공자들을 위한 docdb 교환에 대한 표준 포맷으로 wipo st.36에 기초한다.
1단계는 서지 데이터(인용문 포함)와 초록의 외부 제공에 집중하고, 다음단계에는 전문과 이미지 교환으로 확대할 것이다.
내용
○ 특허 서지 데이터(patent bibliographic data)
○ 인용된 참조(cited reference)
○ 초록(abstracts)
○ ipc/1 to 7(ipc/1 to 7)
○ ipc/8(ipc/8)
○ epo에 의해 할당된 분류(classifications allocated by the epo)
○ 자국청들에 의해 할당된 분류(classifications allocated by the national office)
일반적 고려사항
○ 일자, 국가와 언어에 관하여
일자는 8바이트로 저장한다. 포맷은 항상 ccyymmdd. 일자는 태그에 의해 만들어진다. 국가와 주(나라)의 코드는 wipo st.3에 따른다. 언어-코드의 사용된 값은 표준 iso/r 639-1967(f)를 따른다.
○ 개체 참조(entity reference)는 다음과 같다.
- & = &ersand
- > = > greater than
- < = < less then
example: j.a. kemp & co = j.a. kemp & co
개체 참조는 "docdb-entities.dtd"로 식별된다. 형태변환시 개체가 "docdb-entities.dtd" 에서 식별되지 않을때[cdata] 섹션에 포함된다.
○ 요소 는 다음과 같다.
- publication-reference - 필수 항목
- application-reference - 필수 항목, 다른 것은 선택적 항목
- priority-claims - 필수 항목, 다른 것은 선택적 항목
- dates-of-availability - 필수 항목, 다른 것은 선택적 항목
docdb 공개번호, 출원번호, 우선권번호는 최대 15자리로 가질 수 없고, b는 wipo st.50의 확정된 재공개-코드를 지원하지 않는다.
○ 데이터 형식(data format)
docdb는 docdb와 같은 데이터 아이템의 다중표현을 지원한다.
- in data-format = “docdb"
주요 docdb 표준화 규칙에 반하는 표준
- in data-format="docdba"
기본적으로, docdb 이차 표준화 규칙에 반하여 형식은 다음과 같이 기재한다.
- in data-format = "origianal" (공급자에 의해 공급된 포맷대로)
docdb가 한가지 이상 지원하는 데이터-아이템은 다음과 같다.
- 출원 및 우선권(applications and priorities)
- 출원자 및 발명자(applicants and inventors)
- 제목 및 초록(title and abstracts)
‘annex 2’를 참조하라. 데이터 포맷 및 개별 요소안에서 연속되는 숫자는 다음과 같이 기재한다.
- all data-format = "docdb"
- all data-format = "docdba"
- all data-format = "original"
- “sequence"는 1부터 시작
개별요소위의 섹션안에서 사용예를 참조하고, 적정한 규칙으로 연속 번호가 상응하는 데이터-포멧 = “docdb"과 데이터-포멧 = ”docdba", 데이터-포멧 = “original"에 상응하는 것 안에서 일관적이다. 그러나 이것이 보장 될 수는 없다.
epo는 공급자에 의해 공급된 포맷안에서의 데이터의 품질에 관하여 책임질 수 없고 데이터-포멧 = “docdba" 또는 데이터-포멧 = ”original"에 데이터를 교정 또는 조작하는 위치에 있지도 않다. epo는 docdb 표준화된 포맷에 대하여 책임이 있고 품질의 높은 표준을 유지하기 위한 데이터-포멧=“docdb"에 있는 데이터를 수정하고 처리한다.
※ 출원과 우선권에 대한 추가 노트
docdb는 출원과 우선권에 있어 데이터-포멧 = “original"의 국가와 문헌종류코드를 지원하지 않는다. 그것들은 오직 번호에 의해서만 교환된다. 데이터-포멧 = “docdb" 로부터의 데이터-포멧 = ”original"에 대한 국가와 문헌종류코드를 찾는 것은 선택이 아니다(이는 상기의 기술된 이유 때문). 상응하는 세트의 연속번호 교차의 일관성이 보장 될 수 없다. 이것은 data-format = "original"에서의 국가 및 문헌종류의 도출은 신뢰할만한 정확도를 갖지 못한다.
|