○ 필드수준 변경 식별자
이 식별자는 내의 어떤 데이터단위(date-units)가 변경되었는지 식별하게 한다. docdb내의 데이터단위는 다음과 같다.
- application-reference(출원참조) - data-format에 의해 좀 더 식별됨
- priority-claims(우선권주장) - data-format에 의해 좀 더 식별됨
- applicants(출원인) - data-format에 의해 좀 더 식별됨
- inventors(발명자) - data-format에 의해 좀 더 식별됨
- titles(명칭) - data-format에 의해 좀 더 식별됨
- abstract(초록) - data-format과 소스에 의해 좀 더 식별됨
- classification ecla - 분류 스키마(scheme)에 의해 좀 더 식별됨
- 데이터-포멧 또는 스키마에 의해 좀 더 식별되지 않는 데이터단위의 예는 다음과 같다.
▪
▪
▪
식별자는 데이터단위 수준에서 “status" 속성에 의하여 표현된다. 이 속성은 의 status 값 = ”a"(수정)를 갖는 공고를 위하여 존재한다. 적어도 데이터단위안의 한 개의 구성요소가 갱신(update)되고 더해지거나(add), 삭제(delete) 될 때 데이터단위 레벨 위의 속성 “status”는 값 “a"(수정)를 갖는다. 완전한 데이터단위가 더해질때 속성 ”status"는 값 “c(create)"를 갖는다.속성 “status"는 데이터단위내의 개별 데이터-필드에 대하여 정의하는 것으로, 데이터단위내의 데이터 필드의 어느 하나에 대하여 속성 ”status"가 존재한다. 데이터단위내의 한개의 데이터-필드의 값은 데이터단위 전체의 status에 영향이 가고, 데이터단위내의 무엇인가가 변경되었다는 것을 말한다.
교환의 전반적 구조
○ 메타 데이터의 구성은 다음과 같다.
- 인덱스
- 통계정보 : 파일 ‘statistics_ccyyww.csv’, ‘data_coverage_ccyyww.csv’
- 행정적인 목적을 위한 정보(information for administrative purposes)
'statistics_ccyyww.csv' 파일은 ifd통계가 포함될 것이다. 추가적인 정보는 다음과 같다.
- 공보기간 내 첫번째 공보
- 공보기간 내 마지막 공보
- 공보일자마다 공보번호
- 서지항목 마다 데이터 범위(data-coverage)
상태별, 국가별, 문헌종류별, 공보일자별로 그룹한 ‘packaging’ 부문을 참조 바란다.
○ xml 인스턴스(instnace)
교환 파일은 여러개 을 포함한다. 최상위요소(root-element)는 요소이다.
의 속성들은 다음과 같다.
- date-of-exchange = 교환문서를 해당 목요일에 인터넷에 올린 일자
- dtd-version = dtd나 스키마 버전
- file = 유일한 식별자
▪docdb-200536-pubdate10050909andbefore.xml
▪docdb-200536-pubdate20050915.xml
- 최초만든 국가(기관)(originating-office) = ep
○ exchange-x-document의 요소 속성은 다음과 같다.
- 교환일자, 이전교환일자, docdb 추가일자, 변경사유
docdb의 “교환 문서”는 그것에 관계된 서지데이터, ipc/8, 초록, 인용참조, 할당된 ep분류 같은 모든 특허정보를 가진 특허정보이다.
○ exchange-status 요소 속성은 다음과 같다.
- c : "create", 공보 추가
- d : "delete", 공보 삭제
- a : "amend", 공보 대체
- cv : "create void", 빈 공보 추가
- dv : "delete void", 빈 공보 제거
status = ‘c'나 ’a'일때, 특허 공보는 완전한 이미지로 항상 교환될 것이다. 예로 는 docdb가 제공할 수 있는 모든 관계된 특허 정보를 포함한다.
요소
○ 요소 는 다음의 속성이 사용된다
- country = 공개 국가 또는 조직(내의)
- doc-number = 서류의 번호(내의)
- kind = 문헌의 종류(내의)
- data-publ = 공개 일자(내의)
- is-representative = 공개 또는 등록 출원, y or n
- date-of-last-exchange = 공개가 교환된 일자
- date-added-docdb = 공개가 처음으로 docdb에 더해진 일자
- date-of-previous-exchange = 이전에 공개가 교환된 일자
- status = 교환 값 c, d, a에 대한 이유
요소의 기본구조는 다음과 같다( ? = optional, * = none, one or more).
요소
○ 요소 는 publication-identifier를 포함한다.
요소의 기본구조는 다음과 같다( ? = optional, * = none, one or more).
○ 요소 는 한 출원의 공보 진행일자이다.
○ 요소 는 독일 실용신안 - “eintragungstag" - 의 발효일이다.
○ 요소 는 숫자로 된 문자열에 독일과 wo에 대한 확장된 종류-코드이다.
○ 요소 는 국제특허분류 버전 1에서 7판까지를 나타낸다.
○ 요소 는 국제특허분류 버전 8판을 나타낸다.
○ 요소 는 자국분류로, 자국분류는 요소 내에서 교환된다.
○ 요소 는 epo에 의해 할당된 분류를 표시한다.
※ 내용 주석
- 내용 반복 가능, data-format = ”original" 일때, 단지 출원번호만 포함할 것임에 주의
- pct 출원의 문헌종류 코드는 ‘w'
○ 요소 는 pct 출원 언어를 포함(2문자 언어 코드)한다.
○ 요소 는 pct가 아닌 공보 언어도 포함(2문자 언어 코드)한다.
○ 요소 는 우선권주장 관련 정보를 나타낸다.
○ 요소 는 출원인 상세 정보를 나타낸다.
○ 요소 는 발명자 상세 정보를 나타낸다.
○ 요소 는 국가 또는 지역 코드이다.
○ 요소 는 발명의 명칭을 표시한다.
○ 요소 는 공고일자를 포함한다. 안에 표현된 공보일자는 내의 특정일자와 동일하다
○ 요소 는 내에 인용된 참고를 교환한다.
속성 는 인용 원본을 지시하기 위하여 사용한다.
요소
○ 초록 텍스트를 포함한다. 태그로 교환한다.
○ 각국청이 epo에 공급한 초록은 docdb에 포함되고 각국청으로 제공한다.
○ 이것외에도, epo는 각 심플특허패밀리(simple patent family)에 대해 적어도 이용가능한 영어로 된 초록이 있다는 것을 확인해 준다
epo에 의해 얻어진 번역본이나 사본의 추가는 단지 공개에 더해진 것이고, 패밀리 레벨이 아니다.
○ 요소
packaging
○ 교환 패키지는 xml 파일개수로 분할한다. 기본적으로 다음과 같다.
- 공보일자별
- 국가의 공보기간별
- 사이즈의 국가별
○ 네이밍 규칙은 아래와 같다.
- docdb-ccyyww-pubdatebeforeccyymmdd : 공보번호로 저장된, ccyymmdd 일자에 또는 이전에 발행된 모든 공보
- docdb-ccyyww-pubdateccyymmdd : 공보번호로 저장된, ccyymmdd 일자에 발행된 모든 공보
- 추가적인 식별자
▪docdb-ccyyww-pubdatebeforeccyymmdd-cc-nnnn.xml
▪docdb-ccww-pubdateccyymmdd-cc-nnnn.xml
○ 다음은 압축 방법이다.
- zip으로 묶어 공급 : docdb-xml_ccyyww.zip
- zip을 풀면 root가 나타나는데, 'doc' 디렉토리에 상당수의 xml파일이 있다.
▪docdb-ccyyww-pubdateccyymmddandbefore-cc-nnnn.zip
▪docdb-ccyyww-pubdateccyymmdd-cc-nnnn.zip
○ root 디렉토리에는 ‘doc'와 ’dtds'폴더와 3개의 파일이 있다.
- doc은 의 각 인스턴스의 하위디렉토리를 포함
- dtds는 xml의 dtds 및/또는 xml 스키마를 포함
- contents는 내용 설명서
- index.xml은 파일목록
- volumeid는 최소 23문자의 식별 태그
○ 페키지의 인덱스 파일은 일반적으로 한주의 업데이터 값을 하나의 교환기간에 한다.
- date-produced : epo에서 만들어진 교환일자
- dtd-version : dtd 또는 스키마 버전
- file : 년 또는 주의 수
- produced-by : "ep"
- volume-id : 아래 ‘volume-id’ 참조
패키지-파일은 최상위 루트 의 하나의 인스턴스이다.
- attributes : 사용된 속성은 ‘format’ 과 ‘size’
- file-name : 위의 ‘네이밍 규칙’ 참조
- doc-range : 각 국가별 : 범위안이 첫번째와 최종 문서
|