나의 활동

guest [손님]
연구회 가입하기

연구회 태그 펼치기/숨기기 버튼

카운터

today 0ltotal 3539
since 2007.04.30
RSS Feed RSS Feed

자료실

게시판상세

[연재38회]특허데이터 표준 가이드

글쓴이 복진요 작성일 2008.04.17 00:00 조회수 2152 추천 0 스크랩 0
○ 필드수준 변경 식별자 이 식별자는 내의 어떤 데이터단위(date-units)가 변경되었는지 식별하게 한다. docdb내의 데이터단위는 다음과 같다. - application-reference(출원참조) - data-format에 의해 좀 더 식별됨 - priority-claims(우선권주장) - data-format에 의해 좀 더 식별됨 - applicants(출원인) - data-format에 의해 좀 더 식별됨 - inventors(발명자) - data-format에 의해 좀 더 식별됨 - titles(명칭) - data-format에 의해 좀 더 식별됨 - abstract(초록) - data-format과 소스에 의해 좀 더 식별됨 - classification ecla - 분류 스키마(scheme)에 의해 좀 더 식별됨 - 데이터-포멧 또는 스키마에 의해 좀 더 식별되지 않는 데이터단위의 예는 다음과 같다. ▪ 식별자는 데이터단위 수준에서 “status" 속성에 의하여 표현된다. 이 속성은 의 status 값 = ”a"(수정)를 갖는 공고를 위하여 존재한다. 적어도 데이터단위안의 한 개의 구성요소가 갱신(update)되고 더해지거나(add), 삭제(delete) 될 때 데이터단위 레벨 위의 속성 “status”는 값 “a"(수정)를 갖는다. 완전한 데이터단위가 더해질때 속성 ”status"는 값 “c(create)"를 갖는다.속성 “status"는 데이터단위내의 개별 데이터-필드에 대하여 정의하는 것으로, 데이터단위내의 데이터 필드의 어느 하나에 대하여 속성 ”status"가 존재한다. 데이터단위내의 한개의 데이터-필드의 값은 데이터단위 전체의 status에 영향이 가고, 데이터단위내의 무엇인가가 변경되었다는 것을 말한다. 교환의 전반적 구조 ○ 메타 데이터의 구성은 다음과 같다. - 인덱스 - 통계정보 : 파일 ‘statistics_ccyyww.csv’, ‘data_coverage_ccyyww.csv’ - 행정적인 목적을 위한 정보(information for administrative purposes) 'statistics_ccyyww.csv' 파일은 ifd통계가 포함될 것이다. 추가적인 정보는 다음과 같다. - 공보기간 내 첫번째 공보 - 공보기간 내 마지막 공보 - 공보일자마다 공보번호 - 서지항목 마다 데이터 범위(data-coverage) 상태별, 국가별, 문헌종류별, 공보일자별로 그룹한 ‘packaging’ 부문을 참조 바란다. ○ xml 인스턴스(instnace) 교환 파일은 여러개 을 포함한다. 최상위요소(root-element)는 요소이다. 의 속성들은 다음과 같다. - date-of-exchange = 교환문서를 해당 목요일에 인터넷에 올린 일자 - dtd-version = dtd나 스키마 버전 - file = 유일한 식별자 ▪docdb-200536-pubdate10050909andbefore.xml ▪docdb-200536-pubdate20050915.xml - 최초만든 국가(기관)(originating-office) = ep ○ exchange-x-document의 요소 속성은 다음과 같다. - 교환일자, 이전교환일자, docdb 추가일자, 변경사유 docdb의 “교환 문서”는 그것에 관계된 서지데이터, ipc/8, 초록, 인용참조, 할당된 ep분류 같은 모든 특허정보를 가진 특허정보이다. ○ exchange-status 요소 속성은 다음과 같다. - c : "create", 공보 추가 - d : "delete", 공보 삭제 - a : "amend", 공보 대체 - cv : "create void", 빈 공보 추가 - dv : "delete void", 빈 공보 제거 status = ‘c'나 ’a'일때, 특허 공보는 완전한 이미지로 항상 교환될 것이다. 예로 는 docdb가 제공할 수 있는 모든 관계된 특허 정보를 포함한다. 요소 ○ 요소 는 다음의 속성이 사용된다 - country = 공개 국가 또는 조직(내의) - doc-number = 서류의 번호(내의) - kind = 문헌의 종류(내의) - data-publ = 공개 일자(내의) - is-representative = 공개 또는 등록 출원, y or n - date-of-last-exchange = 공개가 교환된 일자 - date-added-docdb = 공개가 처음으로 docdb에 더해진 일자 - date-of-previous-exchange = 이전에 공개가 교환된 일자 - status = 교환 값 c, d, a에 대한 이유 요소의 기본구조는 다음과 같다( ? = optional, * = none, one or more). 요소 ○ 요소 는 publication-identifier를 포함한다. 요소의 기본구조는 다음과 같다( ? = optional, * = none, one or more). ○ 요소 는 한 출원의 공보 진행일자이다. ○ 요소 는 독일 실용신안 - “eintragungstag" - 의 발효일이다. ○ 요소 는 숫자로 된 문자열에 독일과 wo에 대한 확장된 종류-코드이다. ○ 요소 는 국제특허분류 버전 1에서 7판까지를 나타낸다. ○ 요소 는 국제특허분류 버전 8판을 나타낸다. ○ 요소 는 자국분류로, 자국분류는 요소 내에서 교환된다. ○ 요소 는 epo에 의해 할당된 분류를 표시한다. ※ 내용 주석 - 내용 반복 가능, data-format = ”original" 일때, 단지 출원번호만 포함할 것임에 주의 - pct 출원의 문헌종류 코드는 ‘w' ○ 요소 는 pct 출원 언어를 포함(2문자 언어 코드)한다. ○ 요소 는 pct가 아닌 공보 언어도 포함(2문자 언어 코드)한다. ○ 요소 는 우선권주장 관련 정보를 나타낸다. ○ 요소 는 출원인 상세 정보를 나타낸다. ○ 요소 는 발명자 상세 정보를 나타낸다. ○ 요소 는 국가 또는 지역 코드이다. ○ 요소 는 발명의 명칭을 표시한다. ○ 요소 는 공고일자를 포함한다. 안에 표현된 공보일자는 내의 특정일자와 동일하다 ○ 요소 내에 인용된 참고를 교환한다. 속성 는 인용 원본을 지시하기 위하여 사용한다. 요소 ○ 초록 텍스트를 포함한다.

태그로 교환한다. ○ 각국청이 epo에 공급한 초록은 docdb에 포함되고 각국청으로 제공한다. ○ 이것외에도, epo는 각 심플특허패밀리(simple patent family)에 대해 적어도 이용가능한 영어로 된 초록이 있다는 것을 확인해 준다 epo에 의해 얻어진 번역본이나 사본의 추가는 단지 공개에 더해진 것이고, 패밀리 레벨이 아니다. ○ 요소 packaging ○ 교환 패키지는 xml 파일개수로 분할한다. 기본적으로 다음과 같다. - 공보일자별 - 국가의 공보기간별 - 사이즈의 국가별 ○ 네이밍 규칙은 아래와 같다. - docdb-ccyyww-pubdatebeforeccyymmdd : 공보번호로 저장된, ccyymmdd 일자에 또는 이전에 발행된 모든 공보 - docdb-ccyyww-pubdateccyymmdd : 공보번호로 저장된, ccyymmdd 일자에 발행된 모든 공보 - 추가적인 식별자 ▪docdb-ccyyww-pubdatebeforeccyymmdd-cc-nnnn.xml ▪docdb-ccww-pubdateccyymmdd-cc-nnnn.xml ○ 다음은 압축 방법이다. - zip으로 묶어 공급 : docdb-xml_ccyyww.zip - zip을 풀면 root가 나타나는데, 'doc' 디렉토리에 상당수의 xml파일이 있다. ▪docdb-ccyyww-pubdateccyymmddandbefore-cc-nnnn.zip ▪docdb-ccyyww-pubdateccyymmdd-cc-nnnn.zip ○ root 디렉토리에는 ‘doc'와 ’dtds'폴더와 3개의 파일이 있다. - doc은 의 각 인스턴스의 하위디렉토리를 포함 - dtds는 xml의 dtds 및/또는 xml 스키마를 포함 - contents는 내용 설명서 - index.xml은 파일목록 - volumeid는 최소 23문자의 식별 태그 ○ 페키지의 인덱스 파일은 일반적으로 한주의 업데이터 값을 하나의 교환기간에 한다. - date-produced : epo에서 만들어진 교환일자 - dtd-version : dtd 또는 스키마 버전 - file : 년 또는 주의 수 - produced-by : "ep" - volume-id : 아래 ‘volume-id’ 참조 패키지-파일은 최상위 루트 의 하나의 인스턴스이다. - attributes : 사용된 속성은 ‘format’ 과 ‘size’ - file-name : 위의 ‘네이밍 규칙’ 참조 - doc-range : 각 국가별 : 범위안이 첫번째와 최종 문서

등록된 태그가 없습니다.