WIPO 서열 사용자 매뉴얼

본 문서의 목적은 WIPO Sequence 데스크탑 응용 프로그램을 사용하여 기본 작업을 수행하는 방법에 대한 지침을 사용자에게 제공하는 것이다. 일반적으로 사용자는 서열 목록을 포함하는 특허 출원을 제출하려는 특허 출원인 또는 그 대리인이다.

본 사용자 매뉴얼은 버전 3.0.0용이다.

1. 기능 요약

이 표는 현재 버전에서 도구가 구현하는 모든 기능을 요약하며, 각 기능과 관련된 섹션의 링크를 포함한다.

프로젝트에 발명의 명칭 및 해당 언어 코드를 추가한다
프로젝트에 응용 프로그램 정보 (현재 또는 이전 응용 프로그램)를 추가한다
특징 정보를 서열에 추가한다
특징에 한정어 정보를 추가한다
프로젝트에 서열 목록 일반 정보 데이터를 추가한다
생성되는 서열 목록에 서열이 나열될 순서를 변경한다
목록의 다른 위치에 서열을 작성하고 삽입한다
선택된 CDS 특징 및 이와 연관된 번역 서열에 대한 번역 한정어를 작성한다
서열을 삭제한다
프로젝트에 저장된 모든 데이터를 내보내어 나중에 동일하거나 상이한 시스템 인스턴스로 가져올 수 있도록 한다.
생성된 서열 목록을 사용자가 읽을 수 있는 형식(.html & .txt)으로 내보낸다.
서열 목록을 생성한다
프로젝트 파일에 저장된 모든 데이터를 가져온다
데이터를 FASTA 파일에서 기존 프로젝트로 가져온다
다중-서열 파일을 프로젝트로 가져온다.
프로젝트 또는 생성된 ST.26 서열 목록에서 데이터를 인쇄한다
지정된 유전자 코드 테이블 번호에 따라 핵산 서열을 번역한다.
ST.26 서열 목록 파일을 검증하고 경고 및 오류 메시지를 포함하는 검증 보고서에 문제를 나열한다.
프로젝트에 저장된 데이터를 확인하고 문제를 경고 및 오류 메시지를 포함하는 검증 보고서로 나열한다.
한정자 mol_type을 포함한 서열 주석의 대량 편집
다양한 서열 특징의 일괄 편집 및/또는 추가
서열 범위의 대량 삭제
다양한 서열을 일괄 건너뛰기

2. 도구 기능

2.1 프로젝트 홈 보기

이 섹션에서는 프로젝트 홈에서 액세스할 수 있는 여러 옵션에 대해 자세히 설명한다.

프로젝트는 도구가 서열 목록을 생성하는 데 필요한 데이터를 저장하기 위해 사용하는 오브젝트 구조이다. 이 데이터가 WIPO 표준 ST.26을 준수하는 것으로 검증되면, 도구는 프로젝트에 저장된 데이터를 생성된 서열 목록 내의 값으로 사용한다.

이 보기에는 생성된 프로젝트 목록이 표시되며, 사용자는 이를 정렬하거나 프로젝트 이름, 출원인 파일 참조, 출원인 이름, 발명의 명칭, 상태 또는 생성 날짜 별로 필터링할 수 있는 검색 기능을 사용할 수 있다.

참고: 이 도구는 최대 1,000개의 프로젝트를 표시한다. 프로젝트가 프로젝트 홈 보기에 표시되지 않으면, 프로젝트는 여전히 로컬에 저장되지만 이 보기에서는 볼 수 없기 때문에, 검색 기능을 사용하여 명칭으로 프로젝트를 식별해야 한다.


프로젝트 생성

새 프로젝트를 생성하려면, 아래 표시된 주 프로젝트 홈 보기에서 시작해야 한다.

프로젝트 홈 페이지에서 새 프로젝트 버튼을 클릭한다.

1) 보기의 상단에 있는 "새 프로젝트" 링크를 클릭한다. 표시된 것처럼, 도구는 이름(필수 사항) 및 설명(선택 사항)을 요청한다.

프로젝트 이름과 선택 사항으로 설명을 입력한다.

2) 이름 필드에 값을 입력하면, 새 프로젝트를 저장할 수 있도록 "저장" 버튼이 활성화된다. 이제 프로젝트 홈 보기에서 프로젝트 목록에 이 새 프로젝트가 포함된다.

프로젝트 가져오기

이 기능을 사용하면 이전에 내보낸 프로젝트를 도구로 가져올 수 있다. 프로젝트 파일을 가져오려면, 프로젝트 홈 보기에서 시작해야 한다.

표시된 대로 보기 상단의 "프로젝트 가져오기" 링크를 클릭한 다음 아래 비디오의 단계를 따른다:

기존 프로젝트를 새 프로젝트로 가져오기하는 과정을 보여주는 동영상



"서열 범위 선택"을 체크하지 않으면, 모든 서열을 가져온다. 프로젝트로 가져올 서열을 선택하려면, "서열 범위 선택" 체크박스에 체크하고 원하는 서열의 ID 번호를 적절한 필드에 입력한다. 단일 서열 뿐만 아니라 쉼표로 분리된 서열 목록 또는 x-y형식의 서열 범위를 입력할 수 있다. 기본적으로, 가져온 프로젝트의 총 서열의 수는 범위, 즉 1–총 서열 수로 표시된다.

예시: "1, 3, 7, 13-20, 30-50"

프로젝트를 성공적으로 가져오면, 다음 파란색 배너와 메시지가 보기의 상단에 나타난다.

주의: 가져온 zip 프로젝트가 현재 데이터베이스와 일치하는지 확인해야 한다. 프로젝트를 3.0.0 이전 버전에서 내보낸 경우, 제대로 작동하지 않을 수 있으며, 가져온 프로젝트는 동일한 데이터베이스를 사용해야 한다. 이는 버전 3.0.0부터 새로운 데이터베이스가 도입되었기 때문이다.

서열 목록 가져오기

프로젝트 홈 보기에서, ST.26 또는 ST.25 준수 서열 목록에서 서열 정보만을 가져올 수 있다. 각각의 파일 형식은 ST.26 형식의 경우 *.xml이고, ST.25 파일의 경우 *.txt이다. 관련 단계에 대한 더 자세한 내용은 아래 동영상을 참조하세요.

서열 목록을 가져와 프로젝트를 생성하는 과정을 보여주는 동영상

참고: 서열 목록 가져오기의 경우, 특징 및 한정자는 대소문자를 구분하며 WIPO ST.26의 부록 I에 제공된 값을 준수해야 한다.

또한 ST.25를 준수하는 서열 목록이 유효해야 하며, 그렇지 않으면 가져오기 시 WIPO Sequence의 기능을 보장할 수 없다는 점에 유의해야 한다.

가져오기 보고서 표는 파일을 가져올 때 오류가 발생한 경우에만 표시되며 다음 열을 표시한다:

  • 참고 유형: 특정 서열과 관련된 메시지의 경우 "개별" 또는 일반적으로 하나 이상의 서열의 경우 "전체"
  • 데이터 요소 코드: ST.25 서열 목록을 위해 소스 파일로부터
  • 메시지 텍스트: 논의가 될 만한 확인된 문제에 대한 정보 및 이를 수정하기 위한 변경 사항(있는 경우)이 포함된 자세한 메시지
  • 탐색된 서열: 메시지와 관련된 가져온 서열의 서열 번호 (유형이 "개별"인 경우; 그렇지 않으면 이 필드는 비어 있음).

가져오기 성공 후 생성된 가져오기 보고서

파일 형식이 ST.25인 경우, 보고서 가져오기 보기에는 변경 데이터 보고서뿐만 아니라 가져오기 보고서가 먼저 포함된다. 변경된 데이터 보고서에는 가져오기 처리 중에 변환 또는 변경된 모든 데이터가 표시된다. 다음 데이터가 요약 표에 표시된다:

  • 출처 태그: WIPO ST.25 서열 목록을 가져올 때, 요소 유형에 대한 데이터 요소 코드
  • 출처 요소 명칭: 요소 유형에 해당하는 명칭
  • 출처 요소 값: 소스 파일에서 출처 요소의 해당 값
  • 대상 요소 명칭: 정보가 프로젝트에 저장되는 동일한 ST.26 요소 명칭
  • 대상 요소 값: 프로젝트에서 대상 요소 명칭에 대해 설정될 값
  • 변환: 요소에 적용된 변경/변환에 대한 설명
  • 서열 ID 번호: 프로젝트에서 변환된 요소의 관련 서열 ID 번호

변경된 데이터 보고서의 예

이 시점에, 프로젝트 홈 보기로 돌아가거나 이러한 변경의 보고서를 PDF 형식으로 인쇄할 수 있다. PDF 파일을 다운로드/인쇄하는 방법에 대한 지침은 서열 목록 표시 섹션을 참조하라.

반대로, 서열 목록 파일에 오류가 있는 경우, 가져오기 프로세스가 실패할 수 있다. 이 경우 가져오기를 시도한 후, 가져오기 중에 오류가 발생했음을 표시하는 빨간색 배너로 알린다.

가져오기에 실패했음을 나타내는 빨간색 배너

참고: 이 도구는 100,000개의 서열 임계값 제한에서 가장 잘 수행된다. 대규모 서열 목록을 처리할 때, 다음 해결 방법을 수행할 수 있다: 가져올 서열의 특정 범위를 선택한 다음 범위 별로 프로젝트 내로 이러한 서열을 가져오기 함으로써 가져오기 프로세스를 일련의 단계로 분할한다. (예를 들어, ~100,000개의 서열의 서열 목록을 10 x 10,000개의 서열의 시리즈로 분할할 수 있으며 이들을 하나씩 가져올 수 있다. 처음 10,000개는 프로젝트 생성에 사용된다.


서열 목록 검증

프로젝트 보기의 오른쪽 상단에 있는 “서열 목록 검증” 버튼을 클릭하여 ST.26 서열 목록 파일을 검증할 수 있다.

오른쪽 상단의 버튼을 클릭하여 서열 목록의 유효성을 검사

서열 목록이 검증을 통과하면, 표시된 대로 배너가 나타난다.

파란색 배너는 서열 목록이 유효함을 나타낸다.

서열 목록이 검증에 실패하면, 예에 표시된 표에 검증 오류가 나열된 검증 보고서가 브라우저에서 열린다. 파일을 다른 위치에 복사하려는 경우 HTML 파일의 위치가 XML 검증 보고서와 함께 표시된다.

IE 브라우저를 사용하는 경우, 형식이 올바르게 로드되도록 하려면 컴퓨터에서 내부 스크립트가 실행되도록 허용해야 한다. 그렇지 않으면, 서열이 표준 형식으로 표시되지 않고 가독성이 떨어진다.

서열 목록의 검증을 위해, ST.26 파일이 다음 요건을 준수해야 한다는 것을 참고하라:

  • UTF-8로 인코딩되어야 하며 XML 1.0 사양에 따라 유효한 문자를 포함해야 한다.

  • 다음과 같은 DOCTYPE 라인을 포함해야 한다:

<!DOCTYPE  ST26SequenceListing  PUBLIC "-//WIPO//DTD    Sequence Listing   1.3//EN" "ST26SequenceListing_V1_3.dtd">

파일은 DTD 파일 ST26SequenceListing_V1_3.dtd를 준수해야 한다.

프로젝트 삭제

프로젝트를 가져오려면, 프로젝트 홈에서 시작해야 한다.

삭제하려면 휴지통 아이콘을 클릭

삭제하고자 하는 프로젝트 홈 표 내의 행에서 휴지통 아이콘이 있는 버튼을 클릭한다.

팝업에서 "삭제" 를 클릭하여 선택한 프로젝트를 삭제할 것인지 확인한다.

프로젝트 삭제를 희망



2.2 프로젝트 세부 사항 보기

프로젝트 세부 사항 보기에는 단일 특허 출원 또는 서열 목록에 한정된 모든 정보가 포함되어 있다. 일반 정보와 서열 데이터의 두 섹션으로 나뉜다. 상단에는 다음을 포함하여 프로젝트에 대한 기본 정보가 포함된 표 가 있다:

  • 프로젝트의 이름
  • 프로젝트 생성 날짜 및 시간
  • 프로젝트에 대한 마지막 업데이트 날짜 및 시간
  • 프로젝트 상태 (가능한 값: "new"/"modified"/"generated"/"invalid"/"valid"/"warnings") - 이것은 편집 가능한 필드가 아님!
  • 프로젝트 설명 – 선택 사항
  • 가져온 파일의 이름 (프로젝트를 가져온 경우)
  • 자유 텍스트에 대한 원본 자유 텍스트 언어 코드
  • 서열의 수 (레이블: "서열")
  • CDS 특징이 작성될 때(프로젝트 수준 기능) 번역 한정자의 자동 추가를 호출하기 위한 체크박스
  • 비영어 자유 텍스트 언어

상단의 프로젝트 메타데이터를 확인

메뉴에는 두 가지 레벨이 있는데, 첫 번째는 프로젝트 세부 사항 보기의 데이터와 관련된 메뉴(노란색으로 표시됨)이고, 두 번째는 프로젝트와 관련된 다른 보기로 이동하는 내비게이션 메뉴(파란색으로 표시됨)이다. "프로젝트 홈으로 돌아가기"를 클릭하여 프로젝트에서 나갈 수 있다.

내비게이션 메뉴의 경우, 프로젝트 세부 사항 페이지에서 액세스할 수 있는 6가지 상이한 보기가 있다:

  1. 프로젝트 세부 사항 보기(현재): 프로젝트 이름과 함께 표시됨
  2. 검증 보고서 보기에서 검증 보고서에 액세스할 수 있음
  3. 언어-종속 한정자 보기에서 언어 종속 자유 텍스트 한정자가 액세스되고 내보내기/가져오기될 수 있음
  4. 보고서 가져오기 보기에서 보고서 가져오기에 액세스할 수 있음
  5. 서열 목록 표시 보기에서 사람이 읽을 수 있는 형식의 생성된 26개의 서열 목록에 액세스할 수 있음
  6. 도움말 메뉴는 사용 설명서 및 WIPO Sequence 및 ST.26 지식 베이스에 대한 참조를 포함함
  7. 환경 설정 보기는 WIPO Sequence의 인스턴스의 모든 프로젝트와 관련이 있음

프로젝트를 인쇄하려면, 원하는 프로젝트의 프로젝트 세부 사항 보기를 입력하고 보기의 상단에 있는 "인쇄" 버튼을 클릭해야 한다.

다음으로, 프로젝트에서 인쇄하려는 정보를 명확히 하기 위해 2개의 체크박스가 표시된다: 일반 정보 및/또는 서열 정보.

상단의 프로젝트 메타데이터를 확인

“서열 인쇄”를 선택한 경우, “서열 IDs” 필드 내에 ID 번호의 범위를 지정하여 인쇄할 서열을 지정하거나, 이 필드를 공백으로 남겨서 모두를 간단히 인쇄하는 선택을 한다.

기본적으로, 프로젝트의 서열들의 총 수는 범위로 표시된다.

프로젝트 내보내기

프로젝트 데이터를 백업하기 위해 프로젝트를 .zip 파일로 내보내거나, WIPO Sequence가 설치된 다른 데스크톱 컴퓨터로 가져올 수 있다. 간단히 "내보내기" 버튼을 클릭하고 .zip 파일을 저장할 위치를 선택하세요. 내보내기가 성공하면, 다음과 같은 파란색 배너가 표시된다:

프로젝트가 성공적으로 내보내졌음을 나타내는 파란색 배너 표시

다른 프로젝트를 현재 프로젝트로 가져오기

도구에 저장된 다른 프로젝트의 정보를 현재 열려 있는 프로젝트로 복사할 수 있다. 가져온 정보는 "일반 정보" 섹션, "서열" 섹션, 또는 둘 모두에 대한 것일 수 있다. 가져온 일반 정보는 프로젝트의 현재 기존 일반 정보를 대체하고, 가져온 서열은 프로젝트 내의 현재 서열 목록에 첨부된다.

다른 프로젝트 데이터를 현재 프로젝트로 가져오는 것을 표시

표시된 드롭-다운에서 정보를 가져오려는 프로젝트를 먼저 선택해야 한다. 프로젝트의 일반 정보 섹션에 제공된 세부 사항 중 일부를 포함시킬지 여부와 또한 프로젝트로 가져올 서열을 지정하기 위해 서열 ID 번호 범위를 제공하여 서열을 가져올지를 선택할 수 있다. 기본적으로, 프로젝트의 서열들의 총 수는 범위로 표시된다.

일반 정보 체크박스가 선택되면, 둘 모두의 프로젝트의 전체 일반 정보 섹션을 표시하는 표가 나타난다: 현재 선택된(대상) 프로젝트와 가져온 프로젝트 (대안) 그 후, 어떤 일반 정보 요소를 가져온 해당 프로젝트의 일반 정보로 교체할지 선택해야 한다.

마지막으로, 프로젝트로 가져올 일반 정보 요소 및 서열을 결정했으면, 파란색 "프로젝트 가져오기" 버튼을 클릭해야 한다. 구성 요소를 올바르게 가져온 경우 파란색 배너가 나타난다.

프로젝트 검증

서열 목록을 ST.26-준수 XML 파일로 생성하기 전에, 프로젝트는 미리 검증 체크를 수행한다. 이 단계는 항상 서열 목록을 생성하기 전에 수행되지만 자체적으로 수행될 수 있다.

프로젝트를 검증하려면, 프로젝트 세부 사항 보기의 상단에 있는 "검증" 버튼을 클릭해야 한다.

프로젝트 유효성 검사 버튼을 표시

검증이 완료되면, 생성될 수 있는 모든 검증 오류/경고를 표시하는 "검증 보고서" 보기로 이동한다. 유효성 검사가 성공적으로 완료되면, 파란색 배너가 표시된다.

검증 프로세스에서 오류 또는 경고가 발견되면, 발견된 검증 규칙 및 위반된 지침을 자세히 설명하는 표를 포함하는 검증 보고서가 생성된다. 각 행은 이 오류가 해결되어야 하는 오류인지, 또는 무시할 수 있는 경고인지를 확인한다.

확인 보고서 예시

서열 목록을 생성한다

프로젝트에서 수행할 수 있는 마지막 작업이며 아마도 가장 중요한 작업은 서열 목록을 작성하는 것이다. 서열 목록을 작성하려면, 프로젝트 세부 사항 보기의 상단에 있는 파란색 “서열 목록 작성” 버튼을 클릭해야 한다. 그러면 프로젝트에서 먼저 실행될 검증 처리가 자동으로 트리거된다.

프로젝트가 검증 처리를 통과하면, 작성된 ST.26 준수 서열 목록 (.xml)을 저장할 위치를 선택할 수 있는 대화 상자가 열린다.

서열 목록 프로토콜을 생성

프로젝트가 검증에 실패하면, 검증 보고서 보기가 대신에 빨간색 배너와 함께 표시된다. 프로젝트가 유효하면, 파란색 배너가 표시된다.

생성된 서열 목록의 예

서열 목록 표시

WIPO Sequence를 사용하면 XML보다 사람이 읽기 쉬운 형식의 서열 목록을 생성할 수 있다. 서열 목록이 생성된 후, XML 파일은 HTML 형식으로 표시되거나 텍스트 파일로 내보낼 수 있다. 인터넷 브라우저를 사용하여 표시된 HTML 형식 서열 목록을 PDF 파일로 저장할 수도 있다. 내보내기 기능은 "서열 목록 표시" 보기에서 액세스할 수 있다.

주어진 프로젝트에 대해 서열 목록이 성공적으로 생성되지 않은 경우, 서열 목록 표시 보기는 "서열 목록 표시" 및 ".txt 파일로 서열 목록 내보내기" 버튼을 비활성화하고, 오류를 보게 된다.

언어 종속 자유 텍스트 한정자

프로젝트에서 "자유 텍스트" 값을 허용하는 한정자는 프로젝트 페이지의 "언어 종속 한정자" 보기 내에서 추가로 참조된다. 현재 프로젝트에 언어 종속 한정자가 추가될 때마다 한정자가 이 보기에도 표시된다.

'한정자 이름' 값을 클릭하면 표 아래에 편집 패널이 있는 오버레이가 열리고 한정자와 연결된 번역된 자유 텍스트 값을 수정할 수 있다.

자유 텍스트 한정자의 XLIFF 파일 형식 내보내기를 위해 원본 언어 코드와 대상 언어 코드를 제공해야 한다. 번역된 값은 XLIFF 파일을 다시 가져오기 전에 번역자가 제공해야 한다.

"비영어 한정자 값" 열에 나타나는 번역된 한정자 값은 비영어 자유 텍스트 언어 코드에 의해 지정된 선택된 언어에 해당함을 주목해야 한다.

"자유 텍스트 한정자 가져오기" 버튼을 클릭하면, 도구는 가져올 "XLIFF" 파일을 찾고 선택하기 위해 검색할 수 있게 파일 탐색기를 연다. 출발어 값과 도착어 값 간의 올바른 맵핑을 수행할 수 있도록 여러 유효성 검사 단계가 제공된다.

XLIFF 파일에서 자유 텍스트 한정자 가져오기

선택한 파일은 XLIFF 형식이어야 하며 다음 데이터 항목을 포함해야 한다:

  • 프로젝트 명칭
  • 대상 언어 코드
  • 소스 언어 코드
  • 각 XLIFF 유닛 요소의 경우:
    • 한정자의 고유 ID (형식: 문자 'q'가 앞에 오는 숫자)
    • 소스 언어 태그의 한정어 값
    • 대상 언어 태그의 한정어 값

가져오려고 선택한 파일을 확인하면, 도구는 일련의 검증 단계를 확인하여 계속 진행할 것인지 확인하도록 요청한다:

  • 시스템은 입력 파일의 프로젝트 이름을 선택된 프로젝트 이름과 비교한다.
  • 시스템은 임의의 한정어가 맵핑될 수 없는 경우를 알린다.
  • 시스템은 소스 언어 및 한정어 값과 관련된 변경 사항을 알린다.
  • 시스템은 대상 언어 및 한정자 변환 값과 관련된 변경 사항을 알린다.

이 단계를 완료하면, 언어 종속 자유 텍스트 한정자에 대해 이전 값과 현재 가져온 값이 자세히 표시된 가져오기 보고서와 함께, 상단에 파란색 배너가 표시된다: "성공: 자유 텍스트 한정자를 성공적으로 가져오기 했습니다." 사용자는 "자유 텍스트 한정자로 돌아가기"를 클릭하여 자유 텍스트 한정자 보기로 돌아갈 수 있다.

XLIFF 형식으로 자유 텍스트 한정자를 내보내기

사용자가 보기의 상단에 있는 "자유 텍스트 한정자 내보내기" 버튼을 클릭한 경우, 대화 상자에서 파일 이름 및 위치를 선택하여 한정자 텍스트 파일을 저장한다. 프로젝트의 모든 자유-텍스트 한정자가 내보내져 XLIFF 파일 형식으로 저장된다.

이 파일에는 다음이 포함된다:

  • 프로젝트 소스 언어
  • 프로젝트 대상 언어
  • 자유텍스트 한정자
  • 변환된 한정자 자유 텍스트 값
  • 표에 제공된 관련 한정자 및 특징 정보

적절한 변환 값을 제공한 후에 다시 도구에서 이 XLIFF 포맷 파일을 보고 편집하여 가져올 수 있다.

프로젝트 데이터 입력

프로젝트는 생성된 서열 목록과 동일한 방식으로 일반 정보와 서열 데이터의 두 섹션으로 나뉜다. 데이터를 잘라내어 프로젝트에 붙여 넣거나 다른 프로젝트 또는 서열 목록에서 데이터를 가져올 수 있다. 일반적으로 연필 아이콘을 클릭하면 프로젝트 필드를 편집할 수 있다. 필수 필드는 별표("*")로 표시된다.

일반 정보

일반 정보 섹션에서는 특허 출원 자체와 관련된 정보를 입력할 수 있으며, 이는 생성된 서열 목록을 이 출원과 관련시키는 데 사용된다. 첫 번째 하위 섹션인 출원 식별은 선택한 프로젝트의 특허 출원 상태 및 정보와 관련된다. 아래 지침은 이 섹션에서 제공해야 하는 정보를 단계별로 안내한다.

1  단계: 출원 식별

출원 식별 하위 섹션 내의 정보를 편집하려면 하위 섹션의 오른쪽에 강조 표시된 연필 아이콘을 클릭한다. 이후 다음 단계에 따라 정보를 제공해야 한다:

  1. 출원 번호가 이미 할당된 출원의 경우, 사용자는 출원이 제출된 특허청 (IP 관청)의 코드를 선택해야 한다. 이것이 WIPO 표준 ST.3 코드이다.
  2. 출원 번호를 이미 받았는지, 아니면 출원인 파일 참조를 제공했는지를 적절한 라디오 버튼을 선택하여 선택해야 한다.
  3. 출원 번호가 없는 경우, 이 필드에 출원인 파일 참조를 제공해야 한다.
  4. 출원 번호가 이미 할당된 경우, 제공된 출원 번호를 입력해야 한다.
  5. 날짜가 지정된 경우 출원 제출일을 날짜 선택기로 선택한다.
  6. 파란색 "저장" 버튼을 클릭한다.

표시된 예에서는 모든 옵션 값이 입력되었다:

출원 식별 필드를 보여주는 스크린샷

참고: 필수 값이 입력되었더라도 "출원 식별 번호가 없다"라는 경고가 확인 보고서에 항상 표시된다. 출원 번호가 지정되었다면, 그 출원 번호는 필수이다.

2 단계: 우선권 출원/(복수)

다음으로, 현재 출원과 관련된 우선권 출원이 있는 경우, 우선권 출원 하위 섹션에 이러한 세부 사항이 입력된다. 프로젝트에 우선권 출원을 추가하려면, 일반 정보 섹션에서 "최초 우선권 식별 추가" 버튼을 클릭해야 한다.

현재 선택된 우선권 출원을 가장 빠른 출원으로 설정하려면, “선택된 가장 빠른 우선권 출원” 드롭-다운에서 “예”를 선택해야 한다. 그러면 서열 목록이 생성될 때 이를 가장 빠른 우선권 출원으로 설정하거나 수정한다. 완료하려면, 파란색 "가장 빠른 우선권 출원 추가" 버튼을 클릭한다.

우선권 출원 필드를 보여주는 스크린샷

3 단계: 출원인/발명자

새로운 출원인 또는 발명자에 대한 데이터를 프로젝트에 추가하려면, 프로젝트 세부 사항 보기의 일반 정보 섹션에서 “발명자 추가” 또는 “출원인 추가” 버튼을 클릭해야 한다. 이 두 작업을 수행하는 단계가 동일하므로 일반적인 지침만 제공하지만, 출원인과 발명자 둘 모두가 포함되는 경우, 출원인이 또한 발명자인 경우에도, 이 프로세스를 2회 반복해야 한다.

버튼을 클릭하면 두 개의 라디오 버튼이 있는 오버레이가 열린다. "기존 출원인/발명자"가 선택된 경우, 데스크탑 도구의 로컬 인스턴스 내에 현재 저장된 개인 및 조직을 나열하는 드롭-다운 상자에서 현재 저장된 개인 및 조직을 선택할 수 있다.

"신규 출원인/발명자"를 선택한 경우, 새로운 사람/조직을 생성할 때 필요한 세부 사항을 입력해야 한다.

세부 사항이 완료되면 "출원인 추가" 또는 "발명자 추가" 버튼을 클릭한다.

새 출원인 또는 발명자 추가를 보여주는 스크린샷

참고: 서열 목록이 유효한 것으로 간주되려면, 한 명의 출원인만 필요하다. 따라서 한 명의 출원인 및/또는 발명자를 기본으로 표시해야 한다. 이것은 작성된 서열 목록에 나타날 출원인/발명자이다.

4 단계: 발명의 명칭

마지막 단계는 일반 정보 섹션에 "발명의 명칭"을 추가하는 것이다.

새로운 발명의 명칭을 추가하려면:

  1. "발명의 명칭 추가" 버튼을 클릭한다.
  2. 표시된 오버레이에서, 발명의 명칭을 입력해야 하며 명칭이 제공되는 언어도 표시해야 한다.
  3. 파란색 "발명의 명칭 추가" 버튼을 클릭한다.

새 발명의 명칭 추가를 보여주는 스크린샷

WIPO ST.26에 따르면, 서열 목록에는 출원 언어로 제공된 발명의 명칭이 있어야 한다. 그러나 프로젝트는 또한 선택적으로 하나 초과의 발명의 명칭을 추가 언어로 포함할 수 있지만, 언어당 하나의 발명의 명칭만 포함할 수 있다. 각각의 새로운 발명의 명칭은 위의 단계들을 이용하여 추가될 수 있다.

서열 데이터

프로젝트 세부 사항 보기의 "서열" 섹션은 서열 자체와 관련된 기술 정보를 제공하는 곳이다. WIPO Sequence는 프로젝트 내에서 서열을 수동으로 생성, 가져오기 및 삽입하는 것을 포함하는, 서열 데이터를 채울 수 있는 다양한 수단을 제공한다. 아래 하위 섹션은 이러한 작업을 수행하기 위해 필요한 단계들에 대한 추가 세부 사항을 제공한다.

서열 작성

프로젝트에서 서열을 생성하는 절차는 다음과 같다:

  1. "새로운 서열 작성" 버튼을 클릭한다. "서열 패널"이 초점이 맞춰진다.
  2. "서열 이름" 필드에 원하는 이름을 입력하여 서열 이름을 지정한다. 또는 "서열 이름" 필드를 비워두면 WIPO Sequence가 새 서열에 기본 이름을 자동으로 지정한다. 기본 이름은 "Seq"로 시작하며, 그 뒤에 순차적으로 증가하는 숫자("Seq_1", "Seq_2", "Seq_3")가 붙는다.

    주의: "서열 이름"의 목적은 사용자가 프로젝트 내에서 서열을 더 쉽게 구분할 수 있도록 돕기 위한 것이며, 이 이름은 서열 목록 XML 파일에는 나타나지 않는다.


  3. "분자 유형*" 드롭다운 상자를 사용하여 WIPO ST.26에서 허용하는 세 가지 분자 유형("DNA", "RNA", "AA") 중 하나를 선택한다. "DNA" 및 "RNA" 세그먼트 모두를 사용하여 서열을 생성하려면, "DNA"를 "분자 유형"으로 선택해야 한다.
  4. "잔기*" 필드에 서열 잔기를 입력하거나 붙여넣는다.
  5. 주의: 서열이 뉴클레오티드 서열("DNA" 또는 "RNA")인 경우 WIPO ST.26, 부속서 I, 표 1에 나열된 기호(a, c, g, t, m, r, w, s, y, k, v, h, d, b, n)만 허용된다. 기호 'u'는 사용할 수 없다는 점에 유의한다. 대문자로 입력한 기호는 소문자로 변환된다. 비문자 기호(공백, 숫자, *, -, 등)가 입력되면 자동으로 제거된다.

    서열이 아미노산 서열("AA")인 경우, WIPO ST.26 부록 I, 표 3에 나열된 기호(A, R, N, D, C, Q, E, G, H, I, L, K, M, F, P, O, S, U, T, W, Y, V, B, Z, J, X)만 사용 가능하다. 한 글자의 아미노산 기호만 사용할 수 있는 점에 유의한다. 아미노산 서열이 세 글자의 아미노산 기호로 표시되어 있는 경우(예: Met-Arg-Leu-Trp-Ile), "잔기" 필드에 입력하거나 붙여넣기 전에 반드시 한 글자 기호로 변환해야 한다.p>


  6. "유기체 이름*" 필드에 출처 유기체 이름을 입력하거나 붙여넣는다. 미리 정의된 유기체 이름 목록에서 유기체 이름을 선택하려면, 유기체 이름을 입력하기 시작하면 드롭다운 목록이 자동으로 나타난다. 원하는 유기체 이름이 목록에 있으면 선택한다. 목록에 원하는 유기체 이름이 없는 경우, 도구에서 로컬에 저장된 사용자 지정 유기체 데이터베이스에 해당 유기체를 추가하라는 메시지가 표시될 수 있다.
  7. 분자 유형이 "DNA" 또는 "RNA"인 경우, 3단계에서 선택한 분자 유형에 적합한 값들로 채워질 "한정자 분자 유형" 드롭다운 박스에서 특정 분자 유형을 선택해야 한다. 분자 유형이 "AA"인 경우, "한정자 분자 유형"은 자동으로 "단백질"로 설정된다는 점에 유의한다.
  8. 만약 "의도적으로 생략된 서열로 표시" 상자를 선택하면, 해당 서열은 결과로 생성되는 서열 목록 XML 파일에 "의도적으로 생략된 서열"로 포함되면, 이는 WIPO ST.26 문단 58에 명시된 형식으로 표시된다. "n"이 아닌 뉴클레오티드 잔기가 10개 미만이거나 "X"가 아닌 아미노산 잔기가 4개 미만인 서열을 저장하려면, "의도적으로 건너뛴 서열로 표시(Mark as an intentionally skipped sequence)" 박스에 반드시 체크해야 한다. 서열을 의도적으로 건너뛰면, "서열 패널"은 필수 요소에 대한 값을 제공하는 모든 제한을 제거하며, 최종 저장된 서열은 프로젝트 유효성을 검사할 때 무시된다.
  9. 서열의 분자 유형이 "DNA"인 경우, "서열에 DNA와 RNA 단편이 모두 포함되어 있음"이라는 레이블이 붙은 상자가 표시된다. 해당 서열에 DNA와 RNA 단편이 모두 포함된 경우, 이 상자를 선택하면 DNA/RNA 하이브리드를 설명하는 데 필요한 WIPO ST.26 문단 55에서 요구하는 기능을 쉽게 추가할 수 있다. "서열에 DNA와 RNA 단편이 모두 포함되어 있음"을 표시하면, "서열 패널"이 확장되어 "misc_feature" 기능을 갖는 DNA 및 RNA 세그먼트를 각각 설명할 수 있는 필드가 추가된다. 각 단편에 대해, "분자 유형" 필드의 드롭다운 메뉴에서 "DNA" 또는 "RNA"를 선택한 후, "위치" 필드에 해당 위치를 입력한다. 선택적으로 "추가 텍스트" 필드에 추가 텍스트를 입력할 수 있다. "새 'misc_feature' 기능 추가" 버튼을 클릭하면 필요한 만큼 이러한 기능을 추가로 생성할 수 있다. 서열 전체 길이가 “misc_feature” 기능 키로 완전히 표시되어야 하며, 각각의 모든 잔기가 “DNA” 또는 “RNA”로 명시되어야 한다는 점에 유의한다.
  10. 서열을 완료하고 저장하려면 회색 “서열 생성” 버튼이나 파란색 “서열 생성 및 표시” 버튼을 클릭한다. 파란색 “서열 생성 및 표시” 버튼을 클릭하면, 접을 수 있는 서열 디스플레이가 서열 작성 후 값을 검토할 수 있도록 열린다. 해당 서열은 프로젝트 세부정보 보기 화면의 서열 섹션 아래에서 확인할 수 있다.

새로 작성된 서열은 사용 가능한 다음 서열 ID 번호와 함께 서열 목록의 마지막 위치에 올 수 있다. 이러한 단계에 따라 목록에서 서열의 위치를 다시 정렬할 수 있다.

서열 가져오기

서열을 파일에서 프로젝트로 직접 가져올 수도 있다. 허용되는 파일 형식은 섹션 3에 나열되어 있다. 입력 파일이 선택된 경우, 데스크탑 도구가 파일에 사용된 형식을 자동으로 탐색한다.

  1. 시작하려면 "서열 가져오기" 버튼을 클릭한다.
  2. "파일 [.txt, .xml] 업로드"를 클릭한다. 대화 상자가 열리면, 가져올 서열 데이터를 포함하는 파일을 선택한다. 데스크탑 도구는 사용 중인 형식을 탐색하며 가져올 때 몇몇 검증 검사를 수행한다. 도구가 프로젝트로 서열 가져오기를 허용할 5개의 형식이 있다: 원시, 다중-서열, FASTA, ST.26 및 ST.25.
  3. WIPO ST.25 또는 ST.26 형식의 파일을 선택하는 경우, 먼저 "범위 서열 선택" 체크박스가 표시된다. 선택하면, 파일에 있는 각 서열의 서열 ID 번호들 및 이들이 프로젝트에 제공된 서열 목록에 첨부될 순서를 나열한 표가 열린다. 모든 서열을 프로젝트로 가져오기를 원하지는 않는 경우, 원하는 서열 ID 번호의 범위를 제공할 수 있다. 단일 서열 뿐만 아니라 콤마로 분리된 서열 목록 또는 x-y 형식의 서열 범위를 입력할 수 있다. 예를 들어: “1, 3, 7, 13-20, 30-50”.
  4. 다중-서열 형식 파일을 가져오는 경우, "서열 범위 선택 ID" 체크박스를 볼 것이며, 선택하면, 파일에 있는 해당 서열의 서열 ID 번호와 각 서열의 세부 사항을 표시하는 미리보기 표가 표시된다: 서열 이름, 분자 유형 및 유기체 명을 포함한다. 프로젝트 내의 서열 목록으로 가져오려는 서열 ID 번호의 범위를 선택해야 한다. 기본적으로, 선택된 서열 목록 파일의 서열들의 총 수는 범위로 표시된다.
  5. 서열 가져오기 프로세스에서 허용되는 마지막 두 형식은 원시 및 FASTA 파일 형식이다. 이 형식들은 파일 당 하나의 서열만을 정의한다. 가져오기를 위해 원시 또는 FASTA 파일을 선택하면, 도구가 관련 패널을 표시한다. 필수 필드를 제공하여 진행해야 한다.
  6. 성공적인 가져오기 후, 도구는 “보고서 가져오기” 보기를 탐색한다.

서열 삽입

서열 목록의 특정 위치에 서열을 삽입하려면, "서열 삽입" 버튼을 클릭해야 한다. 그러면 오버레이 패널이 나타난다. 서열을 작성하는 데 필요한 모든 정보를 채우는 것에 추가로, 패널의 좌측 상단에, 서열 목록에서 서열이 나타나야 할 위치를 입력해야 한다. 완료하려면, “서열 삽입” 또는 “서열 삽입 & 표시” 버튼을 클릭할 수 있다.

목록에 새 서열을 삽입하는 과정을 보여주는 동영상

서열 재정렬

다음 동영상에 표시된 단계를 사용하여 프로젝트에 제공된 서열 목록 내에 서열이 나타날 순서를 재구성할 수 있다.

목록에 서열을 재정렬하는 과정을 보여주는 동영상

일괄 편집

연필 아이콘을 클릭하여 각 서열을 하나씩 편집할 수 있지만, 여러 서열에 대해 변경이 필요할 때는 일괄 편집 기능을 사용할 수 있다. 서열에 개별적으로 들어가서 편집할 수 있지만, 서열이 많은 프로젝트에서는 실행 불가능하다. 이러한 방식으로 편집할 수 있는 필드는 여러 가지가 있으며 추가의 세부 사항은 아래에서 확인할 수 있다.

  1. "일괄 편집" 버튼을 클릭하여 시작한다.
  2. 드롭-다운 목록에서 "일괄 편집 유형"을 선택한다.
  3. "한정자 분자 유형"을 선택하면, 시스템에서 일괄 편집을 적용할 핵산 서열 유형을 선택하라는 메시지를 표시한다. 시스템은 또한 유기체 = "synthetic sequence"인 서열에 대한 한정자 "mol_type"이 "다른 DNA" 또는 "다른 RNA"여야 하며, 이러한 값을 변경하면 프로젝트 검증에 오류가 발생한다는 경고를 표시한다. 시스템은 지정된 특성을 가진 일괄 편집을 위한 서열의 미리 보기를 표시한다. 편집 동안, (아미노산 서열에 대한 동일한 값이 시스템에 의해 "단백질"로 자동 설정되기 때문에) 시스템은 오직 핵산 서열만이 한정자 "mol_type"의 값을 편집할 수 있음을 알린다.
  4. '유기체'를 선택한 경우, 편집할 서열 ID의 범위를 입력해야 한다. 그런 다음 유기체의 값을 "합성 구조"로 수정하도록 선택한 경우, 시스템은 서열 분자 유형(예: DNA)에 따라 한정자 "mol_type"이 자동으로 "다른 DNA" 또는 "다른 RNA"로 변경된다는 알림을 표시한다.
  5. "특징"을 선택한 경우, 기존 특징을 편집할지, 새로운 특징을 추가할지 지정해야 한다. 편집할 "분자 유형"과 서열 ID의 범위를 입력해야 한다.
    • 예를 들어, CDS 특징 위치 값을 "보완(join(1..30,61..90))"으로 수정하여 일괄 특징 편집 유형을 "특징 편집"으로 선택한 경우, "서열 ID 범위 선택" 텍스트 상자에 관련 서열 ID, "분자 유형", 관련 "특징 키" 및 해당 "특징 위치"를 입력하여 시작해야 한다. 완료하려면, "서열 편집"을 선택한다.
    • 예를 들어, 특징 위치가 "1..4"인 새 "CHAIN" 특징을 추가하여 "특징 추가"로 일괄 특징 편집 유형을 선택하면, "서열 ID 범위 선택" 텍스트 상자에 관련 서열 ID, "분자 유형", 관련 "특징 키" 및 해당 "특징 위치"를 입력하여 시작해야 한다.
  6. "일괄 건너뛰기"를 선택하면, "서열 ID 범위 선택" 텍스트 상자에 건너뛰고자 하는 서열 ID의 범위를 입력해야 한다.
  7. "일괄 삭제하기"를 선택하면, "서열 ID 범위 선택 텍스트 상자에 삭제하고자 하는 서열의 범위를 입력해야 한다.
  8. 모든 일괄 편집 작업의 경우 "서열 편집" 버튼을 클릭하면, 도구는 파란색 배너를 표시하여 작업의 성공을 알린다. 아래에 예시가 나와 있다.

서열 2와 12에 체인 특징 키 추가를 보여주는 비디오

특징 데이터 입력

WIPO ST.26에 따르면, 모든 서열은 이와 관련된 적어도 하나의 "소스" 특징을 가져야 한다. 각 소스 특징에는 두 가지 필수 한정자: "유기체" 및 "mol_type"이 있어야 한다.

특징 표는 3개의 열을 갖는다: 특징 키, 유전자 서열 내에서 특징의 위치 및 개별 서열 특징과 관련된 한정어.

특징 위치는 특징이 존재하는 서열의 세그먼트를 나타낸다. 특징 위치를 지정하는 허용되는 형식은 WIPO ST.26에서 제공되며 다음과 같다:

  • 단일 잔기 번호: x
  • 서열 범위를 구분하는 잔기 번호: x..y
  • 지정된 첫 번째 잔기 번호보다 앞에 있거나 지정된 마지막 잔기 번호 뒤에 있는 잔기: <x, >x, <x..y, x.>y, <x..>y
  • 2개의 인접한 뉴클레오티드 사이의 위치: x^y
  • 사슬간 가교에 의해 연결된 잔기 번호: x..y

위치 연산자는 복잡한 위치 설명을 구성하는 데 사용될 수 있다:

  • "연결 (위치, 위치, ... 위치)": 하나의 연속 서열을 형성하기 위해 위치들이 연결된다(엔드-투-엔드 배치).
  • "순서 (위치, 위치, ... 위치)": 요소들이 지정된 순서로 나타나지만 이러한 요소들을 연결하는 것이 합리적인지 여부에 대해서는 시사하는 바가 없다.
  • "보완 (위치)": 5'에서 3' 방향 또는 5'에서 3' 방향을 모방하는 방향으로 판독될 때, 특징이 위치 기술어에 의해 지정된 서열 범위에 상보적 사슬에 있음을 표시한다.

서열에 새로운 특징을 추가하려면, 선택된 서열의 특징 섹션에 있는 "특징 추가" 버튼을 클릭한다. 한정자가 이 단계에서 특징에 또한 추가될 수 있고; 이들은 다음 섹션에서 더 상세하게 다룬다.

특징 버튼 추가를 보여주는 스크린샷

CDS 특징

CDS 특징 유형은 단백질의 코딩 서열을 설명하는 데 사용된다. CDS 특징은 선택적으로 그것이 속한 서열의 세그먼트의 아미노산 번역을 포함할 수 있다. 이것이 충족되는 경우, 최소 길이 요건은 프로젝트 내에서 별도의 서열로 나타날 것이다. 원래 서열의 CDS 특징 내에는, 번역된 아미노산 서열의 서열 ID에 대한 참조가 "protein_id" 한정자에 제공된다.

서열에 대한 "CDS" 특징을 작성할 때 "번역" 한정자(기본 "유전 코드" 값이 1 – "표준 코드")는 특정 위치로 표시되는 서열의 잔여 청크의 번역의 한정자 값을 사용하여 CDS 특징에 자동으로 추가될 수 있다. 프로젝트 상세 설명 페이지 상단에 있는 기본 정보의 체크박스를 체크하여 관련 "단백질 id" 및 별도의 아미노산 서열을 또한 생성할 수 있다. 그러나, 이 한정자는 필수가 아니므로 생성 후에 삭제될 수 있다. 또한 생성한 관련 번역된 서열 ID를 참조하는 "번역" 및 "단백질_id" 한정자를 수동으로 또한 생성할 수 있다.

참고: 버전 2.1.0부터는, "자동으로 번역 한정자 추가" 확인란이 기본적으로 체크 표시되어 있다.

특징 버튼 추가를 보여주는 스크린샷

CDS 특징 한정어를 자동으로 작성하는 단계는 다음과 같다:

  1. 특정 서열 표시에서, “특징 추가” 버튼을 클릭하고 “CDS”를 특징 키로 선택한다. 기본 정보에서 "자동으로 번역 한정자 추가" 체크박스가 선택되면, CDS 특징이 뉴클레오티드 서열에 추가될 때 자동으로 번역 한정자, 해당 값 및 protein_id 한정자 및 관련된 별도의 아미노산 서열(해당되는 경우)이 추가될 것이다.
  2. 번역 한정자를 수동으로 작성하는 옵션도 있다.
  3. 특징 및 관련 한정자 편집을 완료하면 "특징 작성" 버튼을 클릭하여 이를 저장해야 한다. 그런 다음 서열과 관련된 결과 CDS 특징이 표시된다.

번역 한정자 값이 최소 길이 요구 사항을 충족하면, 도구는 다음 속성을 사용하여 프로젝트에 대한 새 서열을 작성한다:

  • 서열 ID 번호 = 서열 ID 번호에 사용 가능한 다음 값
  • 길이 = 번역된 서열의 길이
  • 서열 이름 = "번역" 한정자의 "서열 이름" 필드에 제공된 값. 이름이 제공되지 않은 경우, 기본 서열 이름이 제공된다 ("Seq_#").
  • 분자 유형 = "AA"
  • 유기체명 = 원래 서열에 제공된 것과 동일한 값
  • 한정자 분자 유형 = "단백질"
  • 서열 잔기 = 원래 서열의 번역된 값

참고: 번역된 서열 작성에 관하여, 별도의 번역된 서열은 최소 4개의 특별히 정의된 잔기가 있는 경우에만 작성된다(예: "AXTG"는 3개 문자로 계산됨). "번역" 한정자를 수정하는 경우, 한정자 값에 4개 미만의 구체적으로 정의된 잔기가 포함되어 있으면, 'protein_id' 한정자와 마찬가지로 관련 서열 번역이 제거된다.

유사 또는 유사 유전자 한정자를 포함할 때 CDS 특징들에 대한 조언:

CDS 기능에 유사 또는 유사 유전자 한정자를 추가할 때 자동 번역이 꺼져 있는지 확인한다. CDS 특징에, 유사 또는 유사 유전자 한정자가 추가될 때 자동 번역이 꺼져 있지 않은 경우, CDS 특징이 업데이트될 때 번역 한정자가 자동으로 추가된다. 이 오류를 수정하려면, 프로젝트의 자동 번역을 끈 후 CDS 특징을 열고 번역 및 "protein_id" 한정자를 삭제한 다음 기능을 업데이트한다.

번역 한정자를 자동으로 생성하고자 하는 경우, 한정자의 패널 편집에서 번역 표 값 및 서열 이름을 설정할 수 있다. 사용자가 특징을 작성하면, 도구가 번역을 수행한 다음 특징 및 번역 값을 갖는 새로운 서열에 "protein_id" 한정어를 추가한다.

특징 위치 또는 한정어 “transl_table”, “transl_except”, 또는 “codon_start” 중 하나가 이의 값을 변경한 경우에만 번역이 다시 수행되며, 이 경우 연결된 서열이 업데이트된다.

참고: 번역 값이 변경되면, 연결된 서열이 이의 값을 자동으로 업데이트한다. 그러나, 연결된 뉴클레오티드 서열이 수정되면, 번역 한정자의 값은 변경되지 않는다. 작성 후 "protein_id" 한정자가 수정되면, 연결된 서열은 원래 서열과의 관련성을 잃는다.

정지 코돈의 사용에 관한 조언:

전형적으로, 정지 코돈은 인코딩된 아미노산 서열의 끝을 나타내는 CDS 특징의 끝에서만 발견되어야 한다. 정지 코돈이 특정 아미노산으로 번역되어야 한다는 것을 나타내는 "transl_except" 한정자가 존재하지 않는 한, 정지 코돈은 CDS 특징의 중간에서 결코 발견되지 않아야 한다.

정지 코돈이 CDS 특징 (아래에서 노란색으로 강조 표시됨)의 중간에서 발견되고, 정지 코돈이 특정 아미노산으로 번역되어야 한다는 것을 나타내는 "transl_except" 한정자가 없는 경우, 도구는 해당 지점에서 번역을 중지해야 하며 번역이 발생하지 않음을 사용자에게 알리는 빨간색 배너가 표시된다.

코딩 서열에 문제가 있음을 알리기 위해 검증 보고서에 오류가 나열되어야 한다.

한정자 데이터 입력

한정자는 특징 키와 특징 위치가 전달하는 정보 외에 특징에 대한 정보를 제공하는 데 사용된다. 한정자가 전달하는 다양한 유형의 정보를 수용하기 위해 세 가지 유형의 값 형식이 있다:

  1. 자유 텍스트
  2. 제어 어휘 또는 열거형 값 (예: 숫자 또는 날짜)
  3. 서열

특징에 대한 한정자를 보려면, 먼저 관련 서열의 특징 표에서 관련 특징을 선택한 다음 연필 아이콘을 클릭하면 오버레이가 열린다.

기존 한정자는 각 행의 오른쪽에 있는 연필 아이콘을 클릭하여 편집할 수 있거나, "한정자 추가" 버튼을 클릭하여 현재 선택된 특징에 새 한정자를 추가할 수 있다.

한정자 오버레이를 보여주는 스크린샷

한정자를 편집하거나 추가할 때, 2개의 필드가 제시된다: "한정자 이름" (드롭-다운 목록에서 선택됨) 및 "한정자 값".

한정어 값 필드는 한정어의 유형에 따라 다른 동작을 갖는다.

  • 사전 정의된 값을 갖는 한정자: 값 필드는 한정자에 대해 사전 정의된 값들 중 하나를 선택할 수 있는 드롭-다운 필드이다.
  • 자유 텍스트가 있는 한정자: 값 필드는 자유 텍스트 필드이다. 영어 값만을 보유하는 한정자 이름 및 한정자 값 외에, 2개의 추가 필드가 나타나 비영어 한정자 값의 언어 코드 (예: 'ru') 및 해당 언어 값을 모두 제공할 수 있다. 언어 코드 필드에는 프로젝트 세부 사항 정보에 입력된 "비영어 자유 텍스트 언어 코드" 와 동일한 값이 할당된다. 수동 입력하거나 XLIFF 파일에서 적절한 관련 언어를 가져와 선택된 각 언어에 대한 일련의 비영어 값을 제공할 수 있다.
  • 사전 정의된 형식의 한정자: 값 필드는 자유 텍스트 필드지만, 입력된 값은 WIPO ST.26 부속서 I, 섹션 6에 제공된 특정 규칙과 일치하는지 확인하기 위해 검증된다.
  • 값이 허용되지 않는 한정자: 한정자 값 필드는 편집할 수 없다.

완료되면, 파란색 "한정자 작성" 버튼을 클릭하여 새로 작성된 한정자를 추가하거나, "저장" 버튼을 클릭하여 기존 한정자에 대한 변경 사항을 저장해야 한다. 마지막 단계로서, 한정자(들)가 추가/수정되면, 계속 진행하기 위해 오버레이의 하단에 있는 "특징 업데이트" 버튼을 클릭해야 한다.

2.3 개인 & 조직 보기

이 보기에서는 로컬에 저장된 모든 사람과 조직을 관리한다.

개인/조직 작성

새로운 개인 또는 조직을 작성하려면, 개인 & 조직 보기에서 시작해야 한다. 표시된 대로, 보기의 상단에 있는 “새로운 개인 또는 조직 작성” 링크를 클릭한다:

새 단체 생성을 보여주는 동영상

새 보기에서, 적어도 새로운 개인/조직의 세부 사항에 해당하는 필수 필드 ('*'로 표시됨)를 채워야 한다. 출원인/발명자의 경우, 이는 이름 (라틴 문자로 제공되는 경우)과 언어만 해당된다.

개인 또는 조직의 이름이 라틴 문자가 아닌 경우, 이름의 라틴 문자 버전을 "라틴어 이름" 필드에 제공해야 한다. 이 정보가 제공되지 않으면, 프로젝트는 ST.26 서열 목록이 검증 또는 생성될 때 검증되지 않는다.

2.4 사용자 정의 유기체 보기

사용자 정의 유기체를 작성, 편집, 가져오기, 내보내기 또는 삭제하려면, 유기체 보기에서 시작해야 한다.

사용자 정의 유기체 작성

로컬에서 새로운 사용자 정의 유기체 생성

새로운 사용자 정의 유기체를 작성하려면, 보기의 상단에 있는 “새로운 유기체 작성” 링크를 클릭한다. 다음 화면에서, 새로운 유기체의 이름을 입력하고 “저장"을 클릭한다. 이 사용자 정의 유기체에 대한 설명이 필요한 경우, 표시된 대로 선택적으로 추가될 수 있다. 세부 사항을 편집하려면, 유기체의 이름을 클릭한다.

사용자 정의 유기체 내보내기

도구에 저장된 모든 사용자 정의 유기체 및 해당 설명을 내보내고 텍스트 파일로 저장하여 도구 외부에서 수정하거나 나중에 가져올 수 있다. 이 목록을 내보내려면, 아래에 강조 표시된 "사용자 정의 유기체 내보내기"를 선택하여 시작한다.

사용자 지정 유기체 내보내기를 희망

이어서, 파일 이름 및 원하는 파일 위치를 선택할 수 있는 대화 상자가 열린다.

대화 상자에 세부 사항을 입력

내보내는 파일은 편집할 수 있고 도구로 가져올 수 있는 유기체의 이름 및 설명을 모두 포함하는 텍스트 파일이다. 예를 다운로드.

사용자 정의 유기체 가져오기

사용자 지정 유기체 가져오기를 희망

먼저, 사용자 정의 유기체 목록을 가져오려면, 보기의 상단에 있는 “사용자 정의 유기체 가져오기” 링크를 클릭해야 한다. 그러면 사용자 정의 유기체 요약 표 아래에 오버레이가 열린다.

  1. “업로드 파일 [.txt]” 버튼을 클릭한다.
  2. 대화 상자 내에서 사용자 정의 유기체명을 갖는 파일을 선택한다.
  3. 마지막으로, 파란색 “사용자 정의 유기체 가져오기” 버튼을 클릭한다.

참고: 가져오려는 파일은 일반 텍스트 (UTF-8)의 사용자 정의 유기체명 목록을 갖는 텍스트 파일(*.txt)이며, 각 항목은 새로운 줄에 표시된다.

2.5 시스템 환경 설정 보기

시스템 환경 설정 보기에서는 WIPO Sequence의 여러 구성 매개변수를 수정할 수 있다. 이 매개변수는 도구에서 작성되거나 편집된 모든 프로젝트에 적용된다.

모든 프로젝트의 환경 설정 업데이트를 희망

시스템 환경 설정을 수정하려면, 위에 표시된 연필 아이콘을 클릭하여 패널 편집을 열어야 한다.

제공된 기본값 업데이트

이 보기에서 수정할 수 있는 구성 항목 목록(순서대로)은 다음과 같다.

  • 표시할 잔기 기호의 최대 수: 이 매개변수는 서열을 표시할 때 행 당 표시될 잔기의 수를 설정한다. 기본값은 60이다.
  • ST.26 서열 목록 파일 (.xml)이 생성되는 기본 위치. 이 위치를 제공할 필요는 없다.
  • 인쇄할 서열의 최대 수(전체를 출력하려면 비워 둠): 기본 값은 1,000이다.
  • 인쇄할 잔기의 최대 수(전체를 출력하려면 비워 둠): 기본 값은 1,200이다.
  • 원본 자유 텍스트 언어 코드: 이 체크 박스를 선택하면, 원본 자유 텍스트 언어 코드가 제공되지 않는 경우 유효성 검증 중에 경고가 표시된다. 기본적으로, 체크 박스는 선택되어 있지 않다.
  • XQV_49 사용: 이 체크 박스를 선택하면, 제공된 언어 종속 자유 텍스트 한정자에 대한 영어 값이 없는 경우 경고가 표시된다. 기본적으로, 체크 박스는 꺼져 있다.
  • 기본 인터페이스 언어: 이는 WIPO Sequence가 시작될 때 인터페이스가 표시될 언어이다. 기본적으로, 인터페이스 언어는 영어이다.

참고: 3번째와 4번째 항목은 프로젝트를 PDF로 인쇄할 때 관련이 있다. 매우 큰 서열 목록의 경우, 결과적인 PDF는 수천 페이지이고 표시하는 것이 불가능할 수 있다.

3. 파일 형식

WIPO 표준 ST.25

WIPO 표준 ST.25 파일의 형식에 대한 세부 사항은 표준을 참조한다.

예시는 표준에 포함된 부록 III에 제공된다.

원시

이 형식은 하나의 서열만을 설명할 수 있다. 유전 코드는 추가 정보 없이 기본 형식으로 작성된다. 가져올 때, 분자 유형, 특징 및 이름을 도구를 통해 서열에 추가해야 한다.

예시:

aggatatagatagtatatgatagtatgatatgatgatgtatgtatagtgtagttatga

다중-서열

다중-서열 형식은 이름, 분자 유형 및 유기체명과 함께, 하나 또는 다중 서열을 설명할 수 있다. "PatentIn"을 사용하여 가져올 수 있는 허용 가능한 형식 중 하나이다. 공백이 아닌 텍스트의 첫 번째 줄은 헤더이며 다음 구성요소로 구성된다:

<SequenceName; SequenceType; OrganismName>

참고: < and > 와 ; 문자는 필수 요소이다 (공백도 필수적임).

헤더의 정보는 WIPO Sequence에 의해 다음과 같이 해석된다:

헤더 항목 허용되는 입력 다음과 같이 해석된다
서열 명칭 서열 이름 (자유 텍스트) WIPO 프로젝트 파일에 있는 서열 이름 (XML 파일의 일부가 아님)
서열 유형 다음 중 하나를 선택한다:
  • DNA
  • RNA
  • AA
"mol_type 유기체 입력에 따라 DNA와 RNA의 mol_type을 추가로 정의해야 한다(ST.26, 단락 75-84)
유기체명 유기체명 (자유 텍스트) 출처/유기체 참고: 입력이 합성 구조인 경우, DNA 및 RNA에 대한 mol_type은 자동으로 "기타 DNA" 또는 "기타 RNA"로 식별된다 (ST.26, 단락 84(a)).

서열 데이터는 헤더의 다음 줄에서 시작된다. 새 서열은 이전 서열의 서열 정보가 끝난 후, 파일에서 새 줄로 표시된다. 서열의 끝과 다음 헤더의 시작 사이에 빈 줄이 하나 이상 있을 수 있다. 아미노산 서열은 한 글자 코드로 구성되어야 한다 (부록 I, 섹션 3, 표 3). 허용되는 뉴클레오티드 기호는 부록 I, 섹션 1 표 1의 기호이다. RNA 서열의 "u"는 ST.26 단락 14 및 19에 따라 요구되는 대로 자동으로 "t"로 변환되지 않으며, 가져오기 후 수동으로 개입해야 한다. RNA 서열이 포함된 파일의 다중-서열 가져오기를 수행하기 전에 "u"를 "t"로 변환하는 것이 좋다.

다음은 다중-서열 형식으로 정의된 3개의 서열 세트의 예시이다.

예시:

<첫 번째 서열; RNA; 알비스 알바> uuuuuauuguuuccuccuacugcuuaucauaaugauugucguaguggcuuccucaucgucucccccaccgccuaccacaacgacugccgcagcggauuacuaauaguaucaccaacagcauaacaaaaagaaugacgaagaggguugcugauggugucgccgacggcguagcagaagagggagggg
<두 번째 서열; DNA; 합성 구조물> attgacgtcagtgacgcggtactgacgtcagctgcagtactgacgtaccaaccacgtggtgagctctcgacatgcaactgactcgtcgctattgacgtcagtgacgcggtactgacgtaccaaccacgtggtgagctctcgacatgcaactgactgacgtcgctcagt
<세 번째 서열; AA; 생쥐> 
SPPGKPQGPPPQGNQPQGPPPPPGKPQGPPPPGNRPQGPPPGKPQGPPPPGDKSRSPR

FASTA

이 형식에는 잔기 및 설명이 포함된다. 가져오는 동안, 설명을 참고 한정자로 저장하는 옵션이 있다:

예시:

AJ011880.1 인공 올리고뉴클레오티드 서열 SSR 프라이머 (CAC13R)
CTCAACAATCTGAAGCATCG

4. 문제 해결

WIPO Sequence는 상단 메뉴에서 액세스할 수 있는 "도움말" 기능을 제공한다.

일반적인 문제 및 해결 방법

가져오기 보고서 또는 유효성 검사 보고서는 프로젝트에 여러 한정자 ID가 포함되어 있음을 나타낸다.

해결 방법: 중복된 한정자 ID가 포함된 특징을 삭제한다. 같은 위치에 특징을 다시 생성하되 저장하기 전에 한정자를 추가하면 안된다. 그런 다음 특징을 편집하여 관련 한정자를 추가하고 특징을 업데이트한다.

Linux 배포판에서 제안된 파일 이름이 올바르지 않다.

Linux 배포판을 사용할 때 알려진 문제가 있다: 추가 "\"가 기본적으로 제안된 파일 이름에 나타난다. 이 문제를 해결하려면 저장하기 전에 추가 "\"를 수동으로 제거한다.

다른 답변은 WIPO Sequence 지식 베이스를 참고하세요.

서열 목록을 HTML 형식으로 표시하려고 할 때 오류가 표시된다.

XML 형식으로 생성된 서열 목록의 크기가 100 Mb보다 크면, HTML 형식으로 서열 목록을 표시하는 대신 서열 목록이 HTML 형식으로 제공되기에는 너무 크다는 오류가 표시된다.

기타 궁금한 점이 있으면 문의하세요.