인벤터 퓨전 다운로드

반복으로 인 한 양성 융합을 제거 하기 위해, 우리는 각 융합 점에 걸친 2 23 염기 서 열을 추출한 다음 전체 인간 게놈에 대해 매핑합니다. 결과 선형을 쌍 (염색체 이름, 게놈 좌표 chr14:374384) 목록으로 변환 합니다. 융합 지점에 인접 한 각 23 메 르에 대해, 우리는 다른 23-mer가 동일한 염색체에 10만 bp 내에서 발생 하는지 확인 하기 위해 테스트 합니다. 그렇다면, 그것은 가능성이 반복 하 고 우리는 융합 후보를 제거. 우리는 또한 융합의 적어도 한 쪽에 주석이 달린 유전자 (RefSeq의 알려진 유전자에 근거한)를 포함 하 고, 그렇지 않으면 융합이 걸러 지는 것을 요구 합니다. 이러한 단계 만으로는 실험에서의 융합 후보 수를 105에서 불과 몇 백 개까지 줄였습니다. 융합 유전자를 찾기 위해 개발 된 다른 최근의 계산 방법에는 융합 이벤트를 찾기 위해 읽기 (21 ~ 24 기준 앵커를 사용 하 여)의 두 겹치지 않는 끝을 매핑하는 접합 정렬 기 (15)가 포함 된다. 이는 각 읽기를 여러 조각으로 분할 하는 TopHat 융합과 비슷하지만, 스플리트는 단색 읽기만 지원 합니다. 다른 전략은 트랜스 심 연 [16]에서 사용 되는 것으로, 첫 번째는 심 연 [17]을 사용 하 여 RNA-seq 읽기를 전체 길이의 전사체로 조립 하는 드 노 보 전사체 어셈블러입니다. 조립 단계 후에는 BLAT [18]을 사용 하 여 조립 된 전사체를 매핑하여 융합 지점에서 해당 되는 모든 것을 검색 합니다. 이것은 매우 시간이 많이 소요 되는 프로세스입니다: 후속 맵핑 단계에서 1억4700만 읽기 및 > 130 시간을 조립 하는 데 350 CPU 시간이 걸렸습니다.

쇼트 퓨즈 [19] 그것은 먼저 읽기를 매핑하는 Bowtie를 사용 하는 것이 TopHat 비슷합니다, 하지만 다른 도구 처럼 그것은 읽기 쌍에 의존 하는 위치에 매핑됩니다. FusionSeq [20]은 초기 정렬에 다른 정렬 프로그램을 사용 하지만, 일련의 정교한 필터를 채택 하 여 거짓 긍정을 제거 하는 TopHat 융합과 비슷합니다. 76에 의해 보고 된 후보 융합 체는 4 개의 유방암 세포 주에 있는 BT474-융합에 의해 발견 된 76 후보 퓨전 유전자-4 개의 유방암 세포 주 (SKBR3, KPL4, MCF7)에서, 이전에 보고 된 융합 체를 굵은 글꼴로 표시 하였다. 나머지 51 융합 유전자는 소설 이다. 융합 체는 재료 및 방법에 기재 된 채 점 방식에 의해 분류 된다. BCAS4-BCAS3 및 TOB1 SYNRG에 대 한 융합 읽기 분포를 찾기 위해 단일 엔드 및 쌍 끝 읽기를 사용 하 여 결과를 비교 하는 것입니다. (a) 60은 염색체 (20)에 대 한 BCAS4 유전자에 의해 형성 된 융합 산물을 동정 하 고 BCAS3 유전자를 염색체 17에 의해 정렬 하는 토 팻-융합에의 한 판독. 데이터에는 표시 된 것 보다 더 많은 읽기가 포함 되어 있습니다. 그들은 분산 얼마나 잘 보여주기 위해 축소 됩니다.

삽입 수치는 각 융합 주위에 600-bp 윈도우의 커버리지 심도를 보여줍니다. (b) TOB1 (ENSG00000141232)-SYNRG에 의해 발견 된 새로운 융합 유전자는 융합 지점에 걸쳐 70 읽기 매핑을 여기에 표시 된 TopHat 융합. 녹색에서 읽기 중 일부는 인 트 론 스팬 (오른쪽으로 확장 되는 얇은 수평선으로 표시 됨), TopHat의 스플라이스 정렬 절차에 의해 감지 될 수 있는 기능입니다.