Chương trình lắp ráp CAP3

CAP3 là thế hệ thứ ba của chương trình hợp ngữ trình tự CAP (Huang 1992). Nó bao gồm một số tính năng mới, bao gồm xác định nhanh các cặp đọc có chồng chéo, cắt các vùng đọc chất lượng thấp 5' và 3', tính toán hiệu quả và đánh giá các chồng chéo, sử dụng các ràng buộc tiến-lùi trong xây dựng các đường viền và tạo của trình tự đồng thuận.

Kết quả từ bốn bộ dữ liệu BAC

Đối với mỗi tập dữ liệu, CAP3 đã tạo ra một chuỗi đồng thuận bằng cách sắp xếp nhiều chuỗi của các lần đọc chồng chéo. Sau đó, trình tự đồng thuận được căn chỉnh với trình tự được cung cấp để tính số điểm khác biệt ở các vùng rất giống nhau của CAP3 và các trình tự được cung cấp.

Trên tập dữ liệu 203, trình tự đồng thuận CAP3 chứa một nhóm lớn 90.292 bp giống với vùng từ cơ sở 516 đến 90.292 (cơ sở cuối cùng) trong trình tự được cung cấp. Trình tự đồng thuận CAP3 dài hơn khoảng 515 bp so với trình tự được cung cấp ở đầu 5' vì CAP3 đã loại bỏ hai cơ sở khỏi trình tự được cung cấp đã bị cắt bớt bởi CAP3.

Trình tự CAP3 này cũng chứa vùng 6934-bp từ cơ sở 120.935 đến 127.868 không thuộc trình tự được cung cấp. Có khả năng CAP3 đặt vùng này ở một vị trí khác với trình tự được cung cấp bởi vì vùng trong trình tự được cung cấp là từ đầu 5' của một số bản sao Alu.

CAP3 cũng tạo ra một nhóm lớn khác là 152.253 bp trên tập dữ liệu 526N18 gần giống với vùng từ cơ sở 78 đến 152.332 trong trình tự được cung cấp. Trình tự CAP3 có tổng cộng 17 khác biệt trong vùng chồng lấp 120.920-bp này. Trong số này, 7 lỗi xảy ra trong một khu vực chỉ có một hoặc hai lần đọc, 1 lỗi trong trình tự được cung cấp và 9 lỗi trong trình tự CAP3 do xếp chồng hai bản sao Alu rất giống nhau trong vùng kết thúc 5' của 550 bp.