本研究探讨了如何利用条形码连锁阅读测序(BLRS)的远程序列信息来改进重复阅读检测。BLRS技术结合了短读长测序的高每碱基准确度与长距离序列信息,可用于绘制复杂基因组区域、执行从头二倍体基因组组装和检测复杂结构重排。本研究设计了一种使用BLRS条形码进行距离估计的新算法,并评估了其在STR基因分型中的应用。使用来自多个BLRS平台的具有STR扩增的基因组的模拟和实验数据,验证了与标准短读长测序相比,条形码和定相信息在获得更好的STR基因型方面的效用。虽然极富GC的STR的覆盖偏差是BLRS的一个重要限制,但BLRS是许多其他STR基因座进行基因分型的有效策略。