# RNA测序读长及测序深度的选择

\ <br>

不同类型的RNA测序实验需要不同的测序读长和测序深度（每个样本的reads数量）。本文旨在对RNA测序的注意事项和RNA测序实验设计的资源进行回顾。

**首先应该查阅哪些资源呢？**

对于RNA测序的评估，通常用到读取深度（read depth）而不是覆盖度（coverage），若要检测低表达基因则需增加读取深度。[ENCODE项目](http://genome.ucsc.edu/ENCODE/protocols/dataStandards/ENCODE_RNAseq_Standards_V1.0.pdf)（[更新版](https://www.encodeproject.org/documents/cede0cbe-d324-4ce7-ace4-f0c3eddf5972/@@download/attachment/ENCODE%20Best%20Practices%20for%20RNA_v2.pdf)）提供了[RNA](https://www.encodeproject.org/data-standards/rna-seq/long-rnas/)和[Small RNA](https://www.encodeproject.org/data-standards/rna-seq/small-rnas/)测序的数据标准，这些标准对于许多项目而言都是极好的资源。

Illumina建议首先参考与您的研究领域和研究生物相关的主要文献，从而获得有关实验设计的最新指南。

**每个样本需要覆盖多少reads呢？**

RNA测序研究的目标决定了读取深度。大多数实验每个样本需要5–200 M reads，具体取决于生物体的复杂度和大小。

* 快速检测高表达基因的基因表达谱实验，每个样本可能只需要5–25 M reads。在这种情况下，可以考虑将多个RNA测序样本混合到一个测序运行的一条泳道中进行测序，从而实现高通量样本数的检测。
* 研究方向是获取更全面的基因表达总体信息及一些可变剪切相关的实验，通常每个样本需要30–60 M reads。很多已发表的用于mRNA /全转录组测序的实验所测的数据量也都在此范围内。
* 若要深度研究转录组或拼接新转录本，可能需要100–200 M reads。在这种情况下，可以考虑将少量样本在多个高通量测序泳道并行测序。
* 靶向RNA基因表达研究需要的reads较少。例如，对于[TruSight RNA Pan-Cancer](https://www.illumina.com/products/by-type/clinical-research-products/trusight-rna-pan-cancer.html)和[TruSight RNA Fusion Panel](https://www.illumina.com/products/by-type/clinical-research-products/trusight-rna-fusion.html)而言，Illumina建议每个样本达到3M reads，可以将多个样本混合后测序。
* miRNA或Small RNA研究需要的reads数比全转录组测序更少。具体的需求根据待测组织类型而不同。 Illumina强烈建议参考相关文献来确定需要多少reads，大多数应用中每个样本需要1–5 M reads。

每张芯片可以测的样本数量 (在考虑足够的index barcode可拆分各个样本数据的情况下)= 每张芯片产生的reads总数 **/** 每个样本所需的reads数。

[覆盖度计算器](https://sapac.support.illumina.com/downloads/sequencing_coverage_calculator.html)可用于计算特定测序run中混入样本的数量（与测序仪器和测序试剂盒有关）

**Reads长度多少合适呢？**

Reads长度取决于具体应用和文库的大小。 [Library Prep Kit Selector](http://www.illumina.com/library-prep-array-kit-selector.html) 提供了每种RNA测序文库read长度的指南。多出插入长度的测序读长不会提供额外有用的数据。

* 基因表达/ RNA 表达谱–编码的转录组定量研究通常需要较短的单端测序（通常为50–75 bp），以最大程度减少跨剪接点的read。
* 转录组分析–为了更完整地覆盖转录本并检测出新的变异或剪接位点，新的转录组拼接和注释项目往往会受益于更长的双端测序（例如2 x 75 bp或2 x 100 bp）。使用Stranded RNA-Seq library preparation 建库试剂盒构建文库并进行双末端测序可以同时获得RNA 5'和3'末端的信息。
* Small RNA分析 – 由于small RNA的长度短，单端测序（通常为50 bp read）基本可以覆盖完整的序列。50 bp 的测序长度涵盖了大多数的Small RNA，和足够长的adapter序列用以在数据分析时准确确认并过滤掉adapter。

其他资源：

更多的关于RNA测序实验设计及制定中的其他考虑因素和RNA测序试剂盒的选择，请访问我们的[培训网站](https://sapac.support.illumina.com/training.html)并查看录制的网络研讨会（”Filters”  > “Training type” > “Training and Videos”  > “Online Training”）

RNA Sequencing Part I: Introduction to Illumina’s RNA library preparation workflows

RNA Sequencing Part II: Best Practices for Illumina’s RNA prep protocols

RNA Sequencing Part III: Introduction to Analysis

Small RNA-Seq Part I: Introduction and Part II: Best Practices

不同测序仪产生的read数量请参考下面链接中每种仪器的性能参数表格：

* [iSeq 100](https://www.illumina.com/systems/sequencing-platforms/iseq/specifications.html)
* [MiniSeq](https://www.illumina.com/systems/miniseq/specifications.html)
* [MiSeq](https://www.illumina.com/systems/miseq/performance_specifications.html)
* [NextSeq 500/550](https://www.illumina.com/systems/nextseq-sequencer/performance-specifications.html)
* [NextSeq 1000/2000](https://www.illumina.com/systems/sequencing-platforms/nextseq-1000-2000/specifications.html)
* [HiSeq 1000/1500/2000/2500](https://www.illumina.com/systems/hiseq_2500_1500/performance_specifications.html)
* [HiSeq 3000/4000](https://www.illumina.com/systems/hiseq-3000-4000/specifications.html)
* [NovaSeq 6000](https://www.illumina.com/systems/sequencing-platforms/novaseq/specifications.html)

\
\
\ <br>

|                                                                                                                                                                                                                                                                                                                                                                              |
| :--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------: |
| *For any feedback or questions regarding this article (Illumina Knowledge Article #7414), contact Illumina Technical Support* [*techsupport@illumina.com*](mailto:techsupport@illumina.com?subject=Question%2FFeedback%20Regarding%20Illumina%20Knowledge%20Article%20#000007414%20-%20Library%20Preparation%20\&body=Dear%20Illumina%20Technical%20Support,%0D%0A%0D%0A)*.* |
