抗ウイルス製品部門への次世代の化合物(シークエンス)のdataの提出のguide

FDAは2019年7月、“抗ウイルス製品部門への次世代の化合物(シークエンス)のdataの提出に関するguideline”と題する「ヌクレオチド配列分析手順および抗ウイルス医薬品開発のための耐性評価」のためのguideを発出しました。

 

Submitting Next Generation Sequencing Data to the Division of Antiviral Products

https://www.fda.gov/media/129126/download

 

この技術的ぐいで文書の目的は、次世代のヌクレオチド配列分析手順および抗ウイルス医薬品開発のための耐性評価を支援するためのデータの申請に関して、FDAの抗ウイルス製品部門(Division)の現在の考え方を提供する。

抗ウイルス製品部門は、耐性の出現に注意が払われ、新しく承認された抗ウイルス医薬品のラベルに記載されていることを確認するために開発中の抗ウイルス医薬品に関連するすべての耐性データを独立して分析を行う。正確な耐性情報を提供することは、他の患者に感染する可能性があり、承認された医薬品では制御できない大きな疾患を引き起こす可能性のある新規耐性および交差耐性ウイルス変異体の出現を防ぐ目的;公衆衛生を維持するために不可欠である。さらに、耐性情報は、抗ウイルス医薬品の使用を監督する医療従事者に重要な指針を提供し、抗ウイルス医薬品部門によって承認された医薬品情報が含まれる。さらに、抗ウイルス製品部門は、異なる集団での対立遺伝子が有効性に影響を与えるかどうかを決定するために、ポリモーフィズム分析のための宿主標的遺伝子のヌクレオチド配列分析のデータを要求することができる。

次世代シーケンシング(NGS)は、スポンサーがシーケンスベースの抵抗性分析を行う際に頻繁に使用する新しい技術である。 この技術は臨床サンプル中のすべてのRNAまたはDNAのヌクレオチド配列を解析するため、NGSは耐性分析プロセスに複雑さに加えられる。 ウイルス集団の平均配列を提供するSangerヌクレオチド配列分析とは対照的に、NGSはウイルス集団内の個々のウイルスについてヌクレオチド配列情報を提供し、しばしばサンプル中の短い配列を数百万または数十億も提供する。 特にこれらの大規模なデータセットを分析するために標準バイオインフォマティクス分析手法が現在存在しないため、データの複雑さのため、レビュー担当者は配列情報の分析および検証・審査の困難に直面している。 

 

詳細は、下記の私訳を参照ください。

2.0 NGS プラットフォームとの接続

スポンサーがシークエンシングプラットフォームの適切な詳細、サンプル調製に使用されるプロトコル、fastqフォーマットの生のNGSデータ、およびデータの分析に使用される方法を申請する際、抗ウイルス医薬品部門はほとんどの標準的なNGSプラットフォームから生成されるヌクレオチドシークエンシングデータを容認する。 プロセスの早い段階でスポンサーには、抗ウイルス医薬品部門と連絡を取り、シーケンスデータを申請する前にこれらの詳細を提供することを推奨する。 さらに、適切なデータ形式とプロセスが受け入れられることを保証するために、正式な申請の前にスポンサーに模擬NGSデータセットを提出することを推奨する。 スポンサーは、NGS申請書類を準備する際に、以下のセクションの情報を検討すること。

 

3、提出する要約情報 

3.1 NGSプロトコルとデータ分析方法 

スポンサーは、サンプル処理とNGS分析手順の詳細なプロトコルを申請・提出する必要がある。 説明を要する特定の方法については、セクション4.0「NGSプロトコル」および「5.0、NGSデータ分析方法と結果の報告について」を参照。

 

3.2 Fastqフォーマットの生のNGSデータ 

スポンサーは、fastq形式で実行された各シーケンスからの生のNGSデータをすべて提供すること。 読み取りマッピングは、.fas、.ace、.sam、または.bam形式で送信可能、これはオプション。 スポンサーは、適切な参照シーケンス(抗ウイルス医薬品部門からの同意を得ること)と参照マッピングに使用されるアクセス番号を提供する必要がある。 ベースラインサンプルまたは関心のある遺伝子への参照マッピングのために、スポンサーはベースラインまたは参照コンセンサス配列を提供し、そしてこの配列がどのようにして得られたかを記述すること。 de novo(新規)のアセンブリの場合、スポンサーはfastqフォーマットで200ヌクレオチドを超えるすべての断片を提出のこと。

スポンサーは、1パーセント以上の確率でベースラインと異なるすべてのアミノ酸置換を報告する頻度表を提出すること。 頻度表の例については、セクション7.0、頻度表の例を参照のこと。

 

3.4要約テーブル 

スポンサーは以下を考慮すること。

  1. 空白の細胞を使用してアミノ酸が参照配列と同一が確認された場合は、基本配列と不適合配列を示す集団ベースの配列決定に用いられる分析可能なウイルス学的耐性データ形式で各研究のデータを提供すること。 スポンサーは、耐性データセットの感度レベル(特定の頻度、すなわち15パーセントで存在するアミノ酸置換を含む表)を設定するか、選択された感度レベルの正当性を証明するために部門と協議することを推奨する。 
  2. 各研究または研究サブグループ(すなわち、遺伝子型別、用量別)についての優勢な代用医薬品の高水準の要約を提示する表を提供する。

3.5 その他data

スポンサーは、事前に 抗ウイルス医薬品部門と相談すること

 

4.0 NGS Protocol 

4.1 General Protocol Design Elements 

4.1一般的なプロトコル設計要素 スポンサーは、NGSプロトコルに次の一般的なプロトコル設計要素を含めるべきです。

  1. 分析対象の被験者、研究時点、およびサンプル行列の説明。
  2. 関連するすべてのパフォーマンス特性を含む、使用されるNGSプラットフォームの説明。 
  3. 分析対象の標的遺伝子領域の名前とサイズ。
  4. 一般的な分析戦略(例えば、原型株と比較した変化の同定、同じ被験者における異なる時点からの配列の比較)。
  5. 試行される範囲レベル 5,000リードを超える範囲のターゲットをお勧めします。 ただし、ウイルス量が少ないサンプルの中には、このレベルの範囲ではアセンブリを生成できないものもあります。 スポンサーは、この範囲の適用範囲に達しなかったサンプルを特定する必要があります。 
  6. シーケンスエラーを特定、フィルタ処理、または処理するために使用されるアプローチの説明。

 

4.2 サンプル準備

信頼性の高いシーケンス結果の鍵はテンプレートの準備にリンクされているので、シーケンスされているサンプルは分析されている母集団を表す。 以下の情報を加える。 

  1. 試料から核酸を抽出する方法。 
  2. 混入汚染バックグラウンド核酸からウイルス配列を精製する方法。 
  3. ウイルス核酸を濃縮する方法。 各サンプルについて、逆転写ポリメラーゼ連鎖反応(RT − PCR)(ウイルスRNA)またはPCR(ウイルスDNA)反応についての推定標的コピー数入力を含める。 
  4. 二次構造を変性するための方法。 
  5. 二本鎖DNA(dsDNA)を生成するための方法。 プライマーの説明を含める。
  6. 配列決定のためにdsDNAを精製するための方法。 
  7. NGSライブラリー調製法
  8. 多重化のためにバーコードを追加するための方法(該当する場合)。

 

注:科学文献に発表されている多くのNGSプロトコルは、シークエンシングのためにdsDNAの濃度を高めるために特異的(アンプリコン)または非特異的(ランダムプライマー)PCR増幅段階を用いる。 しかし、このアプローチは優勢な遺伝子型を増幅しますが、それは時間の経過とともに耐性変異の発生のために重要かもしれないマイナーな変異を検出する可能性は低い。 したがって、NGSの前にPCR増幅ステップを使用するプロトコルは、増幅が標的集団を代表するものであり、マイナーな変異体が依然としてNGSデータに存在するという証拠を提供する。 PCRリサンプリングバイアス、(RT-)PCRおよびシークエンシングエラー(補完的DNAバーコードなど)を修正するアプローチを採用することを推奨。

 

5.0 NGSデータ分析方法と報告結果の説明。 

配列データの提出には、部門がデータの独立した分析を行えるように、配列決定データセットおよび生の配列情報を分析するために用いた分析パイプラインの完全な記述を含むこと。 次のセクションの情報は、これらのレポートに記載されていること。

 

5.1シーケンス実行ごとの統計の要約 

報告には、シーケンス実行ごとにシーケンスされた読み取りの総数、読み取りの品質スコア、読み取りの平均長、プラットフォーム固有のエラーの影響を減らすために実行されたエラー評価の説明、および、品質や長さの閾値を満たせなかった読み取りを削除したり、潜在的なシーケンスエラーを奇麗にするためにどのトリミングパラメータを使用したかに関する情報が含まれる。

 

5.2シーケンスバーコードの処理方法の説明 

報告書には、目的の配列にバーコード配列を追加する方法、シーケンス実行後に読み取りを隔離するために使用されるバーコードタグの順序、バーコードで読み取りをビンに分類するために使用されるプログラム、 バーコードシーケンスがシーケンスからどのように切り取られたか、および潜在的なクロスバーコード汚染を排除するためにとられた予防策の説明が含まれる。 

 

5.3コンティグおよびマッピングレポート

抗ウイルス医薬品の開発を支援するためのデータのNGS分析には2つのアプローチを使用することができる:

(1)参照配列への短い読みのマッピング、または

(2)コンティグを組み立てるための短い読みのde novoアセンブリ。

 

5.3.1シーケンスマッピングは、参照シーケンスに呼び出し、バリアントを呼び出しさせる。

 スポンサーは、参照配列へのシーケンスリードのマッピングおよびバリアントの呼び出しに関するレポートに含めるために、以下を考慮すること。

  1. マッピングに使用された参照配列を同定し、そしてヌクレオチドおよびアミノ酸配列ならびに登録番号を提供すること。
  2. プログラムを特定し、参照配列へのリードのマッピングを行うために使用されるアルゴリズムを記述し、それぞれの理論的根拠と共に使用されるパラメータ設定のリストを提供すること。 報告には、アルゴリズムに関する具体的な情報を提供すること、許容されるミスマッチのパーセンテージ、許容される挿入および欠失の数(indel)、ならびに同一性および類似性のカットオフを含むこと。これらに限定されない、 
  3. バリアントを呼び出すために使用されるアルゴリズムを説明し、使用されるパラメータを提供すること。 さらに、一塩基多型(SNP)およびindelが配列エラーとどのように区別されたかを説明すること。

 

5.3.2リードマッピングとバリアント呼び出しの結果の報告 

スポンサーは、読み取りマッピングおよびバリアント呼び出しの結果から、レポートの記述に関して、以下の点を考慮すること。

  1. 各読み取りマッピングについて達成された範囲の要約を提供すること、範囲のグラフを含めること。
  2. 各読み取りマッピングに存在していたシーケンスの数を指定すること。

c.主要なSNPおよびインデルを示すすべての読み取りマッピングの頻度表を提供すること。

  1. 次のものを含むアミノ酸形式の各臨床試験からのNGS結果の組み合わせ頻度表を提出のこと。各位置のアミノ酸、各位置の変異の頻度、および変動が生じた各位置の範囲 (セクション7.0、頻度表の例) 
  2. 関心のある母集団全体にわたる主な変化を示す要約表を提出のこと。

 

5.3.3断片とバリアントの呼び出しのDeNovoアセンブリ(該当する場合)

スポンサーは、コンティグのde novoアセンブリおよび変異型の呼び出しに関するレポートに含めるために、以下を考慮すること。

a.読み取りから生成されたコンティグの数を示すコンティグ統計データ。

b.プログラムを識別し、短いリードをコンティグにデノボアセンブリするために使用されるアルゴリズムの説明。それぞれの理論的根拠と共に使用されるパラメータ設定のリストを提供すること。報告書は、アルゴリズムに関する特定の情報を提供すること、許容されるミスマッチのパーセンテージ、許容されるインデルの数、ならびに同一性および類似性のカットオフを含むこと、これらに限定されない。

c.コンティグを比較し、バリアントを呼び出すために使用されるアルゴリズムの説明、使用されたパラメータを提供すること。さらに、SNPとindelがシーケンスエラーとどのように区別されたかの説明。

  1. 既知の配列との類似性を特定するために使用されたプログラムを特定すること、クエリされたデータベースを特定すること、使用された検索基準を提供すること、同一性パーセントに使用されるカットオフを定義すること、汚染物質または他のウイルスがどのように識別され報告されたかについての詳細を提供すること。

 

5.3.4 スポンサーは、de novoアセンブリおよびバリアントコーリングに関する報告について、以下の点を考慮する必要がある。

a.各断片の範囲の要約を提供。

b.各断片の配列数と断片を形成しなかったリード数を記入。

c.注釈中に検出された混入物質またはその他のウイルスを説明し、各混入物質のパーセント表示を報告。

d.有意なSNPおよびインデルを示すすべての主要な断片の頻度表を提供。

e.各臨床試験のNGS結果の組み合わせ頻度表を、次のものを含むアミノ酸形式で提供。

各位置のアミノ酸、各位置の変異の頻度、および変動が発生した各位置の範囲 (7.0節、頻度表の例)

f.重要な母集団全体にわたる主な変化を示す要約表を用意

g.参照配列にマッピングされていないすべてのリードのde novoアセンブリを実行し、サンプルの潜在的な混入(交差汚染)を評価するために断片に注釈を付けること<推奨>。

 

6.0 NGS ファイル形式と提出手順 T 

6.1ポータブルハードドライブ経由で提出されたファイル。 

技術仕様書「eCTD仕様を使用した電子提出」(2019年4月)に概説されているガイドラインに従って、fastqフォーマットと頻度表の生NGSデータを安全な携帯用ハードドライブで抗ウイルス製品部門に送付する必要がある。 

 

6.1.1ポータブルハードドライブの内容 

生のNGSデータ、頻度表、および目次のみをハードドライブに提出するようにしてください。 拡張子が.exeのファイルなど、追加のファイルによって送信が拒否されること

ハードドライブがパスワードで保護されている場合(現時点では必須ではない、または推奨されていません)、パスワードが医薬品評価研究センター(CDER)Document roomの適切な担当者に提供されていることを確認。

 

 6.1.2 ラベル; fastq sequence ファイル 

すべてのNGSデータは、ヌクレオチド配列および品質情報を含むfastqフォーマットで提供されるべきです。 これには、ベースラインおよび治療の失敗が観察されたときに近い時点を含む、さまざまな時点での各被験者のNGSシーケンスランを含める必要があります。 スポンサーは、独特のサブジェクト識別子と時点でラベル付けされたfastqファイルを提供すること。 例えば、研究ABC123、被験者0001、および3つのサンプル(ベースライン、16週目、4週目の追跡調査)の場合、ファイルには次のようにラベルを付けること。

  1. ABC123-0001.baseline.fastq  
  2. ABC123-0001.WEEK16.fastq  
  3. ABC123-0001.WEEK4FU.fastq  

サンプルのシーケンスが変更された場合は、最初のシーケンスと2番目のシーケンスを次のように区別すること

  1. ABC123-0001.baseline-1.fastq  
  2. ABC123-0001.baseline-2.fastq  

 

6.2 CDER電子文書ゲートウェイを介して提出されたファイル。 

NGSプロトコル、分析可能な抵抗性データセット、およびその他の補足情報は、CDER電子文書ゲートウェイを介して提出すること。

 

7.0頻度表の例

STUDYID =試験プロトコル番号。 

USUBJID =独特のサブジェクトID。 

NGSPL =シーケンスに使用される次世代シーケンスプラットフォーム。 

VISIT =サンプルが採取された試験機関訪問。 

AAPOS =標的遺伝子中のアミノ酸位置。 

AAREF =参照配列中のこの位置に存在するアミノ酸。 

AASUB =配列決定により検出されたアミノ酸置換。 

TCOV =ヌクレオチド部位での全範囲。 

VCOV =変異体のヌクレオチド位置での全範囲。 

AAFREQ =検出された置換の頻度。 

BL =ベースライン。