數據分析對任何 NGS 項目都至關重要,因此我們建議研究人員及早作出規劃。對於需要本中心提供生物資訊學支援的研究人員,我們強烈建議您於項目策劃初期便與我們討論相關研究內容,以便評估項目的可行性,並訂立合適的期望及分析方案。
預期情況
我們 免費 consultation will help you decide on the choices of sequencing technology (see table below), length of read, throughput required (amount of coverage) and analysis methodologies etc. All of these will play an important role in answering your specific scientific questions.
Below table lists some of the typical projects with suitable technologies, but we may discuss any other.
聯絡我們 現在 來一起討論你的專案吧!
| 應用程式 | Illumina定序技術,合成定序 | 單分子即時定序技術(SMRT) | 常見問題 | |
| NovaSeq | MiSeq | PacBio | ||
| 外顯子定序 | +++ | + | - | 外顯子序列中是否有新的突變? |
| RNA定序 | +++ | ++ | + | 我的樣本中哪些基因有差異表達? 我的樣本之間是否有不同的拼接模式? |
| ChIP-Seq | +++ | ++ | - | 我的蛋白質與哪些序列結合? |
| de novo 全基因組定序 | +++ | +++ | +++ | 這種生物的基因組是什麼樣的呢? |
| 重測序 | +++ | +++ | + | 我的分離株細菌/病毒/質粒與常見菌株相比,序列有何差異? |
| 宏基因體學 | +++ | ++ | + | 我的環境樣本中存在哪些微生物? 我的培養皿中有哪些不同的病毒株? |
| 微RNA譜分析 | +++ | ++ | - | 我的樣本中表達了哪些microRNA,或哪些microRNA有差異性表現? |
| 甲基化分析 | +++ | ++ | + | 基因組中哪些位點發生了甲基化? 我的樣本之間甲基化模式是否不同? |

大部分生物資訊學分析項目均具有其獨特性,因此服務收費會因應個別項目所需的時間及資源而有所不同。
為了方便預算,在了解您的需求後,我們將盡快向您提供預估費用報價。.
作為一個學術及非牟利性質的核心設施,我們所提供的服務收費,相較於許多其他服務供應商而言,具備相當競爭力。 極具競爭力的價格 與其他許多服務提供者相比。.
*重要的:* 要符合香港大學定價條件,研究人員必須是 香港大學的正式員工 並且必須從 香港大學內部財務帳戶 符合內部調撥條件的資金。所有外部資金流入均需繳交管理費。.
服務選項
在 CPOS,生物資訊學團隊與 NGS 實驗室團隊緊密合作,提供多元化的服務方案,以配合不同研究項目的需求。
除定序運行服務(sequencing run service)外,所有定序數據在交付予使用者前,均會先進行品質控制(QC)檢測。
有關不同應用項目所對應的具體交付內容(deliverables)詳情,請參閱 數據交付物 部分。.
| 服務類型 | CPOS 準備的圖書館? | 序列處理由CPOS負責嗎? | 生物資訊學成果 | ||||
| 原始定序數據 (解復用) | 定序報告 | FastQC報告 | 分析報告及其他交付成果 | 中間分析文件 | |||
| 排序運行服務 | 不 | 是的 | √ | ||||
| 全方位服務 | 是的 | 是的 | √ | √ | √ | ||
| 提供包含標準分析的全方位服務 | 是的 | 是的 | √ | √ | √ | √ | √ |
| 僅進行數據分析 | 不 | 不 | √ | √ |
概覽
Once data is available, users will be notified via email. Two data transfer options are available:
(I) For all users, data could be downloaded via sFTP server.
- 使用者將透過電子郵件收到 sFTP 使用者名稱和密碼,解壓縮密碼將透過另一封電子郵件提供。.
- User downloads data from sFTP server. Instructions can be found 在此.
- 使用者可以使用以下方式解壓縮檔案: 7zip 或者 WinRAR .
(II) For HPCF* users only, data could be transferred directly to user-specified HPCF directories.
- User provides HPCF folder address to the Core.
- The Core notifies user upon completing data transfer through email.
為遵守中心的資料保護方案,分析後的資料會在透過 sFTP 伺服器傳輸前進行壓縮和加密。為增強安全性,存取 sFTP 伺服器的使用者名稱和密碼以及解壓縮檔案的密碼將透過單獨的電子郵件提供。資料可以使用以下命令解壓縮: 7zip 或者 WinRAR.
Due to limited server hard disk space, data will only be kept for 1個月 交付完成後,資料將從我們的伺服器中刪除,恕不另行通知。.
請務必妥善保管資料副本(分析結果和所有中間文件),並明確標識,以便日後參考。.
*For more information about HPCF, please visit the HPCF section.
資料收集工作流程

How to Download Files from sFTP Server
概括
This section shows how to transfer files from sFTP Server by setting up and logging into Filezilla 客戶 as the preferred FTP client. The downloaded files will be split into multiplex files if the size is larger than 250 GB. 請記得下載md5sum文件 在同一資料夾中,以便稍後驗證下載檔案的完整性。由於 Wi-Fi 不穩定,, 不建議使用 Wi-Fi 下載.
程式
- 下載並安裝 FileZilla 用戶端 (https://filezilla-project.org註:請下載 FileZilla 用戶端 和 不是 文件 FileZilla 伺服器.
- 開啟 FileZilla。輸入以下資訊: 快速連接 位於窗戶頂部的橫桿。.
- 主持人:您指定的主機
- 使用者名稱:您提供的用戶名
- 密碼您提供的密碼
- 連接埠號: 22
(The above information can be obtained from the email sent by the bioinformatics service team)

- 點選 快速連接 或按 進入 連接到伺服器。.

- 首次登入時,點選 好的 接受關於未知主機金鑰的安全性憑證。.

- 點擊您想要下載的文件 sFTP Server (右側視窗),然後將檔案移到目標位置。 你的電腦 (左側視窗)。請注意,在拖放操作過程中,您需要按住滑鼠按鈕。.

- 將檔案「拖放」到 你的電腦, you will see that the file transfer is in progress (see screen shot below). Please wait for the file transfer to be completed and this will take a while for files that is large in size. Note that the number in the brackets denotes how many files are to be transferred.

- Once the file transfer completed successfully, you will see numbers in the “Successful transfers” tab (see screen shot below). Note that the number in the brackets denotes how many files are transferred successfully.

- 您可以關閉 FileZilla 用戶端 當所有檔案下載成功後,使用 md5sum 驗證下載的檔案(請參閱下一節)。. 請務必仔細按照以下步驟操作,以確認下載是否成功。.
How to Check md5sum of Downloaded Files
概括
本節介紹如何使用 MD5(訊息摘要演算法 5)雜湊值來驗證下載檔案的完整性。 WinMD5免費版.
程式
- 下載並解壓縮 WinMD5免費版 (http://www.winmd5.com).
- 打開 WinMD5.exe 在解壓縮後的資料夾中。.
- 點選 瀏覽 and choose the zip file you have downloaded from sFTP Server, the MD5 checksum value will be computed and shown in 目前文件 MD5 校驗和值. 請耐心等待,處理大文件可能需要一段時間(最多一個小時或更久)。.

- 開啟從 sFTP 伺服器下載的 md5sum 文件 記事本. 複製 MD5校驗值 並貼到 原始文件 MD5 校驗和值 在 WinMD5免費版, 然後點擊 核實.
記事本:
WinMD5Free:
- 會彈出一個視窗顯示“匹配成功!”如果從 sFTP 伺服器下載成功,則表示「」。“未匹配!”如果顯示“”,請從我們的 sFTP 伺服器重新下載檔案。.

- 確認檔案下載成功後,如果需要,可以使用 7-zip 解壓縮檔案(請參閱下一節)。.
How to Unzip Password Protected Files Downloaded from sFTP Server
概括
本節介紹如何使用以下命令解壓縮從我們的 sFTP 伺服器下載的受密碼保護的檔案。 7-Zip. 請務必在嘗試解壓縮檔案之前下載所有拆分的壓縮檔案。.
WARNING: Please ensure you have sufficient disk space to hold all the un-compress data.
程式
- 下載並安裝 7zip (http://www.7-zip.org).
- Right click the zip.001 file you have downloaded from SFTP server, then go 7-Zip 點選 在此處擷取.

- 將會彈出一個視窗要求輸入密碼。請輸入我們透過電子郵件提供的密碼,然後點擊。 好的.

- An unzipped folder will be extracted at the same location as the original file. Please note that only zip.001 need to be extracted and the remaining zip files (if any) will be unzipped into a single folder.
典型交付成果
根據定序技術、專案類型和所需的生物資訊學支援程度,最終交付成果會有所不同。通常包括:
- 定序報告 (MS Word 文件)-一份記錄定序工作執行情況的書面報告。.
- FastQC報告 (HTML 檔案)-由 NGS 資料品質控制工具產生的報告,可在 Web 瀏覽器上檢視(僅限 Illumina 定序訪問 作者網站 詳情請見下文。.
- 分析報告 和 結果 (多種文件類型)-報告總結了分析的資料和所應用的分析流程。此外,還包括特定項目的分析結果文件(見下表)。.
- 中間分析文件 (各種文件類型)-分析過程中建立的文件,例如 Fastq 格式的過濾後的高品質 reads。交付成果取決於專案類型(見下表)。.
請在下方選擇定序技術類型,以查看交付成果。.
WP表格產生器
Illumina NovaSeq / MiSeq 定序 – 根據專案類型而定的特定交付成果
對於超出我們常規分析流程(標準交付成果)的分析需求,我們可以提供客製化協助(客製化交付成果)。請注意,以下清單並非所有可能交付成果的完整清單。如果您找不到所需內容,請與我們聯絡。最終交付成果需經CPOS與用戶雙方協商一致。.
| 項目類型 | 標準交付成果 | 客製化交付物 |
| RNA定序(mRNA) | - BAM 格式的比對文件 - 基因/轉錄本表達水平文件(MS Excel格式) - *差異表達基因/轉錄本清單(MS Excel格式)(包含與Partek Flow的整合,用於下游路徑分析) - 主成分分析圖(HTML格式,至少2個樣本) *每個送測樣本均包含 1 個成對比對。歡迎進行更多比對,詳情請與我們聯絡。. | - 以 MS Excel 格式提供的帶註釋的 SNP/INDEL 列表 - MS Excel 格式的替代剪接模式 - MS Excel 格式的融合基因文件 - MS Excel 格式的新型外顯子文件 - 其他(開放討論) |
| RNA定序(miRNA) | - BAM格式的比對文件(已知miRNA) - BAM 格式的比對文件(與其他已知 RNA,例如 snRNA、snoRNA 等) - MS Excel 格式的 miRNA 表達水平文件 - *差異表達的miRNA清單(MS Excel格式) *每個送測樣本均包含 1 個成對比對。歡迎進行更多比對,詳情請與我們聯絡。. | miRNA標靶預測 - MS Excel 格式的新型 miRNA 文件 - 其他已知RNA的表達水平 - 其他(開放討論) |
| ChIP-Seq | - BAM 格式的比對文件 - Excel格式的峰值列表 - Excel格式的註解峰列表 - BigWig 檔案用於在整合基因組瀏覽器 (IGV) 中可視化峰值 *每個送測樣本均包含 1 個成對比對。歡迎進行更多比對,詳情請與我們聯絡。. | - 其他(開放討論) |
| 人類外顯子定序 | - BAM 格式的比對文件 - 標準 VCF 格式的 SNP / INDEL 文件 - MS Excel 格式的附註釋 SNP / INDEL 檔案列表 *請點擊 在此 針對我們用於分析的目標檔案。. | - 以 MS Excel 格式提供的帶註釋的體細胞 SNP/INDEL 列表 - 針對 PHIAL 的 MS Excel 格式註釋 - 其他(開放討論) |
| 人類全基因組定序 | - BAM 格式的比對文件 - 標準 VCF 格式的 SNP / INDEL / CNV / SV 文件 - 以 MS Excel 格式提供的帶註釋的 SNP / INDEL / CNV / SV 文件列表 *分析將使用DRAGEN平台進行。. *進行體細胞拷貝數變異(CNV)檢測時,需要配對的正常樣本。請聯絡我們以了解更多詳情。. | - 其他(開放討論) |
| 亞硫酸氫鹽測序 | - BAM格式的序列比對檔案(如適用,包括人類和Lambda噬菌體) - 文字/Excel格式的註解CpG甲基化位點列表 - Lambda 的亞硫酸氫鹽轉化率(如適用) | - 其他(開放討論) |
| de novo 基因組定序 | - de novo 各種格式的組裝檔案(原始檔案和重疊群) - 文字格式的預測編碼基因文件 - 文字格式的註釋編碼基因列表 - 文字格式的重複項列表 - 非編碼RNA清單(文字格式) | - 用於基因組可視化的 Circos 圖 - 其他(開放討論) |
| de novo 轉錄組定序 | - de novo 各種格式的組裝檔案(原始檔案和重疊群) - FASTA格式的成績單列表 - 附註解的成績單清單 (GO)(Excel 格式) - 基因/轉錄本表達量(Excel格式) - *差異表達基因/轉錄本清單(Excel格式) *每個送測樣本均包含 1 個成對比對。歡迎進行更多比對,詳情請與我們聯絡。. | - 其他(開放討論) |
| 宏基因體定序 (全基因組鳥槍法) | - de novo 各種格式的組裝檔案(原始檔案和重疊群) - BLAST 檔案(原始格式),採用 BLAST 原生格式 分類樹 - 種組成(Excel格式) | - 其他(開放討論) |
| 宏基因體定序 (16s放大器) | - FASTA格式的合併雙端定序數據 - BIOM 格式的 OTU 表 - *分類概要 - *Alpha多樣性(樣本組內多樣性)的結果 - *Beta多樣性分析結果(樣本組間多樣性比較) - *Excel格式的差異OTU列表 *每個項目均包含6組間對比。歡迎提供更多比較數據,詳情請與我們聯絡。. | - 其他(開放討論) |
Pacbio Sequencing – Specific Deliverables Based On Project Type
對於超出我們常規分析流程(標準交付成果)的分析需求,我們可以提供客製化協助(客製化交付成果)。請注意,以下清單並非所有可能交付成果的完整清單。如果您找不到所需內容,請與我們聯絡。最終交付成果需經CPOS與用戶雙方協商一致。.
| 項目類型 | 標準交付成果 | 客製化交付物 |
| de novo 基因組定序 | - de novo 各種格式的組裝檔案(原始檔案和重疊群) - 文字格式的預測編碼基因文件 - 文字格式的註釋編碼基因列表 - 文字格式的重複項列表 - 非編碼RNA清單(文字格式) | - 用於基因組可視化的 Circos 圖 - 其他(開放討論) |
| 長程結構變異 | - BAM 格式的比對文件 - 結構變異清單(Excel格式) | - 其他(開放討論) |
除了 CPOS 自行開發的分析流程(analysis pipelines)外,我們亦累積了多項可應用於不同類型數據分析的資源。為方便其他生物資訊學研究人員使用,這些資源將會透過本網站提供。
外顯子組標靶區域
The BED files were generated by merging the target and probe regions (provided by vendor), followed by adding 200bp padded region (100bp upstream and 100bp downstream). Conversion from hg19 to hg38 was done using Batch Coordinate Conversion (liftOver) from UCSC Genome Browser Utilities. The workflow is shown as below:
已加入 padding 的合併區域 BED 格式檔案可按以下連結下載:

已加入 padding 的合併區域 BED 格式檔案可按以下連結下載:
SeqCap EZ Exome + UTR1
[ hg19 MD5:2de06c08d21a97642c1a50ac609c32b2 ] [ hg38 MD5:c83c85ea28546ca58e06005ad752741d ]
1原始的目標區域及探針區域檔案可供下載 在此.
xGen® Exome Research Panel v1.02
[ hg19 MD5:c79c2a7e3d9ba77b3c4f2f9e3eebce1b ] [ hg38 MD5:380d6ca15ee5d76d54ab1d843e31d49b ]
2原始的目標區域及探針區域檔案可供下載 在此 [MD5:1408942505230683c79955ddaae90e46]。.
在CPOS,我們致力於為您的資料集應用最合適的分析方法,並在專案啟動前對每個分析步驟進行周密規劃。 CPOS提供免費諮詢服務,包括對合適的分析方法和工具的建議,因此我們強烈建議用戶提前與我們溝通。我們將本著誠信原則,基於我們的專業知識提供建議,但無法對最終選擇的最合適分析方法承擔全部責任。 CPOS分析團隊和專案負責人應在充分理解的基礎上達成共識,共同承擔責任。.
數據處理
所有資料均儲存在連網儲存磁碟機上,並定期備份,但CPOS不負責無限期地儲存資料。 CPOS生物資訊學核心儲存的所有資料(原始資料、分析結果和所有中間檔案)都可能被刪除。 1個月 在未事先通知的情況下將資料傳輸給用戶。. 建議使用者保留一份安全、識別清晰、永久保存的資料集副本。.
認可 / 作者
如您的研究發表使用了由本中心產生的數據,我們衷心感謝您於論文中鳴謝泛組學科學中心(Centre for PanorOmic Sciences, CPOS)。如本中心於研究過程中提供了重要的學術及知識性貢獻,我們亦認為適合將相關人員列為共同作者。適當的鳴謝與認可,有助反映本中心工作的學術影響力,並支持中心持續提供受資助服務。謹此致謝。
聯絡我們
bioinfo.cpos@hku.hk
核心設施
地址
六樓
香港賽馬會大樓
跨學科研究
沙遜路5號
香港薄扶林
電話:2831-5500
傳真:2818-5653
網址:https://staging1.cpos.hku.hk
電子郵件: enquiry.cpos@hku.hk
辦公時間
週一至週五:上午9:00 – 下午5:30
下午1點至2點不提供樣品及貨物接收服務
週六、週日及所有大學及公共假日休館。.






