概覽
CPOS IT o每ates 高的 佩效能 計算設施(HPCF),包括: 48 點點頭es 的 6,848 中央處理器 核心, 124 GPU卡,, 54 TB 記憶體和 PB級全快閃 存儲,在 400GB 高速網路。.
目標用戶
- 香港大學需要使用運算服務以進行泛組學(PanorOmics)研究的教職員及學生
服務時間
- 一般情況下可提供 24×7 全天候使用,惟系統進行維護期間除外
關於組學研究
豐富的軟體庫
過去12個月
高效能運算叢集(HPCF3)
🖥️ HPCF3 GPU 試用促銷活動-現在免費開放!
➡️點 在此 了解更多詳情。.
硬體和存取
🖥️HPCF3 群集概述
可透過 SSH 使用主機名稱存取 HPCF3 登入節點:
hpcf3.staging1.cpos.hku.hk
點選 在此 更多詳情請見下文。.
作業系統和軟體
所有 HPCF3 伺服器均運作在 Rocky Linux 8.
廣泛使用的 生物資訊軟體 已預先安裝,所有使用者均可使用。.
⚙️服務
用戶透過以下方式提交工作 OpenPBS, 叢集的作業調度系統。.
執行在計算節點上進行。 僅透過PBS招募網站發布.
➡️ 不允許直接登入計算節點。.
👤用戶帳號設定
如需申請用戶帳戶,請聯絡 itsupport.cpos@hku.hk.
- 所有帳戶申請均需經CPOS部門核准。.
- 獲得批准的用戶將獲得一個 Linux 帳戶來存取叢集。.
- 每個帳戶都附帶 預設儲存空間為 100 GB; 可以申請額外配額(視供應情況而定,並可能收取費用)。.
- 每個帳戶都分配給一個 指定人員 嚴禁共享帳號。.
- 雖然儲存系統受到硬體冗餘的保護,但用戶仍然 強烈建議 為了維持他們自己的 定期備份.
- 使用者應熟悉 Linux/UNIX 環境。 參考指南 可從 ITS 取得。.
🔐集群登入
使用者可以透過 SSH 使用諸如以下客戶端進行遠端連線: 油灰, 可在以下網址取得: http://www.chiark.greenend.org.uk/~sgtatham/putty/
連線詳情
若要連線到 HPCF3 的登入節點,請使用 SSH 用戶端開啟 SSH 終端會話,命令如下:
主機名稱:hpcf3.staging1.cpos.hku.hk 使用者名稱:
🔒網路要求
出於安全考慮,HPCF3 伺服器可存取。 限香港大學網路內部.
-
校外使用者必須先以以下方式連結: 香港大學VPN.
細節: https://its.hku.hk/services/network-connectivity/hkuvpn/
📦資料傳輸
🪟 Windows 用戶
對於 Windows 用戶來說,有幾種免費的、基於圖形使用者介面的安全文件傳輸用戶端可供選擇,例如 WinSCP 或 FileZilla. 您可以使用這些客戶端,只需在叢集前端節點和您的桌上型電腦或筆記型電腦之間拖放檔案即可。.
🍏 Mac / 🐧 Linux 用戶
對於 Mac 或 Linux 系統,命令列 scp 用戶端通常會隨作業系統一起安裝。您可以透過本機電腦上的終端機存取它。例如,假設您有一台 Mac,並且 Mac 上有一個名為 myfile 的本機文件,您想要將其複製到叢集上的主目錄。.
例子:
scp myfile userid@hpcf3.staging1.cpos.hku.hk:mydir/
此副本 我的文件 進入目錄 我的目錄/ 位於您的 HPCF3 主目錄下。.
與任何以檔案或目錄為參數的 Unix 指令一樣,原始檔案或目錄也可以指定為絕對路徑(以斜線開頭)或相對路徑(不以斜線開頭)。對於本機檔案或目錄,相對路徑相對於目前工作目錄。對於遠端檔案或目錄,相對路徑相對於遠端主機上的使用者主目錄。.
📡批量資料傳輸 指南
為避免影響校園網路效能:
- 轉會 大於 30 GB 往返香港大學網路以外的行程應進行 辦公時間以外.
- 轉帳 超過 500 GB, 請通知 itsupport.cpos@hku.hk 提前通知以便我們與資訊科技服務部門協調。.
⚠️ 未就大額轉帳發出通知可能導致 ITS 處罰 暫時阻止 來自網際網路的叢集伺服器。.
收費
點選 在此 更多詳情請見下文。.
收費政策
👤HPCF 使用者帳戶
- 每個 HPCF 使用者帳戶每月都需要支付費用,用於我們群組中該帳戶的日常支援和維護。.
- 充電期從…開始 每個月的第一天.
- 對於新用戶帳戶,費用將從下一個計費週期開始收取。例如:如果新帳戶已於28日透過電子郵件通知用戶開通,則29日不會收取費用,而是從下個月1日開始收取費用。.
- 每個HPCF用戶帳戶都必須處於使用狀態並付費。 至少一個月. 短期使用不被允許.
- 用戶帳號的刪除將在收費週期的最後一天進行,但收費週期內仍將繼續收費。.
📦用戶主資料存儲
- 用戶主目錄資料儲存(/home/)將按月收取費用,費用按授予的磁碟配額以 100GB 為單位(1KB=1000 位元組)。.
- 充電期從…開始 每個月的第一天.
- 對於新用戶帳戶的家庭儲存空間,將從下一個計費週期開始收費,並與新用戶帳戶費用一起收取。.
- 預設情況下,每個新用戶帳戶都將擁有 100GB 磁碟配額 除非另有規定。.
- 使用者可以透過向 PI 發送 cc 請求來增加磁碟配額,增加的磁碟配額將從當前計費週期開始收費。.
- 根據要求,磁碟配額將在計費週期的最後一天減少,但計費週期內仍將繼續計費。.
📦使用者群組資料存儲
- 使用者群組資料儲存(/home/groups/)將按月收取費用,費用將按授予的磁碟配額以 100GB 為單位(1KB=1000 位元組)收取。.
- 充電期從…開始 每個月的第一天.
- 增加磁碟配額將由組長提出申請,並抄送給專案負責人,增加的磁碟配額將從當前計費週期開始計費。.
- 根據要求,磁碟配額將在計費週期的最後一天減少,但計費週期內仍將繼續計費。.
託管服務
- 對於新的託管設備單元,將按月收取支援費。 UAT驗收後的下一個充電週期.
重要提示
CPOS可能會根據實際使用情況和回收需求不時調整收費標準。變更實施前,我們會提前通知您。.
對於託管設備,所有 FEO 庫存都將歸入 CPOS 系統。託管伺服器可以整合到 HPCF 叢集中,並配置為運算節點。將為在託管伺服器上執行的作業設定單獨的作業佇列。. 請注意,CPOS IT 集中管理 HPCF 的所有系統資源,包括託管設備,並可能不時根據情況安排閒置資源的作業,恕不另行通知,以便高效利用資源,造福香港大學社區。.
環境模組
HPCF3叢集使用 環境模組 用於管理集中安裝軟體的系統。目前已有多種常用生物資訊工具的版本可供使用。.
請注意:支援環境模組。 僅在 HPCF3 上 和 HPCF2 上不可用.
顯示可用模組
環境模組允許使用者使用簡單的命令輕鬆載入、卸載和切換不同的軟體環境。.
若要查看 HPCF3 上有哪些軟體套件及其版本,請執行:
模組可用
此命令列出所有目前已安裝且可供使用的模組。.

敬請期待。即將推出。.
HPCF3 叢集上的作業排程系統 (OpenPBS)
所有作業必須透過批次作業系統 (OpenPBS) 進行排程。作業提交至 PBS 時,需指定所需的資源,包括佇列、CPU 數量、記憶體大小和運行時間。 PBS 將在資源可用時,在資源使用受限的情況下,於可用的運算節點上執行作業。.
點選 在此 更多詳情請見下文。.
高效能運算叢集(HPCF2)
硬體和存取
HPCF2 簇
主節點是 Omics,可以透過 SSH 使用主機名稱存取。 hpcf2.staging1.cpos.hku.hk.
HPCF2 叢集由 8 個運算節點組成,系統配置如下:
| 伺服器 | CPU品牌及型號 | CPU數量 | 每個CPU的核心數 | 每台伺服器的實體核心數 | 每台伺服器的 CPU 執行緒數 | 記憶體(GB) |
| hpch01 | 英特爾至強 E5-2650 v4 2.2GHz | 2 | 12 | 24 | 48 | 256 |
| hpch02 | 英特爾至強 E5-2650 v4 2.2GHz | 2 | 12 | 24 | 48 | 256 |
| hpch03 | 英特爾至強 E5-2650 v4 2.2GHz | 2 | 12 | 24 | 48 | 256 |
| hpch04 | 英特爾至強 E5-2650 v4 2.2GHz | 2 | 12 | 24 | 48 | 256 |
| hpch05 | 英特爾至強 E5-2650 v4 2.2GHz | 2 | 12 | 24 | 48 | 256 |
| hpch06 | 英特爾至強 E5-2650 v4 2.2GHz | 2 | 12 | 24 | 48 | 256 |
| hpch07 | 英特爾至強 E5-2650 v4 2.2GHz | 2 | 12 | 24 | 48 | 256 |
| hpch08 | 英特爾至強 E5-2683 v4 2.1GHz | 2 | 16 | 32 | 64 | 512 |
| 全部的: | 200 | 400 | 2,304 |
作業系統和系統軟體
HPCF2 中的所有伺服器都運行 CentOS 7 Linux 作業系統,並且已安裝主要的生物資訊軟體,可供所有使用者使用。.
叢集節點
主節點
服務
- 透過 SSH 以互動模式編譯/執行命令列程式。
- 向作業佇列系統提交批次作業
- 透過 FileZilla 等 SFTP 用戶端進行檔案傳輸
控制措施
主節點將用於上述服務,而使用者的分析作業將透過作業提交至作業佇列系統並在計算節點上執行。尤其需要注意的是,主節點不得用於執行資源密集型作業。因此,在主節點上實施了以下控制措施:
- 使用者所有作業同時使用的最大 CPU 總時間為 400%(即同時執行四個作業,每個執行緒消耗 100% CPU 時間,或單一作業有 4 個線程,每個線程消耗 100% CPU 時間)。.
- 每個使用者作業的最長運行時間為 10 分鐘。.
- 使用者所有作業同時佔用的主記憶體總量最大為 10GB。.
主節點將檢查每位使用者的資源使用是否超出限制,並依使用量降序終止超出限制的使用者作業,直到資源使用量降至可接受的限制值。系統將自動向使用者發送通知郵件,其中包含已終止進程的詳細資訊。.
計算節點
服務
- 使用者可以透過作業調度系統,從主節點向計算節點提交 PBS 作業以執行。因此,使用者無法直接登入計算節點執行作業。.
用戶帳戶設定
- 請聯繫 itsupport.cpos@hku.hk 用於用戶帳戶設定。.
- 帳戶審核需經CPOS審核。.
- 帳戶申請獲得批准後,每個使用者都會被分配一個 Linux 用戶帳戶以存取叢集。.
- 每個使用者初始預設分配一個擁有 100GB 磁碟空間的 Linux 使用者帳戶。用戶可以根據可用空間和費用申請額外的磁碟空間。.
- 每個使用者帳戶都應該由指定人員使用並對其負責。. 禁止共享帳號。.
- 使用者可根據磁碟空間狀況和費用申請額外的磁碟配額。.
- 儘管儲存受到硬體冗餘的保護,但強烈建議用戶… 他/她會定期自行備份重要文件。 為了安全起見,將叢集中的資料儲存到本機磁碟。.
- 使用者應熟悉 Linux/UNIX 軟體環境。您可以參考 ITS 編寫的 Unix 使用者指南。 在此 供參考。.
叢集登入
使用者可以透過 SSH 使用 PuTTY 等 SSH 用戶端遠端連線到 HPCF2 的命令列終端機(SSH 用戶端連結: http://www.chiark.greenend.org.uk/~sgtatham/putty/).
若要連線到 HPCF2 的主節點,請使用 SSH 用戶端開啟 SSH 終端會話,命令如下:
主機名稱:hpcf2.staging1.cpos.hku.hk
使用與目前 HPCF 中相同的使用者帳戶登入。.
注意:出於安全考慮,伺服器只能從香港大學網路內的電腦連接。對於香港大學網路外的計算機,使用者必須先連接到香港大學VPN,然後再連接到伺服器。. 詳情請見: https://its.hku.hk/services/network-connectivity/hkuvpn/
資料傳輸
對於 Windows 用戶來說,有好幾種免費的、基於 GUI 的安全文件傳輸用戶端,例如 WinSCP 或 FileZilla (http://filezilla-project.org/您可以使用這些客戶端,只需在叢集前端節點和您的桌上型電腦或筆記型電腦之間拖放檔案即可。.
對於 Mac 或 Linux 系統,命令列 scp 用戶端通常會隨作業系統一起安裝。您可以透過本機電腦上的終端機存取它。例如,假設您有一台 Mac,並且 Mac 上有一個名為 myfile 的本機文件,您想要將其複製到叢集上的主目錄。.
在 Mac/Linux 電腦上,啟動終端應用程式並輸入
scp myfile userid@hpcf2.staging1.cpos.hku.hk:mydir/
這會將本機檔案 myfile 複製到叢集上您主目錄下的 mydir/ 子目錄中,並保留檔案名稱 myfile。與任何以檔案或目錄為參數的 Unix 指令一樣,原始檔案或目標檔案或目錄可以指定為絕對路徑(以斜線開頭)或相對路徑(不以斜線開頭)。對於本機檔案或目錄,相對路徑相對於目前工作目錄。對於遠端檔案或目錄,相對路徑相對於遠端主機上的主目錄。.
大量資料傳輸
為避免影響港大校園網其他用戶,港大資訊科技服務處建議,叢集與港大網路外機器之間的大批量資料(>30GB)網路傳輸應安排在非辦公時間進行。如需傳輸的資料量超過500GB,請提前發送郵件至itsupport.cpos@hku.hk,以便我們將其轉發給資訊科技服務處,安排網路流量。如未事先通知,資訊科技服務處可能會阻止我們的伺服器存取網路。.
退休
HPCF2將於2026年10月前完全退役。
收費
點選 在此 更多詳情請見下文。.
收費政策
HPCF 使用者帳戶
- 每個 HPCF 使用者帳戶每月都需要支付費用,用於我們群組中該帳戶的日常支援和維護。.
- 計費週期從每月1日開始。.
- 對於新用戶帳戶,費用將從下一個計費週期開始收取。例如:如果新帳戶已於28日透過電子郵件通知用戶開通,則29日不會收取費用,而是從下個月1日開始收取費用。.
- 每個HPCF用戶帳戶必須至少使用並付費一個月。不允許短期使用。.
- 用戶帳號的刪除將在收費週期的最後一天進行,但收費週期內仍將繼續收費。.
用戶主資料存儲
- 用戶主目錄資料儲存(/home/)將按月收取費用,費用按授予的磁碟配額以 100GB 為單位(1KB=1000 位元組)。.
- 計費週期從每月1日開始。.
- 對於新用戶帳戶的家庭儲存空間,將從下一個計費週期開始收費,並與新用戶帳戶費用一起收取。.
- 預設情況下,如果未指定,每個新使用者帳戶將擁有 100GB 的磁碟配額。.
- 使用者可以透過向 PI 發送 cc 請求來增加磁碟配額,增加的磁碟配額將從當前計費週期開始收費。.
- 根據要求,磁碟配額將在計費週期的最後一天減少,但計費週期內仍將繼續計費。.
使用者群組資料存儲
- 使用者群組資料儲存(/home/groups/)將按月收取費用,費用將按授予的磁碟配額以 100GB 為單位(1KB=1000 位元組)收取。.
- 計費週期從每月1日開始。.
- 增加磁碟配額將由組長提出申請,並抄送給專案負責人,增加的磁碟配額將從當前計費週期開始計費。.
- 根據要求,磁碟配額將在計費週期的最後一天減少,但計費週期內仍將繼續計費。.
託管服務
- 對於新的託管設備單元,用戶驗收測試 (UAT) 驗收後的下一個計費週期將開始收取每月支援費。.
重要提示
CPOS可能會根據實際使用情況和回收需求不時調整收費標準。變更實施前,我們會提前通知。.
對於託管設備,所有 FEO 庫存都將歸入 CPOS 系統。託管伺服器可以整合到 HPCF 叢集中,並配置為運算節點。將為在託管伺服器上執行的作業設定單獨的作業佇列。. 請注意,CPOS IT 集中管理 HPCF 的所有系統資源,包括託管設備,並可能不時根據情況安排閒置資源的作業,恕不另行通知,以便高效利用資源,造福香港大學社區。.
環境模組
一個名為「環境模組」的系統用於管理集中安裝的軟體。目前已安裝了多個常用生物資訊軟體的版本。請注意,該系統僅在新的 HPCF2 叢集上可用,而舊的 HPCF(statgenpro)叢集上不可用。.
顯示可用模組
環境模組允許使用者透過幾個簡單的命令在軟體環境之間動態切換。若要了解叢集上可用的軟體包及其版本,請使用命令「module avail」列出所有可用的模組環境:
[itsupport@omics ~]$模組可用 --------------------------------------------- /software/Modules/modulefiles ---------------------------------------------- ANNOVAR/2017Jul16 HTSeq/0.9.1 (D) STAR/2.5.2a bwa/0.7.12 BEDTools/2.120. STAR/2.5.3a (D) bwa/0.7.17 (D) BEDTools/2.17.0 MACS/2.1.0-2015.04.20 (D) TrimGalore/0.4.1 cutadapt/1.8.1 BEDTools/2.27.115.D. cutadapt/1.15 (D) BioPerl/1.7.2 MUMmer/3.23 (D) Trimmomatic/0.33 idba/1.1.3 Canu/1.5 NCBI-blast/2.2.27+ Trimmomatic/0.36 (D) CBI/7.0_25 Canu/1.D. 。 DESeq2/1.10.1 PEAR/0.9.11 (D) bamUtil/1.0.14 (D) 迷你康達2/4.3.31 DESeq2/1.18.1 (D) Perl/5.26.1 bamtools/2.3.0 muTect/Se.1. bamtools/2.5.1 (D) muTect/1.1.5 (D) EBSeq/1.18 (D) Picard/2.17.4 (D) bcl2fastq/2.19 python2/2.7.14 FASTX-toolkit/0.0.13.20.0.13.20 b python3/3.6.4 FASTX-toolkit/0.0.14 (D) QIIME2/2017.12 bedGraphToBigWig/4 samtools/0.1.18 FastQC/0.11.2 R/3.2.5 bismark/0.1.18 sam/0.11.2 R/3.2.5 bismark/0.14.3 (Atool/D. bismark/0.19.0 (D) samtools/1.6 (D) GenomeAnalysisTK/3.5 RNAmmer/1.2 bowtie/1.0.0 strelka/1.0.15 GenomeAnalysisTK/3.7 RSEM/1.2.31 bowtie/1.2.2 (DalysisTK/3.7 RSEM/1.2.31 bowtie/1.2.2 (DalysisTK/3.7 RSEM/1.2.31 bowtie/1.2.28.D. RSEM/1.3.0 (D) bowtie2/2.2.5 tRNAscan-SE/1.3.1 HOMER/4.9 SPAdes/3.10.0 bowtie2/2.3.4 (D) HTSeq/0.6.1 SPAdes/3.11.1 (D) bwa/0. /opt/Lmod/7.7.14/lmod/lmod/modulefiles/Core -------------------------------------- lmod/7.7.14 settarg/7.7.14 其中: D:預設模組
載入模組
然後,您可以透過載入對應的模組來執行這些集中安裝的軟體包。例如,如果您想要執行 BWA 對齊工具,可以使用指令「module load」來啟用 bwa 模組環境:
[itsupport@omics ~]$ 模組載入 bwa bwa/0.7.17 已載入
然後,將載入 bwa 模組的預設版本。之後,您就可以使用 bwa 工具進行後續資料分析了:
[itsupport@omics ~]$ bwa 程式:bwa(基於 Burrows-Wheeler 轉換的比對)版本:0.7.17-r1188 聯絡人:李恆用法:bwa [選項] 指令:索引 FASTA 格式的索引序列 mem BWA-MEM 演算法 fastmap 辨識超極大精確匹配...
列出已載入的模組
若要列出目前已載入的模組,請使用指令“module list”:
[itsupport@omics ~]$ 模組清單 目前已載入模組:1) bwa/0.7.17
解除安裝模組
當您不再需要執行該軟體時,請使用“module unload”命令將其從當前會話中卸載:
[itsupport@omics ~]$ 模組卸載 bwa bwa/0.7.17 已卸載
搜尋模組的可用版本
如果您想使用其他版本而不是預設版本,您可以搜尋並指定軟體模組的特定版本:
itsupport@omics ~]$module 可用 bwa ------------------------------- /software/Modules/modulefiles ------------------------------- bwa/0.6.2 bwa/0.7.12 bwa/0.7.17 (D) 其中:D:預設模組
載入模組的特定版本
載入舊版(0.7.12)的bwa:
[itsupport@omics ~]$ 模組載入 bwa/0.7.12 bwa/0.7.12 已載入
現在您可以運行這個舊版本的bwa:
[itsupport@omics ~]$ bwa 程式:bwa(基於 Burrows-Wheeler 轉換的比對)版本:0.7.12-r1039 聯絡人:李恆用法:bwa [選項] 指令:索引 FASTA 格式的索引序列 mem BWA-MEM 演算法 ...
正在載入模組的替代版本
[itsupport@omics ~]$ 模組載入 bowtie2/2.2.5 bowtie2/2.2.5 已載入 [itsupport@omics ~]$ 模組載入 bowtie2/2.3.4 bowtie2/2.2.5 已解除安裝 bowtie2/2.3.42/2.3. 92.5 已載入模組. bowtie2/2.3.4
模組指令快速參考
| 命令 | 描述 |
| 模組列表 | 列出目前已載入的模組 |
| 模組可用 | 顯示可供載入的模組 |
| 模組可用 [名稱] | 僅顯示適用於名為 [name] 的應用程式的模組 |
| 模組關鍵字 [word1] [word2] … | 顯示符合搜尋條件的可用模組 |
| 模組是什麼 [模組名稱] | 顯示特定模組的描述 |
| 模組幫助 [模組名稱] | 顯示幫助訊息 |
| 模組載入 [模組名稱] | 根據模組檔案配置您的環境。 |
| 模組載入 [模組名稱]/[版本] | 載入模組的特定版本 |
| 模組載入 [mod A] [mod B] … | 載入模組列表 |
| 模組卸載 [module_name] | 回滾模組檔案執行的配置 |
| 模組卸載 [模組 A] [模組 B] … | 卸載模組列表 |
| 模組交換 [模組 A] [模組 B] | 卸載模組檔 A 並載入模組檔 B |
| 模組清除 | 卸載所有目前已載入的模組 |
在 shell 腳本中使用模組
以下是在 shell 腳本中使用模組的範例:
#!/bin/bash # 清理第一個模組 purge # 載入此腳本所需的模組 module load bwa/0.7.12 # 執行資料分析 bwa mem reference.fa reads1.fq reads2.fq > aligned_samqirs.
載入具有先決條件的模組
有些模組可能需要依賴其他模組才能正常運作,載入此類模組時,系統會提示使用者載入必要的先決模組。.
[itsupport@omics ~]$module load bismark Lmod 偵測到以下錯誤:在未載入以下模組的情況下,無法載入模組「bismark/0.19.0」:bowtie2 處理下列模組時發生錯誤: 模組全名 模組檔案名稱 --------------- --------------- bismark/0.19.0 /software/M.
[itsupport@omics ~]$module load bowtie2 bowtie2/2.3.4 已加載 [itsupport@omics ~]$module load bismark bismark/0.19.0 已加載
軟體
以下列出的軟體包已集中安裝在 HPCF2 叢集中,您只需使用 module 命令載入即可使用:
| 軟體名稱 | HPCF2 上的模組名稱 | 已安裝版本 | 首頁 | 描述和功能 |
| 7-Zip | 7-Zip | 16.02 | http://www.7-zip.org/ | 檔案歸檔程式用於將檔案群組放置在稱為「歸檔」的壓縮容器中。. |
| ANNOVAR | ANNOVAR | 2020年6月8日 | http://annovar.openbioinformatics.org/ | 從不同基因組中檢測到的遺傳變異進行註釋 |
| BamTools | bamtools | 2.3.0 2.5.1 | https://github.com/pezmaster31/bamtools | 終端使用者處理 BAM 檔案的工具包 |
| BamUtil | bamUtil | 1.0.13 1.0.14 | https://genome.sph.umich.edu/wiki/BamUtil | 用於操作 BAM/SAM 檔案的最終使用者程序 |
| bcl2fastq | bcl2fastq | 2.19 2.20 | https://support.illumina.com/sequencing/sequencing_software/bcl2fastq-conversion-software.html | 將資料解復用,並將 Illumina 定序系統產生的 BCL 檔案轉換為下游分析的標準 FASTQ 檔案格式。 |
| bedGraphToBigWig | bedGraphToBigWig | 4 | https://www.encodeproject.org/software/bedgraphtobigwig/ | 將 bedGraph 檔案轉換為 bigWig 文件 |
| 床工具 | 床工具 | 2.12.0 2.17.0 2.27.1 | http://bedtools.readthedocs.io/en/latest/ | 一套實用工具集,可用於各種基因組分析任務,例如合併和重組來自多個檔案的基因組區間,這些檔案格式廣泛支援 BAM、BED、GFF/GTF 和 VCF 等。 |
| 生物Perl | 生物Perl | 1.7.2 | http://bioperl.org/ | 用於生物資訊學、基因組學和生命科學的開源 Perl 工具 |
| 俾斯麥 | 俾斯麥 | 0.14.3 0.19.0 0.20.0 | https://www.bioinformatics.babraham.ac.uk/projects/bismark/ | 一種用於比對亞硫酸氫鹽轉化序列讀段並確定胞嘧啶甲基化狀態的工具 |
| 領結 | 領結 | 1.0.0 1.2.2 2.2.5 2.3.4 2.3.4.1 2.3.4.3 2.4.2 | http://bowtie-bio.sourceforge.net/index.shtml | 一種超快速、記憶體效率高的短讀比對器 |
| 領結 2 | 領結2 | 2.2.5 2.3.4 2.3.4.1 2.3.4.3 2.4.2 | http://bowtie-bio.sourceforge.net/bowtie2/index.shtml | 一種超快速且記憶體效率高的工具,用於將定序讀段比對到長參考序列。 |
| 百威英博 | bwa | 0.6.2 0.7.12 0.7.17 | http://bio-bwa.sourceforge.net/ | 利用 Burrows-Wheeler 變換將短讀序列比對到索引參考序列上 |
| 卡努 | 卡努 | 1.5 1.6 1.9 | http://canu.readthedocs.io/ | 用於大型和小型基因組的單分子序列組裝器 |
| CellRanger | CellRanger | 2.0.1 2.1.0 2.2.0 3.0.2 3.1.0 4.0.0 6.1.2 | https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/what-is-cell-ranger | 一套分析流程,用於處理 Chromium 單細胞 RNA-seq 輸出,以進行讀段比對、生成基因-細胞矩陣以及執行聚類和基因表現分析。 |
| 切割適應 | 切割適應 | 1.16 1.8.1 2.3 3.4 | https://github.com/marcelm/cutadapt | 從高通量定序資料中移除接頭序列 |
| DESeq2 | DESeq2 | 1.10.1 1.18.1 | https://bioconductor.org/packages/release/bioc/html/DESeq2.html | 基於負二項分佈的差異基因表現分析 |
| EBSeq | EBSeq | 1.9.3 1.18 | http://bioconductor.org/packages/release/bioc/html/EBSeq.html | 一個用於RNA-seq數據基因和異構體差異表達分析的R軟體包 |
| FastQC | FastQC | 0.11.8 0.11.9 | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ | 用於高通量定序資料的品質控制工具 |
| Fastx 工具包 | FASTX 工具包 | 0.0.14 1.3.0 | http://hannonlab.cshl.edu/fastx_toolkit/ | 一套用於短讀FASTA/FASTQ檔案預處理的命令列工具 |
| 基因組分析工具包 (GATK) | 基因組分析TK | 3.7 3.8.1.0 4.1.9.0 4.2.0.0 | https://software.broadinstitute.org/gatk/ | 種類繁多的工具,主要用於變異發現和基因分型 |
| 荷馬 | 荷馬 | 4.9 4.11 | http://homer.ucsd.edu/homer/ | HOMER(基序富集超幾何最佳化)是一套用於基序發現和下一代定序分析的工具。 |
| HTSeq | HTSeq | 0.6.1 0.9.1 | https://htseq.readthedocs.io/en/release_0.9.1/ | 一個提供基礎架構的 Python 包,用於處理來自高通量定序分析的數據 |
| IDBA | idba | 1.1.3 | https://github.com/loneknightpy/idba | 用於二代定序讀段的基本迭代 de Bruijn 圖組裝器 |
| Java | Java | 8.0_161 9.0.4 10.0.2 11.0.9 12.0.2 13.0.2 | https://www.java.com | 一種通用電腦程式語言,它具有並發性、基於類別、物件導向等特點,並且專門設計成盡可能減少實現依賴性。 |
| MACS | MACS | 2.0.10-2012.06.06 2.1.0-2015.04.20 2.1.1-2016.03.09 2.1.2-2019.09.06 | http://liulab.dfci.harvard.edu/MACS/ | 基於模型的ChIP-Seq分析(MACS)用於識別轉錄因子結合位點 |
| 媽媽 | 媽媽 | 3.22 3.23 4.0.ob2 | http://mummer.sourceforge.net/ | 一種用於快速比對整個基因組(無論是完整基因組還是草圖基因組)的系統 |
| muTect | muTect | 1.1.4 1.1.5 | http://archive.broadinstitute.org/cancer/cga/mutect | 利用新一代定序資料鑑定癌症基因組中的體細胞點突變 |
| NCBI-blast | NCBI-blast | 2.2.27+ 2.7.1+ | https://blast.ncbi.nlm.nih.gov/Blast.cgi | BLAST 程式用於尋找生物序列之間的相似區域。它將核苷酸或蛋白質序列與序列資料庫進行比較,並計算統計顯著性。. |
| 腫瘤控制者 | 腫瘤控制者 | 1.9.6.1 1.9.9.0 | http://portals.broadinstitute.org/oncotator/ | 一個用於註釋人類基因組點突變和插入缺失的Web應用程序,其中包含與癌症研究人員相關的數據。 |
| 梨 | 梨 | 0.9.10 0.9.11 | https://www.h-its.org/downloads/pear-academic/ | 一種超快速、記憶體效率高且高度精確的雙端讀取合併演算法。. |
| Perl | Perl | 5.26.1 | https://www.perl.org | 一種高階的、通用的、解釋型的、動態程式語言 |
| 皮卡德 | 皮卡德 | 2.17.4 2.18.9 2.25.2 | https://broadinstitute.github.io/picard/ | 用於操作 SAM 檔案的命令列實用程式 |
| Python 2 | python2 | 2.7.14 | https://www.python.org | 一種用於通用程式設計的解釋型高階程式語言 |
| Python 3 | python3 | 3.6.4 3.7.10 3.9.2 | https://www.python.org | 一種用於通用程式設計的解釋型高階程式語言 |
| 奇美 | 奇美 | 1.9.1 | http://qiime.org/ | 一個用於從原始DNA定序資料進行微生物組分析的開源生物資訊學流程 |
| QIIME2 | QIIME2 | 2017.12 2019.7 | https://qiime2.org/ | 一款注重數據和分析透明度的微生物組分析軟體包 |
| R | R | 3.4.3 3.5.1 3.6.1 4.1.0 | https://www.r-project.org | 一種用於統計計算和圖形的程式語言和自由軟體環境 |
| RNAmmer | RNAmmer | 1.2 | http://www.cbs.dtu.dk/cgi-bin/nph-sw_request?rnammer | 預測全基因組序列中的核醣體RNA基因 |
| 回應掃描電鏡 | 回應掃描電鏡 | 1.2.31 1.3.0 1.3.3 | http://deweylab.github.io/RSEM/ | 利用RNA-Seq資料對基因和亞型表現進行精確量化 |
| SAMtools | samtools | 1.6 1.8 1.9 1.11 | samtools.sourceforge.net | SAM Tools 提供各種實用工具來操作 SAM 格式的比對結果,包括排序、合併、索引以及產生按位置排列的比對結果。 |
| 黑桃 | 黑桃 | 3.10.0 3.11.1 3.13.0 | http://cab.spbu.ru/software/spades/ | 聖彼得堡基因組組裝器-是一個包含各種組裝流程的組裝工具包。 |
| 星星 | 星星 | 2.7.8a 2.7.9a | https://github.com/alexdobin/STAR | RNA-seq 比對器 |
| 斯特雷爾卡 | 斯特雷爾卡 | 1.0.15 2.8.4 2.9.7 | https://github.com/Illumina/strelka | 生殖系和體細胞小變異檢測器 |
| TrimGalore | TrimGalore | 0.4.1 0.4.5 | https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/ | 一個圍繞 Cutadapt 和 FastQC 的封裝工具,用於對 FastQ 文件進行一致的品質和接頭修剪。 |
| 特里莫馬蒂克 | 特里莫馬蒂克 | 0.33 0.36 0.38 | http://www.usadellab.org/cms/index.php?page=trimmomatic | 一款適用於 Illumina NGS 資料的靈活讀取修剪工具 |
| tRNAscan-SE | tRNAscan-SE | 1.3.1 | http://eddylab.org/software.html | 大規模基因組序列中的tRNA檢測 |
| 驗證BamID | 驗證BamID | 1.1.2 1.1.3 | https://genome.sph.umich.edu/wiki/VerifyBamID | 驗證特定文件中的讀取序列是否與先前已知的個體(或個體群)基因型匹配,並檢查讀取序列是否被兩個樣本混合污染。 |
註:以上列表並不完整。請聯絡我們確認您所需的軟體是否可用。.
HPCF2 叢集上的作業排程系統 (PBS Pro)
所有作業必須透過批次作業系統 (PBS Pro) 進行排程。作業提交至 PBS 時,需指定所需的資源,包括佇列、CPU 數量、記憶體大小和運行時間。 PBS 將在資源可用時,在資源使用受限的情況下,於可用的運算節點上執行作業。.
通用作業佇列
| 佇列 姓名 | 處理器最大數量 每項工作 | 最大記憶體(GB) 每項工作 | 正在運行的最大作業數 每用戶 | 最大作業排隊數量 每用戶 | 麥克斯·沃爾蒂姆 (小時) |
| 小的 | 2 | 10 | 18 | 40 | 6 |
| 小擴充 | 2 | 10 | 6 | 12 | 60 |
| 中等的 | 12 | 50 | 12 | 25 | 24 |
| medium_ext | 12 | 50 | 6 | 8 | 60 |
| 大的 | 12 | 120 | 3 | 4 | 84 |
| 遺產 | 12 | 45 | 8 | 16 | 96 |
| 測試 | 24 | 190 | 1 | 1 | 1 |
特殊佇列(按需提供)
有時,某些作業可能需要比常規作業佇列中可用資源更多的運算資源。在這種情況下,請將您的作業執行計劃和所需資源的詳細資訊發送給我們。根據目前叢集資源的使用情況和趨勢,我們可能會設定一個具有特定運算資源的定製作業佇列,以便在短期內支援您的作業執行。.
作業腳本
PBS工作指南
以下是作業命令檔中常用的一些 PBS 選項,也可以在命令列中使用 qsub 命令。.
| PBS工作指南 | 描述 |
| #PBS -A 帳戶 | 導致工作時間計入「帳戶」。. |
| #PBS -N myJob | 指定作業名稱。預設值為PBS作業腳本的名稱。. |
| #PBS -l nodes=4:ppn=2 | 每個節點的節點數和處理器數。. |
| #PBS -l walltime=01:00:00 | 設定此作業可以運行的最長時間(實際運行時間)。 (walltime=hh:mm:ss) |
| #PBS -l mem=n | 設定分配給作業的最大記憶體量。. |
| #PBS -q 佇列名稱 | 將您的作業指派到特定佇列。. |
| #PBS -o mypath/my.out | 標準輸出的路徑和檔名。. |
| #PBS -e mypath/my.err | 標準錯誤檔案的路徑和檔案名稱。. |
| #PBS -j oe | 將作業的標準錯誤流與標準輸出流合併的合併選項。. |
| #PBS -M 電子郵件地址 | 向指定使用者信箱地址發送電子郵件通知。. |
| #PBS -m | 設定當出現以下情況時要傳送給使用者的電子郵件: |
| #PBS -ma | a – 作業中止 |
| #PBS -mb | b – 工作開始 |
| #PBS -我 | e – 工作結束 |
| #PBS -rn | 表示如果作業失敗,則不應重新執行。. |
| #PBS -S 殼 | 設定要使用的 shell。請確保 shell 的完整路徑正確。. |
| #PBS -V | 將所有環境變數匯出到作業中。. |
| #PBS -W | 用於設定兩個或多個作業之間的作業依賴關係。. |
以下是一些可以嘗試的實用批次作業指令:
| 指示 | 功能 |
| -S /bin/bash | 指定要使用的 shell。. |
| -N 工作名稱 | 為作業指定一個名稱。該名稱將顯示在 qstat 的輸出中。. |
| -M 使用者名稱@hku.hk | 指定接收通知郵件的電子郵件地址。. |
| -m abe(或 a、b 和 e 的任意子集) | 指定郵件發送時間:a — 中止,b — 開始,e — 結束。請參閱下方關於郵件的說明。. |
PBS作業輸出/錯誤文件
您可以指定 PBS 作業輸出/錯誤檔案的完整檔案名稱:
| PBS工作指南 | 描述 |
| #PBS -o mypath/my.out | 標準輸出的路徑和檔名 |
| #PBS -e mypath/my.err | 標準錯誤檔案的路徑和檔案名 |
或者,您也可以透過目錄來指定它們:
| PBS工作指南 | 描述 |
| #PBS -o mypath | 標準輸出路徑。輸出檔案將產生為例如 123.omics.OU 的形式。 |
| #PBS -e mypath | 標準錯誤檔案的路徑。錯誤檔案將產生為例如 123.omics.ER。 |
如果未指定 -e 和 -o 這兩個指令,則會使用如下所示的工作目錄和預設檔名:
| 輸出/錯誤文件 | 描述 |
| 輸出檔案 | 將產生一個名為 $PBS_JOBNAME.o$PBS_JOBID 的文件,例如 myfirstjob.o123 |
| 錯誤檔案 | 將產生一個名為 $PBS_JOBNAME.e$PBS_JOBID 的文件,例如 myfirstjob.e123 |
PBS Pro 使用作業提交所在的目錄來定義作業的工作目錄,而不管作業提交腳本位於何處。請注意,預設情況下,PBS 調度程序會將資料儲存在您的主目錄中。但是,我們建議您… 指定檔案名稱的完整路徑.
尖端:
PBS作業變數(例如常用的$PBS_JOBID和$PBS_JOBNAME) 不是 將在 Omics 叢集的 #PBS 作業指令中解決,該叢集採用新的 PBS 調度系統(與 statgenpro 叢集不同)。.
PBS互動招聘
PBS 的使用不僅限於批次作業。它還允許用戶在需要時以互動方式使用計算節點。例如,使用者可以在計算節點上使用 R 提供的開發環境,並執行他們的作業(直到運行時間到期)。.
使用者無需編寫提交腳本,而是直接將作業要求傳遞給 qsub 命令。例如,以下 PBS 腳本:
#PBS -l nodes=1:ppn=4 #PBS -l mem=2gb #PBS -l walltime=15:00:00 #PBS -q small
這將對應於帶有以下參數的 qsub 命令:
qsub -I -q small -l nodes=1:ppn=4,walltime=15:00:00,mem=2gb
因此,一旦有符合指定規格的節點可用,PBS調度器將立即為使用者指派4個核心,然後自動將使用者登入其中一個運算節點。任何互動式PBS作業(例如qsub -I)將在空閒30分鐘後被註銷,以釋放已指派但未使用的資源。.
工作管理
提交批次作業
批次作業允許使用者提交多個作業,這些作業會被排隊,然後在叢集中所需的資源可用時由作業調度器執行。使用者以腳本的形式提交作業,腳本中包含執行作業的指令。作業的輸出會寫入檔案以供後續檢視。您可以編寫批次作業來執行任何可以在命令列中輸入的操作。.
以下是一個批次腳本範例(檔案名稱 simple.sh):
#!/bin/bash #PBS -l nodes=1:ppn=1 #PBS -l mem=2g #PBS -l walltime=00:01:00 #PBS -m ae #PBS -N omics-simple 15TPBS -siq small
模組載入 bamtools/2.5.1 bamtools -v
然後您可以透過以下方式提交此作業腳本:
$ qsub simple.sh
有關可在腳本文件中指定的 PBS 作業參數的更多信息,請參閱「PBS 作業指令」。.
查看工作狀態
提交作業後,您可以使用 qstat 指令查看作業狀態和作業佇列。如果計算節點上有可用資源,您的作業狀態應變為 R(正在執行);如果計算節點繁忙,您的作業狀態可能顯示為 Q(已排隊),直到您要求的資源可用為止。狀態為 C 的作業表示已完成。.
演出工作
$ qstat -rn1
例子:
[itsupport@omics ~]$qstat -rn1 omics: 請求 請求 運行時間 作業 ID 使用者名稱 佇列 作業名稱 會話 ID NDS TSK 記憶體 時間 S 時間 --------------- -------- -------- ---------- ------ --- --- ------ ----- - ----- 1649.omics itsupportNTarge BWA_- --- --- 201505 1050g 1050505 01 R hpch01/0*12
顯示排隊/已保留的作業
$ qstat -i
例子:
[itsupport@omics ~]$qstat -i omics: 請求 請求 運行時間 作業 ID 使用者名稱 佇列 作業名稱 會話 ID NDS TSK 記憶體 時間 S 時間 --------------- -------- -------- ---------- ------ --- --- ------ ----- - ----- 1651.omics ititport large B1109009 109029:01099
顯示所有任務(包括已完成的任務)
$ qstat -xan1
例子:
[itsupport@omics Exome]$qstat -xan1 omics: 請求 請求 Elap 作業 ID 使用者名稱 佇列 作業名稱 SessID NDS TSK 記憶體 時間 S 時間 --------------- -------- -------- ---------- ------ --- --- ------ ----- - ----- 1648.omics itsupportarge B1 ------ --- -- 48:00 F 00:03 hpch08/0*12 1649.omics itsupport large BWA_23NT 121502 1 12 90gb 48:00 R 01:12 hpch08/0*12 1650.icsics 1650 B12 hpch08/0*12 1650。 48:00 F 00:01 hpch08/0*12 1651.omics itsupport 大型 BWA_43NT -- 1 12 90gb 48:00 Q -- --
顯示職位詳情
$ qstat -xf JobID
例子:
[itsupport@omics]$qstat -f 1649 作業 ID:1649.omics 作業名稱 = BWA_34NT 作業擁有者 = itsupportn@omics 資源已用 cpupercent = 916 資源已用 cput = 05:56:56 資源已用 mem = 916 資源已用 cput = 05:56:56 資源已用 mem = 916 資源已用 cput = 05:56:56 資源已用 mem = 56 筆使用資源vmem = 92494740kb 資源已使用 walltime = 01:28:38 作業狀態 = R ...
檢查已完成作業的資源使用情況
功能: 顯示特定工作的工作資訊和資源使用百分比
用法: 我的工作
例如:
$ myjob 440356 HPCF 作業 440356 的作業資訊與使用摘要: +-------------------+----------+-------+-------------+------+---------------------+-----------+------+-------+ | jobid | username | queue | jobname |Ttime | +-------------------+----------+-------+-------------+------+---------------------+----------+------+-------+ | 440356.statgenpro | kelvin | large | Large | 0 | 2016-08-30 04:31:30 | 25.36 | 8.2581 | +-------------------+----------+-------+-------------+------+---------------------+----------+------+-------+ +---------------------+---------------------+----------+----------+------+------+-------+----------+--------+ | 提交時間 | 開始時間 | wtime@ |wpro15TT5 | 1515 | +---------------------+---------------------+----------+----------+------+------+----------+--------+ | 2016-08-29 22:26:16 | 2016-08-29 22:26:18 | 06:05:13 | 24:00:00 | 3034.30. 12 | +---------------------+---------------------+----------+----------+------+------+-------+----------+--------+ ES =退出狀態;% = 使用率;# = 請求值;@ = 已使用;mem@/vmem@(GB);nproc = 處理器數量;@ = 已使用;mem@/vmem@(GB);nproc = 處理器數量;
只有任務所有者才能查看使用情況。
$ myjob 123456 錯誤:您(kelvin)不是作業 123456 的所有者。.
查看已完成作業的資源使用匯總
功能: 顯示您最近工作的摘要和資源使用百分比
用法: 我的工作 [-v] [-j] []
描述: 顯示您最近工作的摘要和資源使用百分比
可選參數:
-v 啟用詳細模式,請求並顯示資源使用數據,包括運行時間/記憶體/CPU。
-j 依作業 ID 編號(而非預設的結束時間)列出最後完成的作業。請注意,按作業 ID 列出的作業可能與按結束時間列出的作業不同。.
指定要顯示的作業數量(預設值:20)。
範例
$ myjobs 5 您最近完成的 5 個 HPCF 作業(按結束時間排序): +-------------------+----------+-------+------------------------+------+---------------------+--------+-------+--------+ | 作業 ID | 使用者名稱 | 佇列 | 135 月作業名稱 | ES | 結束時間 | +-------------------+----------+-------+------------------------+------+---------------------+--------+-------+--------+ | 458952.statgenpro |kelvin | large | GATK_CK02 | 0 | 2016-10-28 16:45:05 | 69.82 100.458 10.45.05 | 69.82 | | large | GATK_NG07 | 0 | 2016-10-28 11:19:56 | 53.44 | 10.70 | 0.40 | | 458853.statgenpro | 開爾文 | 大 | GATK_CK03 | 10.80 | 0.42 | | 458862.statgenpro | 開爾文 | 大 | GATK_YJ01 | 0 | 2016-10-28 11:09:05 | 49.90 | 10.30 | 0.245 | 4558 0 | 2016-10-28 10:57:39 | 55.96 | 10.30 | 0.11 | +-------------------+----------+-------+------------------------+------+---------------------+--------+-------+--------+ ES = 退出狀態;% = 運行時間
詳細模式
$ myjobs -v 5 您最近完成的 5 個 HPCF 作業(按結束時間排序): +-------------------+----------+-------+------------------------+------+---------------------+--------+-------+--------+--------------+--------+-------+-------+----------+-----------+ |obidue name | mem% | wtime% | CPUTime@ | CPUno# | mem@ | mem# | wtime@ | wtime# | +-------------------+----------+-------+------------------------+------+---------------------+--------+-------+--------+----------+----------+--------------- 184-----84 184-----. GATK_CK02 | 0 | 2016-10-28 16:45:05 | 69.82 | 10.80 | 0.42 | 00:41:55 | 2 | 1.08 | 10.00 | 00:30:01 |12 | 1.08 | 10.00 | 00:30:01010000 0000大 | GATK_NG07 | 0 | 2016-10-28 11:19:56 | 53.44 | 10.70 | 0.40 | 00:31:03 | 2 | 1.07 | 10.00 | 00:31:03 | 2 | 1.07 | 10.00 | 00:29:03 |開爾文 | 大 | GATK_KC03 | 0 | 2016-10-28 11:13:53 | 69.20 | 10.80 | 0.42 | 00:42:17 | 2 | 1.08 | 10.00:00:42:17 | 2 | 1.08 | 10.00:00:30 | 458862.statgenpro | 開爾文 | 大 | GATK_YJ01 | 0 | 2016-10-28 11:09:05 | 49.90 | 10.30 | 0.24 | 00:16:57 | 2 | 1.030 | 0.030 | 120:00:00 | | 458858.statgenpro | 開爾文 | 大 | GATK_KC04 | 0 | 2016-10-28 10:57:39 | 55.96 | 10.30 | 0.11 | 50:08:5 | 08:5 | 00:07:58 | 120:00:00 | +-------------------+----------+-------+------------------------+------+---------------------+--------+-------+--------+----------+--------+-------+-------+----------+ ES = 退出狀態;% = 使用率;wtime = 實際運行時間;處理器數量;mem@/vmem@/mem# 單位為 GB
按 JobID 號顯示最近的作業
$ myjobs -j 5 您最近完成的 5 個 HPCF 作業(按 JobID): +-------------------+----------+-------+------------------------+------+---------------------+--------+-------+--------+ | jobid | username | queue | jobname | ES End End Time Time Time cpu13Ttime | +-------------------+----------+-------+------------------------+------+---------------------+--------+-------+--------+ | 458952.statgenpro |kelvin | large | GATK_CK02 | 0 | 2016-10-28 16:45:05 | 69.82 | 10.458 月 | | large | GATK_YJ01 | 0 | 2016-10-28 11:09:05 | 49.90 | 10.30 | 0.24 | | 458860.statgenpro | 開爾文 | 大 | GATK_NG07 0 | 20185-20018 | 10.70 | 0.40 | | 458858.statgenpro | 開爾文 | 大 | GATK_KC04 | 0 | 2016-10-28 10:57:39 | 55.96 | 10.30 | 0.115 | 4585 | 2016-10-28 10:54:35 | 55.46 | 10.30 | 0.11 | +-------------------+----------+-------+------------------------+------+---------------------+--------+-------+--------+ ES = 退出狀態;% = 使用率;wtime = --------+-------+--------+ ES =退出狀態;
刪除職位
$ qdel 作業ID
例子:
[itsupport@omics]$qdel 1651
如何利用多核心CPU加快檔案壓縮速度?
預設情況下,使用 7z 進行檔案壓縮僅使用單一 CPU 核心,因此在歸檔大量檔案時可能需要相當長的時間。.
我們可以透過在 7z 中啟用多個 CPU 核心來加快速度。.
我們可以使用“-mm=Bzip2”參數指定“bzip2”演算法,並使用”-mmt=“參數指定線程數。<#THREAD>”「 爭論。.
下面是一個使用 4 個執行緒的範例指令。.
7za a -mm=Bzip2 -mmt=4 output_zip_file input_file
如何查看我已使用了多少資料儲存空間?
使用者可以使用「df」指令顯示其主資料夾的磁碟配額使用情況。.
[tmchan@omics ~]$df -h ~/ 檔案系統 容量 已用 可用 已用% 掛載點 compellent2:/home 1000G 308G 693G 31% /home
如何使用 VS Code 登入 HPCF?
由於安全策略的原因,我們的HPCF叢集採用了特殊配置。請將以下設定複製並新增到您的SSH設定檔中,然後嘗試從VSCode重新連線到「omics」。.
主機 omics 主機名稱 omics 使用者 username 代理指令 ssh -q -W %h:%p username@omics.staging1.cpos.hku.hk
注意:請將上述文字中的「username」替換為您自己的 HPCF 登入帳號名稱。
您可以參考以下螢幕截圖找到您電腦上的 SSH 設定文件,然後直接從 VSCode 開啟該檔案:

為什麼我的 VS Code 無法登入 HPCF?
請從下方連結取得 1.98.2 版本的 VSCode 便攜版,並使用此版本連接到我們的 HPCF 叢集。建議使用 VSCode 便攜式版,因為它不會自動升級。.
https://update.code.visualstudio.com/1.98.2/win32-x64-archive/stable
檔案名稱:VSCode-win32-x64-1.98.2.zip
md5sum:db4fefdae4986ef4ba5ba4524d8488cd
此外,建議在 VSCode 設定中停用其更新功能。您可以前往: 檔案 > 首選項 > 設定 然後搜尋“更新”,接著:
- 取消勾選“更新:啟用 Windows 後台更新”
- 將“更新:模式”設定為“沒有任何”

如何在HPCF中啟動RStudio/Jupyter Notebook?
如果您之前沒有在電腦上設定過 X11 轉發,請依照下列步驟操作:
- 安裝 MobaXterm
- 從官方網站下載安裝包: https://mobaxterm.mobatek.net/
- 安裝完成後,開啟 MobaXterm
- 檢查“X 伺服器”選項是否已啟動。如果已停止,請按一下該選項。

- 如下所示,表示「X 伺服器」已啟動。

RStudio
- 連接到 HPCF2(又稱 omics);然後,使用以下命令檢查 RStudio 中可用的軟體/模組:
ml av rstudio

- 輸入以下命令以載入 RStudio 軟體模組(RStudio/1.4.1717(以獲得最佳相容性):
ml RStudio/1.4.1717

螢幕上出現「RStudio/1.4.1717 已載入」的訊息。.
注意:您也可以同時載入 R 軟體模組(例如:R/4.2.1)以在 RStudio 中啟動更高版本的 R。預設的 R 版本為 3.5.2。.
- 輸入以下指令打開 RStudio:
rstudio
命令視窗中可能會出現以下訊息:

同時,RStudio 的新視窗應該已經載入完畢:

Jupyter Notebook
- 使用以下命令檢查 Jupyter Notebook 中可用的軟體/模組:
ml av ju

- 輸入以下指令載入 Jupyter Notebook 軟體模組:
ml jupyter/notebook

你應該查看這些資訊:
“firefox/latest 已載入”
jupyter/notebook/ 已載入」。.
- 輸入以下指令開啟 Jupyter Notebook:
Jupyter Notebook
命令視窗中可能會出現以下訊息:

同時,應該會載入一個新的 Firefox 視窗(其中包含 Jupyter Notebook):

啟動 Jupyter Notebook 進程後,請在新的 SSH 終端機中使用下列命令之一來設定 SSH 本機連接埠轉送:
ssh -N -f -L localhost:8889:omics:8889 username@hpcf2.staging1.cpos.hku.hk 或 ssh -N -f -L 8889:omics:8889 username@hpcf2.staging1.cpos.hku.M 127.0.0.1:8889:omics:8889 username@hpcf2.staging1.cpos.hku.hk
(連接埠 8889 僅為範例,請將其變更為 Jupyter Notebook 實際監聽的連接埠)
如何解決連接到 HPCF 時出現的 SSH 主機識別警告?
登入 HPCF 時,您可能會遇到「警告:遠端主機標識已變更!」提示:

上述錯誤表示由於先前的伺服器安全維護,我們HPCF伺服器的安全金鑰已更新。如果您自2024年10月以來未登入過我們的HPCF,則此更新屬於正常情況,且安全無虞。.
要解決這個問題,你需要… 消除 請從您的電腦中提取舊密鑰。請打開終端機並使用以下命令:
ssh-keygen -R hpcf2.staging1.cpos.hku.hk

運行命令後,請再次嘗試連接伺服器:
ssh your_username@hpcf2.staging1.cpos.hku.hk
(請將 your_username 替換為您的實際使用者名稱)
當被問及「您確定要繼續連接嗎(是/否/[指紋])?」時,請鍵入 是的 然後按 Enter 鍵,之後您應該可以輸入密碼並登入 HPCF。.

聯絡我們
itsupport.cpos@hku.hk
核心設施
地址
六樓
香港賽馬會大樓
跨學科研究
沙遜路5號
香港薄扶林
電話:2831-5500
傳真:2818-5653
網址:https://staging1.cpos.hku.hk
電子郵件: enquiry.cpos@hku.hk
辦公時間
週一至週五:上午9:00 – 下午5:30
下午1點至2點不提供樣品及貨物接收服務
週六、週日及所有大學及公共假日休館。.



