醫療行業各種數據是現在以及未來醫療行業充分服務于病人的基礎之一,保護數據并加以合理的利用已成為未來醫院發展的關鍵因素,也是未來醫院管理信息化(HIS)階段、臨床管理信息化(CIS)階段、局域醫療衛生服務(GMIS)階段最必要的支撐。因此,數據的集中管理與備份及業務的連續性成為醫療信息管理的關鍵。
1、我國醫療衛生行業信息化發展起步較晚,在整體IT 投資規模上,目前國內醫療行業每年實際的投入只占醫院年收入的0.3-0.5%,而發達國家和地區是3-5%,導致國內多數醫院對災備系統的建設處于極低水平,甚至沒有任何保護措施。
2、已有災備系統的醫院,大多數采用共享存儲的HA架構實現關鍵系統(如HIS、LIS、PACS)的雙機熱備,這種架構只是對業務連續性進行了適當的處理,根本無法防范數據庫災難和存儲的單點故障,使得關鍵系統處于高風險之中。
3、醫院系統的查詢壓力大是眾所周知的事情,業務高峰時查詢動作不但無法進行甚至會導致服務器宕機,而傳統的容災備機對查詢問題沒有任何解決措施,災難未發生,備機空置造成資源極大浪費。
4、備用數據的正確性和完整性是災難恢復的重要指標,容災系統運行過程中,無法對備份數據進行有效的確認,是眾多醫院及其他用戶提出的容災需求中出現率很高的反饋。
常見災備技術分析
常見方式:
采用備份系統對關鍵業務數據做定時備份
---定時備份只是最基礎的數據保護方案
---定時保護方案,數據無法完全恢復
---故障后恢復時間長
核心數據庫采用本地HA保護
---數據庫HA保護方案,僅對數據庫本地保護, 無法實現異地災備,同時由于HA采用共享存儲的架構,無法應對數據庫災難,反而增加了單點故障的風險
在核心存儲和服務器端做冗余保護
---核心存儲和服務器冗余保護,主要是針對硬件故障的本地保護
常見技術:
文件系統下的文件拷貝
---數據傳輸效率低下,數據掛載時間長(即RTO時間長)
---未傳輸完整的文件,不會被系統所識別,在業務峰值較高的前提下,備機會有數據損失
---頻繁讀寫對I/O損耗大,大量的冗余文件降低磁盤的使用壽命,損壞風險增加
磁盤塊的拷貝
---磁盤壞道,無法被識別,磁盤寫入速度不一致,會造成數據丟失
---無法直接寫入數據文件中,備機先緩存,再寫入數據文件
---相關數據庫服務處于關閉狀態
---對數據檢驗效率低下,通常會丟失一段時間內的數據
日志解析方式
---受數據庫動作的限制,還原數據庫時間長,資源消耗大
---不適合大數據量數據庫的應用,數據組合時間長
---瓶頸是跨系統平臺的容災備份
---容災切換時間長
快(簇)照技術
---極有可能生成一份不一致的卷數據
---一旦卷數據有損壞,則快(簇)照數據也不復存在
---針對系統獨占文件的處理,屬于違背系統原理的操作,有產生致命錯誤的風險
方案設計原則
高性能原則:根據眾多用戶需求反饋和項目實施經驗,結合相關容災技術來確定我們解決方案的設計,保證RPO和RTO的完美平衡
高可靠原則:利用先進的底層驅動技術將穩定性發揮到極致,強大的容災容錯技術保證系統特定時間特定環境下的工作效率
高安全原則:考慮到用戶數據的特點,通過身份驗證、保密通信、訪問控制等手段完全保證數據安全性
易管理原則:簡潔友好的界面,利用全鼠標操作和對象圖標顯示,完成全部的管理工作,集中化的管理方式可以通過一個控制程序管理所有的備份和恢復作業等。
易擴展原則:平臺化、模塊化產品易于升級擴展,滿足客戶日益增長的數據容災需求,同時又能保護客戶現有投資,靈活適應未來業務的發展和容災系統的升級。
易維護原則:完善的監控和診斷機制,主動報警機制和事件通知功能,無需單獨的人工干預就可以及時發現風險,將損失降到最低。
方案目標
模擬用戶現有環境和災備需求,設計一套全面的,完整的容災備份系統方案,保證用戶的業務連續性和數據完整性。
基本功能目標包括:
1應對最廣泛的災難類型,實現無死角的容災防范;
2實現關鍵系統主備服務器數據實時同步,應急容災接管,采用系統以及數據庫可讀的形式進行增量同步,并且實時整合可讀的備份文件;
3實現以秒級為單位的數據同步及備份,保證數據零丟失;
4實現備份數據回滾到災難發生前任何時間節點或任意I/O操作;
5實現數據備份的一致性和斷點續傳功能;
6通過獨有帶寬優化技術,實現多種網絡帶寬情況下的災備系統建設;
7實現對生產系統的低干擾性,CPU使用率目標不超過5%,物理內存占用量目標不超過100M;
8充分適應生產系統和容災系統的環境:如多種操作系統平臺,主流或非主流數據庫類型,多種架構策略,虛擬化等;兼容絕大多數第三方主流硬件;
9按用戶需求設計相應模塊的組合,降低用戶災備系統建設成本;
10實現按需備份數據;
11實現多模式應用容災及實時備份:手動接管,自動接管,定時備份,實時備份;
12實現多種備份策略:一對一,多對一,多對多等
方案邏輯結構圖
1、實現醫院異地實時備份的完整數據災備保護及應用級容災
用戶HIS服務器(HA集群)通過容災備份軟件與異地HIS災備服務器搭建成一對一架構,實現數據實時同步,當災難發生時保證HIS應用的不間斷運行,同時實現數據實時備份,保證數據完整性,并實現災難發生前任意時間點或任意操作點的數據回滾
2、用戶LIS服務器(HA集群)通過容災備份軟件與異地LIS災備服務器搭建成一對一架構,實現數據實時同步,當災難發生時保證LIS應用的不間斷運行,同時實現數據實時備份,保證數據完整性,并實現災難發生前任意時間點或任意操作點的數據回滾
3、用戶EMR服務器、PACS服務器、PIVAS服務器通過容災備份軟件與異地災備服務器搭建成一對一架構,實現數據實時同步,當災難發生時保證LIS應用的不間斷運行,同時實現數據實時備份,保證數據完整性,并實現災難發生前任意時間點或任意操作點的數據回滾
4、容災備份一體機配置高性能多核處理器、高速內存、大容量磁盤空間,同時利用虛擬化技術構建與應用服務逐個對應的容災備份環境,保證災備系統穩定的前提下,充分利用系統資源,降低災備系統構建成本。
5、當院方有新系統上線時,可以首先分析現有災備系統資源使用情況,條件滿足情況下,無需購置新災備服務器,可在不影響任何業務前提下,利用虛擬化技術在容災備份工作站部署對應新系統的災備環境。
6、提供容災系統資源監控技術,不間斷的監測應用的狀況和整個應用環境的狀態,保證整個系統在最佳的狀態下運行。針對應用所使用的硬件,軟件,網絡環境等的穩定性與可靠性為基礎而設計資源監控。
7、將管理控制臺程序安裝在本地局域網內任意PC或服務器上,實現對整個容災系統的管理。
8、為用戶提供容災備份一體化的平臺,意味著用戶如果在今后需要對災備系統進行升級,只需要在平臺上搭建新的模塊即可實現,大大節約構建成本。
容錯CDP技術原理
1、數據感知與抓取
ENAS通過運行在Production Server端的Client模塊實時分析并獲取Production Server端的操作及數據。ENAS時刻感知Production Server端內是否有新交易變化產生,并在內存層抓取這些交易變化信息形成ENAS獨有的QL文件,同時封裝為TCP/IP數據包實時傳送至Standby Server端,Standby Server端接收后即時同步寫入,保持與Production Server端的一致。
2、數據傳輸
QL文件傳輸:QL格式是ENAS獨有的專項技術,通過對捕獲變化數據的壓縮加密,既保證低帶寬狀況下Production Server和Standby Server之間數據同步效率,同時增強了數據傳輸過程中的安全性。
首階段全量數據同步:在不中斷業務運行的前提下,ENAS讀取Production Server端所有Data Source已有存量數據,初始化為FBK文件同步到Standby Server端實時寫入。
Temporary增量數據同步:首階段全量同步過程中新產生的數據增量被捕獲后,經嚴格的邏輯校驗和順序標記實時寫入Standby Server端緩存,當全量同步結束后即執行寫入。
常規增量數據同步: 通過ENAS同步校驗機制,驗證Production Server和Standby Server兩端數據一致后,可按用戶設置進行時間點或I/O點的增量數據同步。
3、同步校驗與邏輯校驗
同步校驗:ENAS通過自有Check機制,主動偵測數據頭尾的一致性,從而判斷增量數據是否為軟件自身數據并校驗增量數據的可用性。該機制保證了ENAS實現主備機兩端數據同時在線的“雙活”狀態。
邏輯校驗:ENAS通過Logic Check程序,對捕獲的數據進行嚴格的I/O順序排列,保證系統邏輯關系的正確,并通過Log跟蹤分析數據的完整性和一致性。
4、災難判定與應急接管
ENAS通過Sockct對服務器IP、網卡、系統服務、應用進程等提供自定義方式的監控,滿足自定義條件的情況下,將自動執行容災切換,保證用戶業務連續性,ENAS同時提供人工手動接管功能。
5、時間定位與操作定位
ENAS提供按時間點和I/O點兩種策略,用來定位數據變化過程,在備份數據恢復的過程中,可按照 任意時間點(any point in time) 或 任意I/O操作點(any point in operating)的方式,進行回滾式恢復,結合強大的邏輯校驗機制,保證數據恢復后的可用性和準確性。
容錯CDP系統架構與部署
6、系統組成
系統由三部分組成:災備服務器端程序、ENAS控制管理平臺、生產服務器端程序。災備服務器端程序是系統的核心部件,負責整個備份系統的數據存儲等后臺服務; ENAS控制管理平臺是系統的統一配置、監控平臺,用戶可以通過該平臺實現備份、還原、同步、接管等作業配置,并進行作業的監控管理等功能;生產服務器端程序安裝在需要備份的源主機上實現備份功能,或需要恢復的目標主機上實現恢復功能。
7、災備服務器端程序
災備服務器端程序是安裝在備份服務器上的,是整個系統的核心部件。
災備服務器端模塊是多線程、多任務的運行架構,包含并行控制、存儲、備份、還原、合成備份、用戶組管理、版本控制、增量傳輸、增量存儲、通信控制、日志管理等子系統。災備服務器端程序負責將客戶端模塊實時增量傳輸過來的數據存儲到對應的存儲位置。
災備服務器端程序會根據用戶制定的備份策略對存儲的數據進行合成備份,生成對應時間點或操作點的備份數據版本的備份塊,同時備份服務器會保存所有的備份數據塊,以做到任意時間點或任意操作點恢復的功能。
8、生產服務器端程序
生產服務器端程序一共有Agent、文件備份與恢復、操作系統備份與恢復、MSSQL Server備份與恢復、Oracle備份與恢復、虛擬機備份與恢復、MySQL備份與恢復、Sybase備份與恢復等模塊。
9、控制管理平臺
基于ENAS控制管理平臺,主要是針對用戶的實際需求,將備份產品的特點、功能都集中展示和實現,體現集中管理理念,即所有的操作都在控制臺中完成,無需在源服務器上安裝額外的軟件,將對源服務器性能的影響降低,實現真正的綠色容災的效果。
ENAS控制管理平臺的功能:監控功能包括監控備份服務器的備份任務運行狀態及其報表;管理功能包括服務器運行參數、日志、用戶與組、組策略、備份視圖等管理;操作功能包括實現基本的備份、還原功能、數據刪除等功能。
10、系統部署模式
只需在備份服務器上安裝備份服務器端程序,同時將ENAS控制管理平臺也安裝到局域網內任意服務器上。在需要備份的源主機上安裝生產服務器端程序。
一般部署的大致步驟:
1.在備份服務器上安裝災備服務器端程序。
2.通過ENAS控制管理平臺配置服務器端的所有設置功能。創建用戶、分配權限,對不同的用戶分配對應的存儲空間等。
3.在需要備份的源主機上部署生產服務器端程序。在ENAS控制管理平臺上配置源主機的IP地址、機器名等信息。
4.在ENAS控制管理平臺上配置各源主機的備份策略、計劃。