數據庫 - 數據之家

數據庫,為某些組織及過程產生出來的數據,收集和存儲起來。 在數據庫管理中,某些數據庫會用作Operation或Analytics,所以被稱為操作類數據庫和分析類數據庫。


操作類數據庫
這種數據庫的設計應用在收集,修改和維護Application運作所產生的數據。因此,這些數據一般是動態的,和保持最新的。 最簡單的例子是庫存數據庫不斷更新並顯示庫存數量。

分析類數據庫
它用於存儲,查詢,分析數據。 這些靜態的數據在一段時間內被允許進行性能評估,決策和預測趨勢分析。 數據在正常情況不會被修改。 用來儲存交易的數據庫,某些企業會利用其數據分析營銷和營業表現等分析。 另外,數據庫內置了不同的模型,也被稱為數據庫模型,說到數據庫模型的歷史,在關聯式數據庫出現之前,分層數據庫和網絡數據庫都廣泛使用。


分層數據庫 (Hierarchical database)
它的構造為倒置的樹,每個Entity與另一個Entity只有一對多關係。 例如,產品由一個或多個供應商提供,由一個或多個會員購買, 會員進行一次或多次交易。 下圖顯示分層數據庫的結構:







每個Table之間有明確的連接。 此設計允許請求者/管理員快速檢索數據。例如, 如果產品不再銷售,該產品在Table的Parent或Child中相關的記錄也將被刪除。通常會出現一個問題,是Root Table下的實體,無法在沒有連接Table的實體的情況下存儲。 實際上,即使他們沒有購買任何東西,成員也可以存在。 然而,它可以通過在產品表中添加一個虛擬記錄來解決,或者將成員表與數據庫分開,以便成員可以寫入成員表中,但這個方法明顯是多了一個步驟,變得複雜了。


網絡數據庫 (Network database)
這種數據庫以節點和集合結構的形式表示。 這種設計有助解決分層數據庫的不足,並通過查詢快速訪問數據。 然而,用戶仍需要了解數據庫中的集合結構。




關聯式數據庫 (Relational database)
數據庫模型隨著時間和技術的發展而變化,為了解決數據不一致和完整性,關聯式數據庫模型因而誕生到今天仍是廣泛使用。

Table結構由Key,Attribute,Record和Relationship組成。Key被分類為主鍵(Primary Key)以及外鍵(Foreign Key)。Primary Key是每個記錄的獨一無二,不會有重覆的。關聯式數據庫中的Table只有一個主鍵。Foreign Key是一個表的主鍵在另一個表中定義。Attribute是指會員表中的實體的特徵,如姓名,年齡,生日。而Record即是每位會員:Alice,Brian等。Table和Table之間可有一對一,一對多或多對多的關係。

此外,該關係模型可以由ERD可視化。Entity Relationship Diagram (ERD)是一種在信息系統或組織內以圖形方式表示數據模型的結構和概念,有助於邏輯地設計數據庫。

Entity:能夠獨立存在且可以唯一標識的對象或事物。
Relationship:Entities之間的關係






Comments

Popular posts from this blog

Boosting vs Bagging? 別再胡亂用了!

機器學習之陷阱 - Imbalance Class Classification

Excel VBA - 自動生成分析報告