為大數據和較新的快速數據架構提供基礎設施并不是一個餅干切割的問題。兩者對硬件和軟件基礎設施都有著顯著的調整或改變。
較新的快速的數據架構與大數據架構有著顯著區(qū)別,并且快速數據提供了真正的聯機事務處理工具。理解大數據和快速數據需求的變化能夠幫助你做出正確的硬件和軟件選擇。
大數據架構
相比企業(yè)在以往通常收集數據的方法,大數據是通過更大的數據容量,分析和獲得更大的洞見的過程,大部分的數據(例如,社會媒體有關客戶的數據)是可訪問的公共云。這一數據,反過來,強調快速訪問,不再強調一致性,也造就了如Hadoop這樣一系列的大數據工具。因此,架構中的如下變化和重點是普遍的:
支持內部軟件,如Hadoop和Hive,以及橫向擴展的云功能硬件,用于社交媒體或其他大數據輸入起作用的場景。
支持現有的數據架構的虛擬化和私有云軟件。
支持大規(guī)模、深度和ad hoc分析軟件,且允許數據科學家為企業(yè)定制需求的軟件工具。
大規(guī)模擴展的存儲容量,特別是近實時分析。
快速數據架構
快速數據是可以在近乎實時的情況下處理流傳感器和物聯網數據的架構。該種架構更聚焦于快速更新,會經常性地放開讀取數據的限制,直到有數據被寫入磁盤才會鎖定。無論是通過現有的、典型的柱狀圖、數據庫或從專門設計的Hadoop相關工具,采用這種架構工作的企業(yè)通常適需要對數據進行一些初始的流分析。在這一新生領域中,架構和重點的變化是很常見的:
用于快速更新和初始流數據分析的數據庫軟件。
大幅度提高快速數據存儲的非易失性RAM和固態(tài)硬盤的使用(例如,1TB的主內存和1PB的SSD);
及時的軟件約束,類似于那些舊版實時操作系統。
快速數據架構與大數據架構的融合
快速數據的目的是與大數據架構融合起來。因此,為了將這兩種方式融合起來:
數據在快速響應的快速數據和減少限制的大數據存儲之間是分離的。
該種融合架構允許使用大數據數據庫和分析工具訪問快速數據架構存儲的數據。
這是一個非常簡要的概述,典型的實現和有一系列的選擇。主要的供應商銷售各種各樣的軟件和硬件,以涵蓋所有的大數據架構和絕大部分的快速數據架構,而開源供應商涵蓋大部分相同的軟件領域。因此,快速數據和大數據的實施往往是在成本與速度之間進行的平衡。聰明的買家能夠通過增加有效的架構來獲得競爭優(yōu)勢。
在快速數據領域的小型供應商Redis Labs和GridGain,大型供應商Oracle和SAP都在快速數據以及大數據兩方面發(fā)揮了重要的作用。SAP可能是快速數據工具領域更加合適的供應商。在硬件領域,英特爾對快速數據有濃厚興趣。其他傳統的大數據廠商,如IBM和戴爾在收購EMC的過程中,還沒有來得及發(fā)表就表現得很興奮。在IBM和戴爾兩者中間,EMC賺足了面子和里子,因此未來它在快速數據架構方面可能比IBM更有針對性。
- AI模型的耗電量驚人 下一步是建設太空數據中心?
- 為什么制造商必須協調IT和OT,才能實現智能工業(yè)的成功?
- 打造AI時代先進算力底座,鯤鵬開發(fā)者峰會2025即將開幕
- 金山辦公宣布未來五年戰(zhàn)略:重建海外基地,優(yōu)化WPS Office用戶體驗
- 是德科技攜KAI系列布局AI新時代
- 微軟全球再裁6000人:無關績效,關乎未來
- 華為發(fā)布AI數據湖解決方案,助力企業(yè)加速擁抱AI
- 工信部等七部門聯合發(fā)文!以數智化賦能醫(yī)藥工業(yè)全鏈條轉型升級
- 擎畫算力賦能新藍圖,城市算網專家座談會在京成功舉辦
- 2024年Q4全球服務器收入773億美元同比增91%,非x86占比225億美元同比增262.1%
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。