大數據的特征是大量性(規模超大、不斷攀升)、高速性(高速產生、處理高效)、多樣性(種類多樣、來源多樣)、低密性(有用數據提純)。海量數據給常規技術(獲取存儲管理、處理傳遞共享、關聯聚類分析)帶來了眾多挑戰——雖然數據很多,但是有用的數據只有34%,好用的數據僅有7%,被分析的數據更是少到只有1%。如何在海量的數據中提取出有價值的信息需要多學科多技術的研究。當前的特點是大數據、小模型、小定律交叉,即使是同一類問題,每個系統也都不一樣,所以模型和程序要針對數據設計。結構化數據通過數據庫或者數據倉庫解決,半結構化數據使用網頁和搜索引擎等技術解決,非結構化數據使用深度學習、網絡交互和群體智能解決。
干警在實戰使用中,最主要的操作應用是查詢車牌信息和其他過車記錄以便掌握線索。面對動輒幾十億、上百億甚至千億級別的海量過車數據的存儲和查詢壓力,如何進行可靠存儲和高效應用?傳統的普通關系型數據庫解決方案和技術手段存在檢索難、并發難、挖掘難、擴容難、應用難等一系列問題,速度慢、準確性差,需要投入大量的精力和資源進行技術升級改造。因此,及時準確獲取各類相關數據并構建大數據處理模型是建設平安城市大數據中心的前提,而這一難題目前正逐步通過先進的大數據技術進行解決。
以天地偉業推出的Easy7大數據分析檢索系統為例,該系統立足平安城市系統建設應用,結合智慧城市系統規劃需求,支持在海量大數據信息中快速檢索和研判分析。該系統可全面接入公安自建監控網、社會面監控資源以及主流廠家的交通卡口和電警設備,將采集到的數據以結構化語義存儲。系統采用基于大規模集群分布式并行運算存儲的Hadoop作為底層數據分析存儲框架,在工作調度、負載平衡、容錯容災、設備運維等方面進行了深度整合,保證了大數據訪問的可靠性、安全性和高性能,徹底消除了傳統存儲系統的瓶頸,可以滿足高帶寬和高并發的海量數據存取需求。系統將音視頻信息和用戶業務產生的結構化數據構建成圖像資源特征庫,使用Hbase進行分布式存儲,解決了傳統關系型數據庫在超大規模和高度并發方面的限制,為百億級別的數據量提供秒級訪問性能,并針對各行業對業務數據的實際需求應用,構建了多樣化的數學分析模型,提供了直觀的圖形化數據結果展現。
該系統提供的功能包括:
(1)分類檢索:按照行人、三輪車、汽車分類檢索,點擊結果可播放相應圖片或者對應片段的視頻。
(2)大數據全文檢索:支持精確車牌查詢、模糊車牌查詢、路口過車查詢、區域過車查詢、車輛類型查詢、車輛品牌查詢、無牌車查詢、車身顏色查詢,還支持多種條件組合查詢,可在秒級提供檢索結果。例如在一個月內的過車記錄中對車牌號碼進行模糊查詢,可在2秒返回結果。
(3)車輛研判分析:為車輛信息深度研判系統提供應用計算的加速作用,在車輛多點碰撞、初次入城分析、跟車策略分析、出入案發現場車輛分析、伴隨車輛分析、車輛頻次分析、連續違法分析、落腳點分析、頻繁入城分析、頻繁夜出分析、棄置車輛分析、區域徘徊分析、疑似假牌、晝伏夜出分析、嫌疑套牌等技戰法策略中可以大幅提升運算效率。系統基本可在10秒內提供檢索結果。
車輛大數據分析檢索系統是針對數據快速增長的云存儲、云計算、大數據等多種綜合技術集合,不僅能夠輕松處理海量的音視頻等結構化數據,還能結合車輛信息深度研判系統發掘視頻圖片及數據中的關聯情況,為業務處理和決策分析提供有力支持。
相關鏈接
http://www.ykfengda.cn/ask/63.html
http://www.ykfengda.cn/ask/61.html
http://www.ykfengda.cn/ask/38.html