雖然目前大數據的細分崗位比較多,但是主要集中在五個方面,分別是底層平臺研發(fā)、大數據應用開發(fā)、大數據分析、大數據運維和大數據教育。價值探討3、現在和未來4、大數據隱私二、大數據技術1、云計算2、分布式處理平臺(Hadoop)3、存儲技術4、感知技術三、實踐1、互聯網的大數據2、政府的大數據3、企業(yè)的大數據4、個人的大數據大數據的核心就是預測。
1、大數據是不是科學,為什么?
先說觀點,大數據是科學。這個問題其實挺難回答,因為涉及到兩個比較難于理解的概念:“大數據”和“科學”,科學是正確反映世界本質與規(guī)律的理論,不可證偽。大數據理論被數據科學家維克托·邁爾-舍恩伯格2008年在《大數據時代》中提出,大數據指是指無法用常規(guī)工具進行處理、需對所有數據進行分析處理的數據學科。如果要系統(tǒng)的認知大數據,就必須從三個層面來著手來分析他,具體的大家可以找相關的書籍來看:一、大數據理論1、大數據特征:具有5V特點Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性),
大數據包括結構化、半結構化和非結構化數據,非結構化數據越來越成為數據的主要部分。2、價值探討3、現在和未來4、大數據隱私二、大數據技術1、云計算2、分布式處理平臺(Hadoop)3、存儲技術4、感知技術三、實踐1、互聯網的大數據2、政府的大數據3、企業(yè)的大數據4、個人的大數據大數據的核心就是預測,大數據將為人類的生活創(chuàng)造前所未有的可量化的維度。
2、學習大數據必須要學SQL嗎?為什么?
雖然目前大數據的細分崗位比較多,但是主要集中在五個方面,分別是底層平臺研發(fā)、大數據應用開發(fā)、大數據分析、大數據運維和大數據教育,除了底層平臺研發(fā)往往需要中高端人才以外,其他崗位的知識結構并沒有太多的基礎性要求,下面對這幾大方面的知識結構做一個具體的介紹。大數據應用開發(fā)崗位需要的知識結構包括大數據平臺體系結構、編程語言、數據庫(NoSQL)、算法設計等內容,可見在大數據應用開發(fā)崗位需要掌握SQL,NoSQL的意思是NotonlySQL(不僅僅是SQL),不是說不需要SQL,
對于應用程序開發(fā)人員來說,掌握SQL是基本的要求。大數據分析崗位的知識結構包括大數據平臺體系結構、編程語言、數據庫、算法設計、算法實現、數據呈現等內容,大數據分析注重算法的設計與實現,而數據呈現則往往需要通過SQL語言完成數據的提?。˙I),所以對于大數據分析人員來說是必須掌握SQL語言的,而且需要對SQL語言非常熟悉,
大數據運維的知識結構包括大數據平臺的搭建、組件部署、編程語言、平臺維護、網絡維護等內容,對于運維人員來說掌握SQL語言也是一個基本的要求,因為大部分運維工作都需要對數據進行操作,通過Shell(Python)來編寫運維腳本是一個比較常見的做法。大數據教育則是為大數據行業(yè)提供人才培養(yǎng)的服務,大數據教育更是涉及到以上各個崗位的知識結構,當然需要掌握SQL語言了,
總之,目前大部分大數據崗位都是需要具備SQL基礎的,所以在學習大數據之前往往都先學習一下SQL和編程語言(Java、Python、Scala、R等)。大數據是我的主要研究方向之一,目前也在帶大數據方向的研究生,我會陸續(xù)在頭條寫一些關于大數據方面的文章,感興趣的朋友可以關注我,相信一定會有所收獲,如果有大數據方面的問題,也可以咨詢我,謝謝!。
3、數據科學與大數據技術,簡稱“大數據”,這個專業(yè)好不好?
回答:熱門而火爆的新興專業(yè),1.數據科學與大數據技術,簡稱“大數據”,是計算機、人工智能等多學科相互交叉的專業(yè)。2.大數據專業(yè),主要培養(yǎng)通過大數據思維,對大數據進行開發(fā)運用的高層次人才,畢業(yè)后,主要去向為政府、企業(yè)、公司,具體行業(yè)為保險、電子商務、銀行、金融、醫(yī)藥、互聯網等,3.自中科院首開“大數據技術與應用”專業(yè)以來,截止目前,全國有近300所大學開設了大數據專業(yè),可見該專業(yè)的熱門程度。