大數(shù)據(jù)分析網(wǎng)絡暢銷書與網(wǎng)絡流行語的相關性
2019-03-19 11:31:53 來源:本站原創(chuàng) 瀏覽:388次網(wǎng)絡流行語是近幾年伴隨網(wǎng)絡出現(xiàn)的一種簡潔、具有一定的創(chuàng)造性的語言,具有短時間內擴散開的特點。所以網(wǎng)絡流行語也逐漸成為一種網(wǎng)絡文化,并且能夠逐漸應用開來。在網(wǎng)絡暢銷書方面,通過網(wǎng)絡的暢銷書也是傳播大量數(shù)據(jù)及信息的重要途徑,流行語和暢銷書在某些方面的傳播有可能會有相似的地方,所以,根據(jù)大數(shù)據(jù)來分析網(wǎng)絡暢銷書與網(wǎng)絡流行語是否有其相關性也是當前畢業(yè)設計研究的一個重點分析對象,本課題主要是一種操作和研究的技能鍛煉,能夠針對以下幾點進行研究。系統(tǒng)主要是后端的服務端的數(shù)據(jù)分析,mysql數(shù)據(jù)的數(shù)據(jù)存儲以及在windows端下的可視化編程的數(shù)據(jù)分析結果展示,該系統(tǒng)部署安裝在linux操作系統(tǒng)下,linux可以安裝在windows操作系統(tǒng)的虛擬機下進行操作,并且將網(wǎng)絡建立成內網(wǎng),在windows下利用jsp網(wǎng)頁的技術進行數(shù)據(jù)分析結果的展示,使用操作方便,具有一定的用戶體驗。本系統(tǒng)主要處理以下工作和研究:
1.收集網(wǎng)絡暢銷書與網(wǎng)絡流行語的數(shù)據(jù)
2.通過搭建hadoop服務集群,對數(shù)據(jù)進行整理、過濾,存儲到hive中,對數(shù)據(jù)進行分析處理,完成可視化編程并顯示數(shù)據(jù)。
3.按照特定的算法進行分析處理
針對大數(shù)據(jù)研究過程中的操作和分析,可能存在的問題:收集數(shù)據(jù)會有一定的困難,對數(shù)據(jù)進行分析處理可能也會由于專業(yè)知識不足而有一些困難。