數據挖掘技術的應用
文章推薦指數: 80 %
EHTINK大數據提供本文 http://www.ethinkbi.com 轉載請註明作者 謝謝
閱讀更多行業好文請關註:ETHINK數據智能分析平台
近年來,數據挖掘技術得到了飛躍式發展,其應用領域也涉及到商業零售、電信數據分析、金融數據分析、生物醫學分析、教育管理分析等多個領域。
隨著各行各業信息化建設的不斷完善,大量的信息數據為數據挖掘技術的應用提供了基礎和保障。
本文將以教學為例,利用數據挖掘技術對學生學習成績進行深入分析。
1 數據挖掘在教育教學中應用的可行性分析
數據驅動學校,分析變革教育的大數據時代已經帶來,利用數據挖掘技術對教育領域的相關數據進行分析,探索教育變量之間的關係,為教育教學的科學決策提供有力支撐,已經成為教育發展的趨勢之一。
大數據時代的到來,將掀起人類教與學的又一次變革。
對此,美國國家教育部於2012
年就已經發布了《通過教育數據挖掘和學習分析促進教與學》的報告。
報告中,列舉了大數據教育應用的案例、領域、應用中所面臨的困難以及應採取的態度和對策等。
計算機技術和網際網路技術在我國起步較晚,但發展迅速,尤其是近幾年「網際網路+」時代的到來,極大的促進了各行各業的發展。
網際網路的發展同樣會促進學校信息化的建設,加強教育教學領域的大數據研究和應用分析,具有重要的實踐意義。
教育學者在信息技術和網絡技術的影響下,逐漸加大了對數據挖掘技術的研究力度,通過一系列研究,就「國家和地方應在技術層面、管理體制、法律制度上加大對大數據研究和應用力度,按照發展現狀及未來規劃,整合現有資源,發揮後勁優勢,真正推動我國教育教學工作的改革進程。
大數據給各個行業的發展帶來的變革和挑戰是前所未有的,就教育行業而言,教師的教學行為、學生的學習活動、教學管理工作、科學研究等數據都能為學校領導者制定決策提供依據,數據挖掘技術在教育教學領域具有廣泛應用價值。
2 數據挖掘技術對學生成績的分析
在教學領域,學習分析是其中最為重要的組成部分。
學習分析就是收集與學習者有關的信息數據,然後構建數據模型,從中發現數據中隱含的規律;還可利用該技術對學習者的行為表現進行分析,根據學生表現制定合適的學習計劃,提高學生的學習效率;總之,學習分析是涉及到社會學、心理學、計算機科學和信息技術等多種學科的一種理論方法,是利用海量數據的收集、分析、處理,發現影響學習者學校結果的因素,評價學生學習情況,根據分析反饋結果,對教學內容、教學計劃和教學方式進行調整和改進,以此推進教學和學習的整體效率。
3 數據挖掘技術應用過程
3.1數據選取
數據是數據挖掘的基礎,也是整個數據挖掘流程中耗費時間和精力最多的環節,大概占整個數據挖掘項目的60%-80%。
在這一環節中,若數據類型沒有完成轉換,則數據類型與模型中的算法匹配度就會受到影響;數據中存在的噪聲過多或不完整度過高,就會影響模型的準確性,由此可見,數據選取工作具有十分重要的地位,應對其引起足夠的重視。
數據質量越高,越有利於實現挖掘目標,分析出來後所得出的規律結論更可靠。
3.2數據挖掘過程
學生成績數據可通過學校教學平台獲取,其挖掘過程如下:
a數據準備階段。
首先,先數據導入操作,選擇類型為Excel 表格後,執行查詢操作。
然後,對數據進行清理。
將原始數據中異常數據、噪聲數據或不合理數據進行清除;對不完整數據進行欄位補償,待數據符合數據挖掘要求後,將其導入資料庫。
最後,數據轉換。
將以百分制記錄的原始數據分為1-10 個檔次的成績備用。
b數據挖掘階段。
本文選擇決策樹為算法,對學生成績進行數據挖掘。
首先定義成績欄位及其含義。
本文以《C 語言程序設計》、《Java 應用》、《計算機網絡》和《作業系統》四門課程學生成績為研究對象,根據研究目的構建決策樹,對目標數據進行計算,然後將處理結果通過轉化形成可視化知識。
c數據可視化呈現及解釋。
將分析結果進行轉化後,形成如下關係圖。
以上四門課程中,《C 語言程序設計》成績較好時,《作業系統》對《計算機網絡》的影響較大;而《C 語言程序設計》學習成績一般時(90 分以下),《Java 應用》對《計算機網絡》的影響較大。
針對以上分析結果,可對教學管理提出如下建議:《C 語言程序設計》這門課程較為重要,應該適當增加課時,儘量保證每周可開設六個學時,而且要確保每周都有實踐課,提高學生動手操作的能力;《作業系統》這門課對其他課程的影響不大,可相應減少課時;網站開發是以《Java
應用》課程為基礎的,而且該學科也是學習其他程式語言的基礎,應該適當增加總課時數和實踐活動;《C語言程序設計》與《Java 應用》課程可以結合在一起上,學完《C 語言程序設計》課程後就可繼續學習《Java 應用》,不需等到下一新學期再上。