千文網(wǎng)小編為你整理了多篇相關(guān)的《數(shù)據(jù)挖掘?qū)嵱?xùn)總結(jié)五篇范文(優(yōu)秀范文三篇)》,但愿對你工作學(xué)習(xí)有幫助,當然你在千文網(wǎng)還可以找到更多《數(shù)據(jù)挖掘?qū)嵱?xùn)總結(jié)五篇范文(優(yōu)秀范文三篇)》。
第一篇:數(shù)據(jù)結(jié)構(gòu)實訓(xùn)報告
題目:在火車貨場車皮編解場,2條軌道連接到2條側(cè)軌道,形成2個鐵路轉(zhuǎn)軌棧,其中左邊軌道為車皮入口,編號為A;右邊軌道為出口,編號為D;2個鐵路轉(zhuǎn)軌棧分別編號為C和D如下圖所示。編號為a, b, c, ┅, n的各車皮依序停放在車皮的入口處,調(diào)度室要安排個車皮進出棧次序,使得在出口處各車皮按照預(yù)先制定的順序依次出站。車皮移動時只能按照從左到右的方向移動。 組織與指導(dǎo)老師:
組長:*
成員:***
指導(dǎo)教師:*
完成時間、地點:
時間:第16周(6月6日~6月10日)
地點:南校區(qū)東教學(xué)樓2樓機房。
一、需求分析
1、問題描述
掌握隊列、棧、樹的結(jié)構(gòu)以及基本操作,熟悉for循環(huán)語句,if條件語句的嵌套,結(jié)構(gòu)體函數(shù)等,從而實現(xiàn)程序的功能。
例如:
typedef struct Stack
{
Data *data;
Data *end;
}Stack;
……
2、實現(xiàn)功能
(1) 對于給定的車皮數(shù)n,以及各車皮的出站順序,編程計算最優(yōu)調(diào)度方案,使得移動車皮的次數(shù)最少。
(2) 數(shù)據(jù)輸入:由文件input.txt給出數(shù)據(jù)。第一行有1個正整數(shù)n,表示車皮數(shù);接下來的1行是一個字符串,表示預(yù)先確定的車皮的出站順序。
(3) 數(shù)據(jù)輸出:將計算得到的最優(yōu)調(diào)度方案輸出到文件output.txt,文件的第一行使最少移動次數(shù)m,接下來的m行使對于最優(yōu)方案的m次移動。每次移動用“cXY”的3個字符表示,其中c表示車皮編號,X表示其時棧號,Y表示目標棧號。如果無法調(diào)度則輸出“No Solution!”
二、概要設(shè)計
1、抽象數(shù)據(jù)類型
void ReadData ( void )
{
int i;
FILE *fp;
fp = fopen ( "input.txt", "r" );
if ( fp == NULL )
exit ( __COUNTER__ );
fscanf ( fp, "%d", &total );
if ( total
{
fclose ( fp );
exit ( __COUNTER__ );
}
……、
void Show ( Stack a, char *s )
{
char *tmp, *pc;
char *p = (char*)a.data;
pc = tmp = (char*) malloc ( total + 1 );
while ( p
*pc++ = *p++;
*pc = 0;
printf ( "%s%s", tmp, s );
}
……
if ( d == end )
{
if ( min > count )
{
min = count;
strcpy ( res, tmp );
return;
}
}
count++;
if ( A.end >= A.data )
a = *A.end;
else
a = EOD;
……
2、程序中包含功能模塊及模塊間的調(diào)用關(guān)系
各個基本操作都通過公有成員函數(shù)實現(xiàn),然后通過主程序調(diào)用來實現(xiàn)程序的功能。
例如:
void Init ( Stack *a, int len )
{
a->data = (Data*) malloc ( len * sizeof(Data) );
memset ( a->data, 0, len * sizeof(Data) );
a->end = a->data - 1;
}
……
void main ( void )
{
ReadData();
Calc( head );
End();
}
三、調(diào)試分析
完成情況說明:
編譯程序的過程中發(fā)現(xiàn)了許多漏洞,調(diào)試起來很不方便,經(jīng)過我和同學(xué)的共同努力,終于有了突破性的進展,程序按照預(yù)定的時間調(diào)試出來了,雖然當中還存在不少的漏洞,但不會影響程序的正常運行。
程序的性能分析:各個操作都是通過公有函數(shù)的調(diào)用來實現(xiàn)的,其中用到結(jié)構(gòu)體函數(shù),for循環(huán),If語句的嵌套等,通過測試可以實現(xiàn)其預(yù)定的功能。 出現(xiàn)的問題及解決方案:
缺失頭文件導(dǎo)致的定義無效錯誤,通過添加頭文件即可解決問題;定義字符類型錯誤,使用正確的函數(shù)類型定義即可,for循環(huán)的循環(huán)語句語法使用不當,導(dǎo)致函數(shù)無法實現(xiàn)循環(huán),if條件語句的應(yīng)用還存在問題,以上所述的編譯錯誤都通過我很同學(xué)的認真分析后糾正了。
四、用戶使用說明
了解程序的執(zhí)行過程,輸入合法的數(shù)值是程序正常運行的關(guān)鍵,輸入的數(shù)值和開始需要的字符的長度要符合
五、心得體會:
通過多次編寫程序,我總結(jié)出來一條心得,程序不能寫完才調(diào)試,而是應(yīng)該寫一個函數(shù)調(diào)試一個函數(shù),這樣才能縮小調(diào)試的范圍,提高編程的效率,程序編完后在進行一次綜合調(diào)試,將不完善的函數(shù)和功能處理好,才能將程序做到最好!而且,很多時候,一個大的工程并不是一個人就能完成,這就要求我們有團隊精神。讓我感受最深的是在我調(diào)試程序的時候,一個很細微的錯誤就可能導(dǎo)致程序的出錯,正所謂的“細節(jié)決定成敗”,不管是在學(xué)習(xí)中 ,生活中,我們都要有一顆善于發(fā)現(xiàn)問題,解決問題的新,除此之外,還要有樂于助人的精神。
第二篇:數(shù)據(jù)挖掘?qū)嵱?xùn)總結(jié)
數(shù)據(jù)挖掘?qū)嵱?xùn)總結(jié)
簡單來說,數(shù)據(jù)挖掘是基于“歸納”的思路,從大量的數(shù)據(jù)中(因為是基于歸納的思路,因此數(shù)據(jù)量的大小很大程度上決定了數(shù)據(jù)挖掘結(jié)果的魯棒性)尋找規(guī)律,為決策提供證據(jù)。從這種角度上來說,數(shù)據(jù)挖掘可能并不適合進行科學(xué)研究,因為從本質(zhì)上來說,數(shù)據(jù)挖掘這個技術(shù)是不能證明因果的,以一個最典型的例子來說,例如數(shù)據(jù)挖掘技術(shù)可以發(fā)現(xiàn)啤酒銷量和尿布之間的關(guān)系,但是顯然這兩者之間緊密相關(guān)的關(guān)系可能在理論層面并沒有多大的意義。不過,僅以此來否定數(shù)據(jù)挖掘的意義,顯然就是對數(shù)據(jù)挖掘這項技術(shù)價值加大的抹殺,顯然,數(shù)據(jù)挖掘這項技術(shù)從設(shè)計出現(xiàn)之初,就不是為了指導(dǎo)或支持理論研究的,它的重要意義在于,它在應(yīng)用領(lǐng)域體現(xiàn)出了極大地優(yōu)越性。
現(xiàn)代的商業(yè)社會中,充斥著大量的信息,如何從這些信息中迅速的定位并找到有價值的信息顯然可以成為企業(yè)制勝的關(guān)鍵,畢竟在這個信息過載的世界里,基于多少信息所做出的決策會顯著的影響決策的質(zhì)量和科學(xué)性,而數(shù)據(jù)挖掘技術(shù)就使這種歸納決策得到了實現(xiàn)。數(shù)據(jù)挖掘可以從企業(yè)數(shù)據(jù)倉庫中定位有價值的、但是并未事先被企業(yè)員工或者高層管理者知道的信息,并對這些信息進行一些基本的分析(例如聚類、回歸等)。從目前的應(yīng)用來看,將數(shù)據(jù)挖掘技術(shù)應(yīng)用在營銷或企業(yè)決策方面,管理者遵循的邏輯是“消費者過去的行為會極大的影響甚至決定未來所做出的選擇”,而過往真實的數(shù)據(jù)顯然就是對消費者行為最真實的記錄,從中挖掘出的規(guī)律對于企業(yè)決策自然是至關(guān)重要的。
一項好的技術(shù)并不一定要面面俱到,就像數(shù)據(jù)挖掘一樣,目前來說,這項技術(shù)在理論研究中應(yīng)用可能并不合適,但是用于實際決策或者企業(yè)營銷的過程中,顯然可以令過往數(shù)據(jù)完備的企業(yè)獲益匪淺
下面是個人對數(shù)據(jù)挖掘技術(shù)的認識,和大家討論一下:
1、數(shù)據(jù)挖掘是種知識發(fā)現(xiàn),是種foresight(預(yù)見性)。它不同于數(shù)據(jù)分析的就是它從大量的數(shù)據(jù)中找到信息,信息中發(fā)掘出知識,拿這個知識來指導(dǎo)實踐。而數(shù)據(jù)分析就是insight,找到這種現(xiàn)象的原因。
2、數(shù)據(jù)挖掘是一個過程,需要有反饋,驗證,循環(huán)往復(fù)。不要期望很快就能得到一個好的模型或結(jié)論;不要期望一下找到最優(yōu)。
3、數(shù)據(jù)挖掘是任務(wù)驅(qū)動的,不合適由研發(fā)來推動。商業(yè)數(shù)據(jù)挖掘應(yīng)該由市場或銷售來發(fā)起,他們會發(fā)現(xiàn)一些最根本的問題,而這些問題往往是用“提高”或“改善”這樣的語言來描述的。并且他們能提供一些經(jīng)驗,有效幫助研發(fā)來明確關(guān)鍵的特征,需要特別關(guān)注反饋的特征。描述問題,準備數(shù)據(jù)是數(shù)據(jù)挖掘的關(guān)鍵。
4、常用的數(shù)據(jù)挖掘方法就這么幾類,模型雖然有好有壞,但是原理是一樣的。建議用通用的工具,最基本的方法先對數(shù)據(jù)進行一下分析,看看哪類模型是最適合的。常用的方法是聚類(K-means),分類(決策樹),關(guān)聯(lián)分析(Apriori)。常用的工具SPSS,Minitab,SAS.
如果你要成為一名研發(fā)人員,為了數(shù)據(jù)挖掘而數(shù)據(jù)挖掘是不合適的,為了測試某個模型而去用某個模型也是不合適的,一拿到任務(wù)就定制算法更是不合適的。分析要實現(xiàn)什么,能實現(xiàn)什么需要廣泛收集大家的意見,特別是做決策的。我們要比決策者更關(guān)注得到結(jié)論的過程,并要想方設(shè)法努力展現(xiàn)。
第三篇:數(shù)據(jù)挖掘
第4章 無監(jiān)督學(xué)習(xí)
4.1基本概念
圖4.1數(shù)據(jù)點的三個自然
4.2k-均值聚類
4.2.1k-均值算法
圖4.2k-均值算法
計算機組成原理(第三版)
圖4.3k-均值算法的運行實例
4.2.2k-均值算法的硬盤版本
圖4.4一個簡單的k-均值算法硬盤版本
計算機組成原理(第三版)
3 4.2.3優(yōu)勢和劣勢
圖4.5存在和不存在異常值情況下的聚類
圖4.6不理想的初始種子(聚類中心)
圖4.7理想的初始種子(聚類中心) 4
計算機組成原理(第三版)
圖4.8自然(不規(guī)則)聚類和k-均值聚類
4.3聚類的表示
4.3.1聚類的一般表示方法
圖4.9聚類的規(guī)則描述
4.3.2任意形狀的聚類
圖4.10兩個自然聚類以及
計算機組成原理(第三版)
5 4.4層次聚類
圖4.11層次聚類的一個例子
圖4.12合并層次聚類算法
圖4.13合并層次聚類算法的工作
4.4.1單鏈接方法
圖4.14單鏈接方法的連鎖反應(yīng)
計算機組成原理(第三版) 4.4.2全鏈接方法
圖4.15采用全鏈接方法聚類
4.4.3平均鏈接方法 4.4.4優(yōu)勢和劣勢
4.5距離函數(shù)
4.5.1數(shù)值的屬性(Numeric Attributes) 4.5.2布爾屬性和符號屬性(Binary and Nominal Attributes)
圖4.16兩個只具有布爾屬性數(shù)據(jù)點的混合矩陣
計算機組成原理(第三版)
7 4.5.3文本文檔
4.6數(shù)據(jù)標準化 4.7混合屬性的處理 4.8采用哪種聚類算法 4.9聚類的評估
圖4.17帶有熵和純度值的混合矩陣
計算機組成原理(第三版) 4.10發(fā)現(xiàn)數(shù)據(jù)區(qū)域和數(shù)據(jù)空洞
圖4.18用決策樹來區(qū)分數(shù)據(jù)區(qū)域和空洞區(qū)域