千文網(wǎng)小編為你整理了多篇相關(guān)的《數(shù)據(jù)挖掘?qū)嵱?xùn)總結(jié)五篇范文(優(yōu)秀范文三篇)》,但愿對(duì)你工作學(xué)習(xí)有幫助,當(dāng)然你在千文網(wǎng)還可以找到更多《數(shù)據(jù)挖掘?qū)嵱?xùn)總結(jié)五篇范文(優(yōu)秀范文三篇)》。
第一篇:數(shù)據(jù)結(jié)構(gòu)實(shí)訓(xùn)報(bào)告
題目:在火車貨場(chǎng)車皮編解場(chǎng),2條軌道連接到2條側(cè)軌道,形成2個(gè)鐵路轉(zhuǎn)軌棧,其中左邊軌道為車皮入口,編號(hào)為A;右邊軌道為出口,編號(hào)為D;2個(gè)鐵路轉(zhuǎn)軌棧分別編號(hào)為C和D如下圖所示。編號(hào)為a, b, c, ┅, n的各車皮依序停放在車皮的入口處,調(diào)度室要安排個(gè)車皮進(jìn)出棧次序,使得在出口處各車皮按照預(yù)先制定的順序依次出站。車皮移動(dòng)時(shí)只能按照從左到右的方向移動(dòng)。 組織與指導(dǎo)老師:
組長(zhǎng):*
成員:***
指導(dǎo)教師:*
完成時(shí)間、地點(diǎn):
時(shí)間:第16周(6月6日~6月10日)
地點(diǎn):南校區(qū)東教學(xué)樓2樓機(jī)房。
一、需求分析
1、問(wèn)題描述
掌握隊(duì)列、棧、樹的結(jié)構(gòu)以及基本操作,熟悉for循環(huán)語(yǔ)句,if條件語(yǔ)句的嵌套,結(jié)構(gòu)體函數(shù)等,從而實(shí)現(xiàn)程序的功能。
例如:
typedef struct Stack
{
Data *data;
Data *end;
}Stack;
……
2、實(shí)現(xiàn)功能
(1) 對(duì)于給定的車皮數(shù)n,以及各車皮的出站順序,編程計(jì)算最優(yōu)調(diào)度方案,使得移動(dòng)車皮的次數(shù)最少。
(2) 數(shù)據(jù)輸入:由文件input.txt給出數(shù)據(jù)。第一行有1個(gè)正整數(shù)n,表示車皮數(shù);接下來(lái)的1行是一個(gè)字符串,表示預(yù)先確定的車皮的出站順序。
(3) 數(shù)據(jù)輸出:將計(jì)算得到的最優(yōu)調(diào)度方案輸出到文件output.txt,文件的第一行使最少移動(dòng)次數(shù)m,接下來(lái)的m行使對(duì)于最優(yōu)方案的m次移動(dòng)。每次移動(dòng)用“cXY”的3個(gè)字符表示,其中c表示車皮編號(hào),X表示其時(shí)棧號(hào),Y表示目標(biāo)棧號(hào)。如果無(wú)法調(diào)度則輸出“No Solution!”
二、概要設(shè)計(jì)
1、抽象數(shù)據(jù)類型
void ReadData ( void )
{
int i;
FILE *fp;
fp = fopen ( "input.txt", "r" );
if ( fp == NULL )
exit ( __COUNTER__ );
fscanf ( fp, "%d", &total );
if ( total
{
fclose ( fp );
exit ( __COUNTER__ );
}
……、
void Show ( Stack a, char *s )
{
char *tmp, *pc;
char *p = (char*)a.data;
pc = tmp = (char*) malloc ( total + 1 );
while ( p
*pc++ = *p++;
*pc = 0;
printf ( "%s%s", tmp, s );
}
……
if ( d == end )
{
if ( min > count )
{
min = count;
strcpy ( res, tmp );
return;
}
}
count++;
if ( A.end >= A.data )
a = *A.end;
else
a = EOD;
……
2、程序中包含功能模塊及模塊間的調(diào)用關(guān)系
各個(gè)基本操作都通過(guò)公有成員函數(shù)實(shí)現(xiàn),然后通過(guò)主程序調(diào)用來(lái)實(shí)現(xiàn)程序的功能。
例如:
void Init ( Stack *a, int len )
{
a->data = (Data*) malloc ( len * sizeof(Data) );
memset ( a->data, 0, len * sizeof(Data) );
a->end = a->data - 1;
}
……
void main ( void )
{
ReadData();
Calc( head );
End();
}
三、調(diào)試分析
完成情況說(shuō)明:
編譯程序的過(guò)程中發(fā)現(xiàn)了許多漏洞,調(diào)試起來(lái)很不方便,經(jīng)過(guò)我和同學(xué)的共同努力,終于有了突破性的進(jìn)展,程序按照預(yù)定的時(shí)間調(diào)試出來(lái)了,雖然當(dāng)中還存在不少的漏洞,但不會(huì)影響程序的正常運(yùn)行。
程序的性能分析:各個(gè)操作都是通過(guò)公有函數(shù)的調(diào)用來(lái)實(shí)現(xiàn)的,其中用到結(jié)構(gòu)體函數(shù),for循環(huán),If語(yǔ)句的嵌套等,通過(guò)測(cè)試可以實(shí)現(xiàn)其預(yù)定的功能。 出現(xiàn)的問(wèn)題及解決方案:
缺失頭文件導(dǎo)致的定義無(wú)效錯(cuò)誤,通過(guò)添加頭文件即可解決問(wèn)題;定義字符類型錯(cuò)誤,使用正確的函數(shù)類型定義即可,for循環(huán)的循環(huán)語(yǔ)句語(yǔ)法使用不當(dāng),導(dǎo)致函數(shù)無(wú)法實(shí)現(xiàn)循環(huán),if條件語(yǔ)句的應(yīng)用還存在問(wèn)題,以上所述的編譯錯(cuò)誤都通過(guò)我很同學(xué)的認(rèn)真分析后糾正了。
四、用戶使用說(shuō)明
了解程序的執(zhí)行過(guò)程,輸入合法的數(shù)值是程序正常運(yùn)行的關(guān)鍵,輸入的數(shù)值和開始需要的字符的長(zhǎng)度要符合
五、心得體會(huì):
通過(guò)多次編寫程序,我總結(jié)出來(lái)一條心得,程序不能寫完才調(diào)試,而是應(yīng)該寫一個(gè)函數(shù)調(diào)試一個(gè)函數(shù),這樣才能縮小調(diào)試的范圍,提高編程的效率,程序編完后在進(jìn)行一次綜合調(diào)試,將不完善的函數(shù)和功能處理好,才能將程序做到最好!而且,很多時(shí)候,一個(gè)大的工程并不是一個(gè)人就能完成,這就要求我們有團(tuán)隊(duì)精神。讓我感受最深的是在我調(diào)試程序的時(shí)候,一個(gè)很細(xì)微的錯(cuò)誤就可能導(dǎo)致程序的出錯(cuò),正所謂的“細(xì)節(jié)決定成敗”,不管是在學(xué)習(xí)中 ,生活中,我們都要有一顆善于發(fā)現(xiàn)問(wèn)題,解決問(wèn)題的新,除此之外,還要有樂于助人的精神。
第二篇:數(shù)據(jù)挖掘?qū)嵱?xùn)總結(jié)
數(shù)據(jù)挖掘?qū)嵱?xùn)總結(jié)
簡(jiǎn)單來(lái)說(shuō),數(shù)據(jù)挖掘是基于“歸納”的思路,從大量的數(shù)據(jù)中(因?yàn)槭腔跉w納的思路,因此數(shù)據(jù)量的大小很大程度上決定了數(shù)據(jù)挖掘結(jié)果的魯棒性)尋找規(guī)律,為決策提供證據(jù)。從這種角度上來(lái)說(shuō),數(shù)據(jù)挖掘可能并不適合進(jìn)行科學(xué)研究,因?yàn)閺谋举|(zhì)上來(lái)說(shuō),數(shù)據(jù)挖掘這個(gè)技術(shù)是不能證明因果的,以一個(gè)最典型的例子來(lái)說(shuō),例如數(shù)據(jù)挖掘技術(shù)可以發(fā)現(xiàn)啤酒銷量和尿布之間的關(guān)系,但是顯然這兩者之間緊密相關(guān)的關(guān)系可能在理論層面并沒有多大的意義。不過(guò),僅以此來(lái)否定數(shù)據(jù)挖掘的意義,顯然就是對(duì)數(shù)據(jù)挖掘這項(xiàng)技術(shù)價(jià)值加大的抹殺,顯然,數(shù)據(jù)挖掘這項(xiàng)技術(shù)從設(shè)計(jì)出現(xiàn)之初,就不是為了指導(dǎo)或支持理論研究的,它的重要意義在于,它在應(yīng)用領(lǐng)域體現(xiàn)出了極大地優(yōu)越性。
現(xiàn)代的商業(yè)社會(huì)中,充斥著大量的信息,如何從這些信息中迅速的定位并找到有價(jià)值的信息顯然可以成為企業(yè)制勝的關(guān)鍵,畢竟在這個(gè)信息過(guò)載的世界里,基于多少信息所做出的決策會(huì)顯著的影響決策的質(zhì)量和科學(xué)性,而數(shù)據(jù)挖掘技術(shù)就使這種歸納決策得到了實(shí)現(xiàn)。數(shù)據(jù)挖掘可以從企業(yè)數(shù)據(jù)倉(cāng)庫(kù)中定位有價(jià)值的、但是并未事先被企業(yè)員工或者高層管理者知道的信息,并對(duì)這些信息進(jìn)行一些基本的分析(例如聚類、回歸等)。從目前的應(yīng)用來(lái)看,將數(shù)據(jù)挖掘技術(shù)應(yīng)用在營(yíng)銷或企業(yè)決策方面,管理者遵循的邏輯是“消費(fèi)者過(guò)去的行為會(huì)極大的影響甚至決定未來(lái)所做出的選擇”,而過(guò)往真實(shí)的數(shù)據(jù)顯然就是對(duì)消費(fèi)者行為最真實(shí)的記錄,從中挖掘出的規(guī)律對(duì)于企業(yè)決策自然是至關(guān)重要的。
一項(xiàng)好的技術(shù)并不一定要面面俱到,就像數(shù)據(jù)挖掘一樣,目前來(lái)說(shuō),這項(xiàng)技術(shù)在理論研究中應(yīng)用可能并不合適,但是用于實(shí)際決策或者企業(yè)營(yíng)銷的過(guò)程中,顯然可以令過(guò)往數(shù)據(jù)完備的企業(yè)獲益匪淺
下面是個(gè)人對(duì)數(shù)據(jù)挖掘技術(shù)的認(rèn)識(shí),和大家討論一下:
1、數(shù)據(jù)挖掘是種知識(shí)發(fā)現(xiàn),是種foresight(預(yù)見性)。它不同于數(shù)據(jù)分析的就是它從大量的數(shù)據(jù)中找到信息,信息中發(fā)掘出知識(shí),拿這個(gè)知識(shí)來(lái)指導(dǎo)實(shí)踐。而數(shù)據(jù)分析就是insight,找到這種現(xiàn)象的原因。
2、數(shù)據(jù)挖掘是一個(gè)過(guò)程,需要有反饋,驗(yàn)證,循環(huán)往復(fù)。不要期望很快就能得到一個(gè)好的模型或結(jié)論;不要期望一下找到最優(yōu)。
3、數(shù)據(jù)挖掘是任務(wù)驅(qū)動(dòng)的,不合適由研發(fā)來(lái)推動(dòng)。商業(yè)數(shù)據(jù)挖掘應(yīng)該由市場(chǎng)或銷售來(lái)發(fā)起,他們會(huì)發(fā)現(xiàn)一些最根本的問(wèn)題,而這些問(wèn)題往往是用“提高”或“改善”這樣的語(yǔ)言來(lái)描述的。并且他們能提供一些經(jīng)驗(yàn),有效幫助研發(fā)來(lái)明確關(guān)鍵的特征,需要特別關(guān)注反饋的特征。描述問(wèn)題,準(zhǔn)備數(shù)據(jù)是數(shù)據(jù)挖掘的關(guān)鍵。
4、常用的數(shù)據(jù)挖掘方法就這么幾類,模型雖然有好有壞,但是原理是一樣的。建議用通用的工具,最基本的方法先對(duì)數(shù)據(jù)進(jìn)行一下分析,看看哪類模型是最適合的。常用的方法是聚類(K-means),分類(決策樹),關(guān)聯(lián)分析(Apriori)。常用的工具SPSS,Minitab,SAS.
如果你要成為一名研發(fā)人員,為了數(shù)據(jù)挖掘而數(shù)據(jù)挖掘是不合適的,為了測(cè)試某個(gè)模型而去用某個(gè)模型也是不合適的,一拿到任務(wù)就定制算法更是不合適的。分析要實(shí)現(xiàn)什么,能實(shí)現(xiàn)什么需要廣泛收集大家的意見,特別是做決策的。我們要比決策者更關(guān)注得到結(jié)論的過(guò)程,并要想方設(shè)法努力展現(xiàn)。
第三篇:數(shù)據(jù)挖掘
第4章 無(wú)監(jiān)督學(xué)習(xí)
4.1基本概念
圖4.1數(shù)據(jù)點(diǎn)的三個(gè)自然
4.2k-均值聚類
4.2.1k-均值算法
圖4.2k-均值算法
計(jì)算機(jī)組成原理(第三版)
圖4.3k-均值算法的運(yùn)行實(shí)例
4.2.2k-均值算法的硬盤版本
圖4.4一個(gè)簡(jiǎn)單的k-均值算法硬盤版本
計(jì)算機(jī)組成原理(第三版)
3 4.2.3優(yōu)勢(shì)和劣勢(shì)
圖4.5存在和不存在異常值情況下的聚類
圖4.6不理想的初始種子(聚類中心)
圖4.7理想的初始種子(聚類中心) 4
計(jì)算機(jī)組成原理(第三版)
圖4.8自然(不規(guī)則)聚類和k-均值聚類
4.3聚類的表示
4.3.1聚類的一般表示方法
圖4.9聚類的規(guī)則描述
4.3.2任意形狀的聚類
圖4.10兩個(gè)自然聚類以及
計(jì)算機(jī)組成原理(第三版)
5 4.4層次聚類
圖4.11層次聚類的一個(gè)例子
圖4.12合并層次聚類算法
圖4.13合并層次聚類算法的工作
4.4.1單鏈接方法
圖4.14單鏈接方法的連鎖反應(yīng)
計(jì)算機(jī)組成原理(第三版) 4.4.2全鏈接方法
圖4.15采用全鏈接方法聚類
4.4.3平均鏈接方法 4.4.4優(yōu)勢(shì)和劣勢(shì)
4.5距離函數(shù)
4.5.1數(shù)值的屬性(Numeric Attributes) 4.5.2布爾屬性和符號(hào)屬性(Binary and Nominal Attributes)
圖4.16兩個(gè)只具有布爾屬性數(shù)據(jù)點(diǎn)的混合矩陣
計(jì)算機(jī)組成原理(第三版)
7 4.5.3文本文檔
4.6數(shù)據(jù)標(biāo)準(zhǔn)化 4.7混合屬性的處理 4.8采用哪種聚類算法 4.9聚類的評(píng)估
圖4.17帶有熵和純度值的混合矩陣
計(jì)算機(jī)組成原理(第三版) 4.10發(fā)現(xiàn)數(shù)據(jù)區(qū)域和數(shù)據(jù)空洞
圖4.18用決策樹來(lái)區(qū)分?jǐn)?shù)據(jù)區(qū)域和空洞區(qū)域